logo821.gif (10572 bytes) 首頁          新增資料與公告

最新消息:

荷蘭環控系統在中國

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
授課資料
人文關懷
無官御史台
智能生物產業
蘭花產業
蘭界感言篇
活動公告區
Orchids Cultivation

 

 

AFST期刊對於論文稿件中實驗設計與統計標準之建議

 

中興大學 生物系統工程研究室  陳加忠

 
 

近年來,統計技術越來越受重視。在醫學的期刊,有越來越多的的文章介紹如何應用統計技術於醫學研究。在農業領域的學術期刊,也開始重視統計技術應用於農業研究。在AFST(Animal Food Science and Technology)期刊(2006年,1291-11),有篇編輯群所完稿的文章,篇名如下:〝Some experimental design and statistical criteria for analysis of studies in manuscripts submittal for consideration for publication〞。這篇文章內容對於農業科技的研究統計應用有極佳的介紹。

一、               導論(Introduction)

對許多動物與植物科學家而言,要求他們在期刊論文內容具有統計分析,那幾乎是一種邪惡。但是對於量測數據,以一種適當的統計模型進行分析,可以使得實驗的結果解釋得更完全、更準確。相反的,不適當或是不完全的統計設計反而導致不正確與不準確的結論,代表研究的結果解釋錯誤。以研究工作的成本考量,需要所有的研究人員,對於其研究結果要有正確的結論。

此篇文章的目的是由編輯群提供一項指引,以AFST期刊之立場提出說明,論文能夠被期刊接受之實驗設計與統計的要求標準。

二、               統計模式之使用

所謂統計模式代表實際上應用於數據分析之統計技術。一個表格最多只是以矩陣表達一些不同處理下的平均值,有時平均值附有標準差。但是這種表格並未列出統計模式。雖然此種表格列舉方式偶而可能適合,但是少有能力加以判別不同的處理是否有真正的影響力。

數據如果僅以表格呈現而未進行任何統計分析,對於試驗結論並未有助益,如果研究結論是〝A牧草的NDF成份高於牧草B〞,作者必須對於此結論提供統計推論。在試驗過程中必須藉由適當的試驗設計收集足夠的數據,再進行統計分析。另一個例子,如果結論〝A成份的澱粉量高於B,但是與C與D無差異〞。在實驗中需要以相同的程序收集數據,再比較其差異顯著性是否存在。

在進行數據分析時,必須描述所使用的統計模式。例如如果採用A與B兩種處理,每處理各有不同溫度,結果顯示A×B之交互效應並不顯著,不可以在結論說明中忽略此結果,只有說明A因子與B因子是否有顯著影響。

對於統計分析所採用的〝顯著水準〞,或是稱為p值,在材料與方法之章節必須事先說明。例如:〝differences among means with p<0.05 where accepted as representing statistically significant differences〞。如果p值略高於0.05 ,代表可接受。這種情況也需要預先說明〝differences among means with p<0.010 were accepted as representing tendencies to differences〞。有些論文期刊則只是預先以p<0.05為顯著水準,p值表達至少要有三位數,例如p=0.023。如果p值小於0.001,則直接以<0.001表示,不需要列出實際之p值。

進行研究中,數據收集與原先設定的統計模式要能相互一致。不是經由統計檢定的結果論述是無學術價值的。例如以下之描述〝there was a numerical difference between treatment A and B〞是無價值。

三、               試驗單位

對動物學家或是統計學家而言,對於試驗單位的意見往往不一致。例如在一個獸欄內飼養幾隻動物。最小的試驗單位可以為一個獸圈(內有幾隻動物)或是一隻動物。

動物研究者對在同一獸圈內的所有動物視為一個單位。量測數據為此一獸圈所吃掉的飼料。但是如果每隻動物是分別給飼料,那食用的飼料量就是以每一隻動物為單位。

以每隻動物為單位或是以一個獸欄內所有動物為一個單位,取決於試驗之內容。

四、               將〝時間〞納入統計模式

在一個固定時間週期(例如每週一項,每月一次)進行試驗,都應該將時間納入影響參數。包括時間的影響,或是時間與其他因子相互乘積之影響。例如對一飼料之成份減少量,可以以y=a+b Exp(-kt)加以量化描述。而且一些特定參數,例如t1/2,對於試驗結果之比較十分有用。

在不同時間的重複試驗數據,如果沒有考慮時間此因子,則容易引起第二型錯誤(實際上沒有顯著差異,但是統計結果反而顯示有差異)

五、               常態分佈

對於生物性的試驗,都認為數據本身是常態分佈。藉由現代的統計軟體,可以檢定是否為常態分布。如果不是常態分佈,也可以經由轉換,使得數據成為常態分佈。pH量測值可以為常態分佈,但是飼料顆粒大小,就是ㄧ種對數常態分佈(log-normal distribution)

對於非常態分佈之其他分佈,例如Poisson或是Binomial分佈,以GLM(generalized linear models)最為合適。

六、               重覆數據之定義

有兩種重複數據經常被混淆:Laboratory replicates experimental replicatesExperimental replicates 代表對於有問題的試驗材料有其重複次數,Laboratory replicate是樣本的處理過程。例如在一項研究中,自田間收集玉米,分成四部分,每一部分以不同的酵素處理,樣本前處理是貯在5個小樣本盒,在此小樣本盒內樣本加以乾燥並取三份子樣本加以分析成份。在此過程中,經過的5個小樣本盒只是Laboratory replicates,對統計分析無影響。但是如果整批玉米被分成20批小樣本,每5批小樣本以相同酵素處理,共有四種酵素。處理後每批小樣本貯存於小倉之內。每一小盒即是一個重複數目。

七、               實驗設計

1.      Factorial design在生物性研究是一種普遍性之試驗設計,但是需要留意不可超過三因子,否則試驗結果不容易解釋。

2.      Latin squares

Latin squares design 對於處理之比較十分有效。但是每一處理內樣本數目如果不同,試驗結果則難以分析。

八、               檢定力試驗(Power tests)

檢定力試驗是用以決定試驗中所需要的樣本數目。在完成試驗後,要以檢定力試驗重新檢定試驗樣本其數目是否合理。

九、               生物性、實際性與統計性的差異

統計結果顯示有顯著差異。以生物性或實際性考量,此差異性不見得有實際上之意義。

十、               使用的統計軟體

AFST期刊通常被使用的軟體有SASGENSTAT(general statistics)SPSSMinitabMicrosoft Excel。但是在不同條件下,應該使用正確的統計方法。例如試驗設計下每組數據相同,則使用ANOVAGLMMIXED/REML等方法。如果有遺失數據(missing values),或在每一處理內又有重複的動物樣本,建議使用MIXED/REML模式。

十一、對於相同數據使用數種統計方法

例如對於相同之試驗數據,使用ANOVA,GLM,MIXED/REML等方法都得到相同的結果。在投搞稿件一一列舉,對研究結果毫無意義。此在科學稿件應該先避免。