logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

荷蘭與 Maarel Orchids在國際市場上的突破

Westerlay Orchids的碳中和蘭花生產

農企業全面有機化的結局

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區
數據分析與知識產業

 

 
動物研究實驗設計和統計分析指南
 

中興大學 生物系統工程研究室 陳加忠

 
 

資料來源:

Seongwon Seo,1 Seoyoung Jeon,1 and Jong K. Ha2,3,*

Asian-Australas J Anim Sci. 2018 Sep; 31(9): 1381–1386.

Published online 2018 Jul 26. doi: 10.5713/ajas.18.0468

摘要

動物實驗對於動物營養學的研究是必不可少的。由於動物個體之間的巨大差異以及研究倫理和經濟限制,在動物實驗中實驗設計和統計分析尤為重要。為了提高結果的科學有效性和最大限度地從動物實驗中獲得知識,每個實驗都應該設計得當,觀察結果需要正確分析和報告透明。已經具有許多實驗設計和統計方法。本文的目的不是審查和介紹特定的實驗設計和統計方法。相反在設計動物實驗和在動物營養研究進行統計分析時,討論了一些基本要素,並提供了將稿件投稿給《亞洲-澳大利亞動物科學雜誌》時,以供考慮出版的指南。

介紹

出於科學、倫理和經濟原因,涉及動物的實驗應進行適當設計、正確分析和透報告明。這樣增加了研究結果的科學有效性,並最大限度地提高了從每個實驗中獲得的知識。儘管如此,生物學家通常對數學和統計學感到不舒服,他們經常以不恰當的方式進行實驗設計和分析數據[1]。因此,在一些動物實驗為必不可少的研究領域,編輯委員會會定期審查論文報告的統計方法,並提出它們的適用性[2-5] 。一些研究領域已經成立了聯盟(consortia)並為動物實驗提供了指南[6、7] 一些科學期刊為其作者制定了出版指引[8、9 ] 。例如在動物科學領域,Journal of Dairy Science 在作者說明中提供了關於統計方法的詳細指導 [10 ]。 Animal Feed Science and Technology 發表了兩篇社論,討論了適當的實驗設計和統計分析,指導該期刊的投稿作者 [11 , 12 ]。

《亞澳動物科學雜誌》(AJAS)於 1988 年 1 月出版創刊號,在過去的30年裡,對動物科學領域的貢獻和影響不斷擴大。特別是 2017 年,在 AJAS 上共發表了 102 項營養研究,其中包括 84 項體內試驗。在這些研究中,統計方法是必不可少的,作者應努力使用適當的實驗設計和統計分析,為讀者提供科學相關和有效的知識。

這篇社論討論一些實驗設計和統計分析的原則,並在為向 AJAS 投稿營養研究者提供指導以考慮出版。

實驗設計

作者必須在稿件中提供有關實驗設計的詳細資訊,以便審稿人和讀者對如何進行研究有足夠的資訊,並可以評估實驗設計的品質。詳細資訊包括動物特徵(例如,物種、品種、性別、體重)、處理數量、實驗和抽樣單位的數量、處理的安排(例如,因子、轉換)以及對於已知變異的考慮(例如,區塊、共變數)。只有設計得當的實驗才能產生有效和可靠的結果,從而在研究中得出正確和適當的解釋和結論。

實驗單位和複製次數

處理是根據研究的假設為實驗建立的一組環境,在實驗中量測和比較的效果 [13 ]。處理應用於實驗單元,一個實驗單元對應一個重複。 Kuehl [14 ] 將實驗單元定義為“物理實體”或獨立於其他單元的接受處理受試者。複製次數(即樣本大小)是每個處理的實驗單元數日。正確定義實驗單元對於正確的實驗設計和統計分析十分重要。然而,正確定義實驗單元有時並不容易。尤其有在一組動物在一個圍欄中一起餵養的情況,統計學家和生物學家之間對最合適的實驗單位存在爭議[11 ]。

與大多數其他生物統計學家 [14 , 15 ] 一樣,AJAS 的編輯對確定實驗單位維持較為保守的看法。對於許多營養研究,實驗的目的是推斷總體平均值。例如,在一項餵養試驗中,將不同的食物處理應用於不同的動物群體,實驗的最終目標不是只有觀察這些實驗動物內部的處理效果,而是研究其對現實世界中獨立的動物影響。複製的作用是衡量結果的可靠性和可重複性,因此複製是獨立的觀察,實驗單元必須相互獨立。如果在一個圍欄中對一組動物進行處理,則每一個體動物不是相對獨立的。因此,即使單獨進行量測,圍欄也被視為實驗單位。在此情況下的效果混淆了處理效果,顯然圍欄應該是實驗單位,因為不知道實驗結果是否受到的處理造成。另一方面,如果將處理隨機分配給圍欄中的一組動物中的一個個體動物,即使它們在同一個圍欄中,個體動物也可以被視為實驗單元。

需要足夠數量的複製才能從實驗中獲得可靠的結果。因為複製次數與檢定的檢定力相關,所以更多的實驗複製可以提供更大的統計檢定力來檢測處理之間所需的差異。然而在動物實驗中,複製的成本很高,只要足以檢測到差異,最好使用最少的複製次數。為此在開始實驗之前執行檢定力測試,以根據平均值的預期變化和需要檢測的平均值之間的差異大小,來計算確定所需的樣本量。

當處理方法之間沒有觀察到顯著差異時,檢定力檢定也可用於支持實驗的有效性。未能檢測到處理之間有顯著差異這樣並不少見,在這種情況下,有人可以爭辯說,僅僅因為樣本量很小,就沒有觀察到顯著性。檢定力檢定的結果可以提供證據支持性,即未能檢測到處理之間差異的原因不是因為樣本量太小,而是處理平均值之間的差異不足以被認為是顯著的。因此,AJAS 鼓勵作者提供檢定力測試的結果。檢定力測試的結果可用於證明實驗設計得當。

考慮已知變化

為了正確測試處理影響,除主要處理外可能影響動物反應的因素應盡量減少或至少已考慮在內。在這方面,建議使用區塊或共變數。

區塊是一種作業,將實驗單元放入類似單元的群組中,其中基於一個或多個已知或預期會影響的因子被量測和測試反應。物理和生理特徵,例如性別、墊料和初始體重,動物科學領域通常用於的區集。區塊可控制實驗單元的可變性並減少實驗誤差。

共變數是已知或預期與感興趣的反應變數,有相關的變數。區塊和共變數之間的主要區別在於共變數是連續變數,而區塊是分類變數。例如,可以根據動物的體重將動物分為高組、中組和低組。相反個體體重可以用作共變數,以減少統計模型中對實驗誤差的估計。在實驗設計階段應用區塊,而在進行統計分析時應用共變數。

使用區塊和共變數是一種合理且合乎邏輯的方式,用來解釋已知錯誤,並且減少無法解釋的錯誤。因此,如果已知或預期的變數可能對實驗處理中要測試的反應產生顯著影響, AJAS 編輯委員會鼓勵作者使用塊和共變數。

當動物數量有限或需要去除個體動物變異時,通常在動物營養研究中使用交叉(crossorer,changeover)設計。在這種情況下,如果前一段時間給予處理的遺留效應,會影響後續處理的反應,這可能是一個問題。應該注意的是,當預期會有明顯的殘留效應時,應避免交叉設計 [16 ]。即使預計不會產生顯著的殘留效應,交叉設計中也不應忽視潛在的殘留效應。兩個處理期之間需要有足夠的休息或清除時期這是減少殘留效應的實用方法之一。更重要的是,每隻動物的處理順序應該平衡,以避免混淆處理和周期效應,並儘量減少遺留效應的影響。在平衡交叉設計中,每個處理在其他每個處理之後的次數相等。並且每個處理分配給每隻動物一次,並且在每個時期內分配相同的次數。當懷疑有殘留效應時,其顯著性也需要通過統計分析來檢定。 AJAS 編輯委員會建議作者描述用以最小化可能的殘留效應的程序,並表明在使用交叉設計時,殘留效應在他們的研究中並不顯著。

隨機化

隨機化是確保實驗可靠性和統計分析有效性的必要程序。實驗的目的是推斷母群平均值和變異量,統計分析假設觀察結果來自常態分佈母群的隨機樣本。這個假設只有通過隨機化才能有效。在動物營養研究中,需要兩個隨機化過程:實驗單位的隨機抽樣和對實驗動物的隨機分配處理。

從理論上講,實驗動物代表了感興趣的動物母群。因此,它們需要從母群中隨機選擇。然而通常是不可行的。在實際世界中,如果不是不可能的話,實驗動物是否可以被視為隨機樣本是值得懷疑的。然而,只要有可能,在選擇實驗動物時必須進行隨機化,以消除偏差並獲得對實驗誤差變異量的有效估計值。例如,當對選定的動物進行深入分析時(例如在每次處理中,由一組動物中選定的動物對其進行血液分析),應進行隨機選擇。

最重要和關鍵的步驟,是將處理隨機分配到實驗單元以證明和確定母體參數和假設檢定的統計推斷的有效性的。實驗誤差假設是獨立且常態分佈的。當且僅當此假設有效時,才能進行參數估計和統計推斷。對實驗動物隨機分配處理是保證觀察獨立性,並允許繼續分析的唯一方法,如同觀察是獨立的並且是常態分佈。作者需要描述用於他們動物試驗的隨機化程序。

統計分析

進行統計分析以檢定研究中假設和檢定顯著性。進行統計分析的方法有很多種,不同的方法會產生不同的結果和結論。進行實驗時應採用適當的統計方法,並應在稿件的統計方法部分,提供關於統計方法的詳細資訊,以便審稿人和讀者評估研究中使用的統計方法的品質。

統計模型

在投稿要在 AJAS 中發表的稿件時,作者應明確定義其用於統計分析的統計模型。統計模型通常表示為線性模型,其中包含反應變數的總體平均值、已知會影響反應變數的固定或隨機變數,以及無法解釋的實驗隨機誤差。統計模型應與實驗設計一致,適合用以分析實驗的觀察結果。將統計模型清晰地描述為方程式以及文字,有助於理解分析程序和統計含義,以及評估研究中使用的統計方法的正確性和相關性。因此統計模型通常被用作審稿人和編輯拒稿的標準[11 ]。

統計方法

有多種統計方法可供使用,方法的選擇取決於觀察的數據類型、要回答的研究問題和統計模型。如果反應變數的觀察是二元的(例如:是或否)或是分類的,則需要使用邏輯模型或其他分類分析。有時研究問題不是關於平均值,而是尋求瞭解反應變數之間或反應變數與處理之間的定量關係(例如,劑量反應分析)。線性或非線性迴歸分析是在這種情況下使用的方法。

當感興趣的反應變數,是一個連續變數並且研究問題是關於平均值或區間值時,可以應用參數或非參數統計方法。最著名的參數統計方法是 t 檢定和變異量分析 (ANOVA)。 t 檢定用於比較兩個樣本或兩種處理,而變異量分析用於有兩個以上的處理。在 t 檢定和 ANOVA 中可以使用不同的方法。例如如果兩個樣本是配對的(例如在同一動物處理前後收集的血液樣本),配對 t 檢定是最合適的。此外由於統計模型中可能存在不同級別的複雜性(例如,存在固定效應和隨機效應及其相互作用,隨著時間的推移重複量測)因此在進行 ANOVA 時,最合適的方法可能會因統計模型而異。參數方法假設觀測值是獨立的並且在它們的平均值附近常態分佈。只要實行隨機化,這種假設在動物營養研究中通常是正確。但是測試此假設始終是一種好習慣,尤其是在預計變數不會遵循它的情況下。例如粒度大小通常具有對數常態分佈 [17 ],因此需要對其轉換值進行統計檢定。

如果觀察結果不是常態分佈或樣本量不夠大,則非參數分析(例如,使用Mann-Whitney U 檢定而不是 t 檢定。採用Kruskal - Wallis H 檢定而不是單向變異量分析)將是選擇的方法。非參數方法並不假設實驗誤差的常態分佈,並且比參數方法(例如,t 檢定和變異量分析)更有效地檢測處理之間的差異。因為非參數方法具有更大的統計檢定力,它們可能誇大了處理之間差異的顯著性。因此,當參數方法適用時,首先使用參數法。

比較感興趣的平均值

當 ANOVA 顯示平均值都是相等的概率小到足以得出結論,認為至少有一個處理平均值與其他處理平均值不同時,我們可能會提出進一步的問題,例如哪些處理平均值彼此不同?在進行進一步分析之前,需要考慮兩件事。

首先,我們需要確定有多小才足夠小。這稱為顯著性水準,通常假設小於 5%(即 p<0.05)的概率,在動物營養研究中具有統計學意義。顯著性水準也稱為 I 型錯誤或 α,它是在虛無假設為真時然而拒絕原假設的概率。如果 α = 0.05,則測試在 20 次試驗中有一次錯誤地發現。當使用 ANOVA 檢定獲得的 p 值小於顯著性水準時,結果可能需要討論意義。因此,比較手段變得有趣。如果獲得的 p 值大於預定的顯著性水準,我們需要得出結論,虛無假設是合理的,並且我們沒有足夠的證據來拒絕虛無假設並接受對立假設。需要指出的是,我們絕不能接受原假設。檢定假設是否為真,並證明所有平均值相同,在邏輯上是不可能的。如果重複次數較大,我們無法確保虛無假設仍然合理。因此,要求作者在統計分析部分說明統計顯著性水準。

接下來,我們需要根據使用變異量分析的處理之間存在顯著差異,再來確定哪些技術最適合事後分析。比較感興趣的方法最直觀和最簡單的方法之一是線性對比。如果處理次數為 t,則可以測試一組 t-1 個正交對比。對於給定的實驗,正交對比集並不是唯一的;可能有很多這樣的集合。找到一組適當的正交對比取決於處理的結構。例如,假設有一個實驗,測試兩種飼料添加劑作為抗生素的替代品,它有四種處理:不使用飼料添加劑(CONT)、抗生素(ANTI)、飼料添加劑A(ADTA)和飼料添加劑B(ADTB) .可以進行一組 3 (4 – 1) 個正交對比,邏輯和明顯的對比是i ) CONT 與其他對比,ii) ANTI 與(ADTA 和 ADTB),以及 iii) ADTA 與 ADTB。

除了線性對比,還有許多方法可用於平均值的多重比較。最廣泛使用的方法包括 Dunnett檢定 [18 ]、Tukey 檢定 [19 ]、 Scheffe檢定 [20 ]、最小顯著性差 (LSD) [21 ] 和 Duncan 多重範圍檢定 [22 ]。其中,鄧肯試驗是動物營養研究中最流行的方法。 在2017 年AJAS 中進行成對比較的動物營養學論文中,約有 37% 使用了Dunnett檢定。第二個最常用的測試是 LSD 和 Tukey 檢定。各佔多重比較測試的 14%。

AJAS 編輯委員會不會對於某些情況下採用哪種測試為更好的問題採取立場。只要測試可以根據實驗設計正確測試邏輯問題,就將決定權留給作者。例如,對於包含增加劑量的水準反應實驗,測試特定平均值之間差異的顯著性是不合適。相反,用於測試劑量反應關係的線性和曲線迴歸將是更好的選擇。當一系列處理中沒有結構性時,適合使用成對比較程序。

統計軟體和統計程序

已有幾個軟體可用於統計分析。即使使用 Microsoft Excel 的數據分析,也可以執行 t 檢定、相關分析、線性迴歸分析和單向變異量分析。然而更複雜的統計模型需要專用統計軟體,其中包括SAS統計GENSTAT、SPSS、Minitab 和 R。在動物營養研究中最常用的統計軟體是SAS。 2017 年在 AJAS 上發表的動物營養學論文中,有 55% 使用了 SAS。第二受歡迎的統計軟體是 SPSS(27.5%),超過 83% 的論文使用了其中一種。與其他期刊一樣,AJAS 對哪一個統計軟體中在任何特定情況下更為可取,無任何立場,並將決定權留給作者。但是作者需要報告用於統計分析的軟體。

即使在每個統計軟體中,也有不同的程序使用於分析數據。例如,在 SAS 中進行 ANOVA 時,可以使用任何可以求解一般線性模型的程序。例如 ANOVA、GLM 和MIXED 程序。但是每個程序可能具有不同的功能,並且在特定情況下其效果更好。例如,在SAS中,與目的為分析具有固定效應的一般線性模型的PROC GLM相比,MIXED程序可以更好地處理具有隨機效應的統計模型。對於具有固定效應的二元或分類變數的分析,應使用使用廣義線性模型的 GENMOD 程序而不是 PROC GLM。更新的程序 PROC GLIMMIX 可以分析具有固定和隨機效應的分類和連續變數的統計模型。 AJAS 對於在某些情況下使用哪種程序無特定立場,只要該程序可以正確處理數據類型,就將決定權留給作者。但是當重複量測觀察結果或在統計模型中包含隨機效應時,首選為SAS 中的 PROC MIXED ,或 PROC GLIMMIX ,或其他統計軟體中的類似程序。

報告

報導所有相關資訊在科學論文中很重要,以提高結果的透明度和有效性,並且為從實驗中獲得的科學知識的可信度和局限性提供資訊。不僅報導概率值(p 值),誤差度量值(例如平均值的標準誤差 [SEM])都應該在表格中報導。同樣,誤差度量應以誤差條的形式在圖中出現。誤差度量可以用多種方式表示:標準偏差 (SD)、SEM 和差異值的標準誤差 (SED)。 AJAS 建議使用總合的 SEM,因為動物營養研究的目標通常是提供關於種群的推論。如果處理之間的樣本量不同,則應報告樣本量以及合併的 SEM。但是當用於描述性統計時,也可允許使用 SD。

當存在異常值或缺失數據時,需要在更稿件合適的材料和方法部分。或結果部分清楚地報告它們。特別是應提供識別異常值的方法及其基本原理,並且應在稿件中比較和討論對異常值的數據有無對於統計分析的結果。

摘要的建議

AJAS 編輯委員會對於在某些情況下,使用哪種實驗設計和統計方法更為可取,無特定立場,並將決定權留給作者。儘管如此,AJAS 編輯委員會對於總結的建議如下:

1.在材料和方法部分,提供實驗設計和統計方法的詳細資訊。

2.定義實驗單元並報告重複次數。重複是獨立的觀察,實驗單元必須相互獨立。

3.進行檢定力測試並提供結果以證明實驗設計得當。

4.在適用的情況下使用區塊或共變數來減少無法解釋的實驗錯誤。

5.描述使用最小化可能的殘留效應,並表明使用交叉設計時其殘留效應為不顯著。

6.確保在對實驗單元進行抽樣,和對實驗單元分配處理時實施隨機化。

7.用方程式和文字描述用於統計分析的統計模型。

8.根據觀察的數據類型、要回答的研究問題,和統計模型,使用適當的統計方法。

9.測試觀察值是否在它們的平均值附近呈現常態分佈。如果不是或樣本量不夠大,請改用非參數分析;否則可使用參數方法。

10.在統計分析部分,說明統計顯著性水準。

11.在處理之間存在顯著差異的基礎上進行事後分析,並根據處理的結構使用適當的方法。

12.只有在一系列處理中沒有結構時,才進行成對比較(例如鄧肯的多範圍檢定)。

13.報告使用的統計分析的軟體和程序。

14.如果重複量測觀察結果或預期隨機效應,請使用適當的統計方法和程序。

15.將概率值(p 值)和總結的 SEM 都作為誤差量度。標準差只能用於描述性統計。

16.在合適的材料和方法部分或結果部分,報告異常值或遺失數據。