logo821.gif (10572 bytes) 首頁          新增資料與公告

   

最新消息  :

荷蘭與 Maarel Orchids在國際市場上的突破

Westerlay Orchids的碳中和蘭花生產

農企業全面有機化的結局

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
非洲產業研究中心
授課資料
人文關懷
無官御史台
武漢肺炎與產業
智能生物產業
活動公告區
數據分析與知識產業

 

 
中國科研設計和統計分析的錯誤率
 

中興大學 生物系統工程研究室 陳加忠

 
 

在以下所附的一篇中國學術界文章其標題為"科研設計和統計分析的錯誤率高的驚人"

此現象的三點原因如下:

1.中國此國家對於統計學在科技與經濟發展的作用,認識不足。

2.中國高等學校在統計學教學品質不高。

3.科學研究者,醫生與其刊編輯,在統計學先天不足。

除了上述原因,另一個原因就是造假風氣。對於弄虛造假的研究人員,統計方法只是裝飾品,數據都可造假了,論文內容當然也是不實。以此為鑑,檢討台灣的學術界。

附錄I. 科研設計和統計分析的錯誤率高得驚人

http://www.933.com.tw/tongji/2017-02-14/26326.html

科研設計和統計分析的錯誤率高得驚人

看了《中國統計科學在創新中前行》的報導,作為一名生物醫學統計學工作者,心潮澎湃,感觸很深。該報導回應著筆者多年的呐喊之聲:中國該是高度重視和正確應用統計學的時候了!

在科研方面,近十年來,國人極為關注每年中國人在SCI源期刊上發表科技論文的數量。有些單位或政府部門以此類資料作為重要依據,來考核、評價和聘用科技人員,評審國家級核心或優秀期刊。至於與學術論文所對應的科研課題的設計是否正確,實施過程是否嚴謹,調查或實驗資料是否真實可靠,資料的統計分析是否正確,推測出來的結論能否經得起時間考驗,科技成果的技術含量和學術水準有多高等一系列重大問題,卻很少有人去追究。以至於很多人在追求數量上累得精疲力竭,而文獻調研的結果卻顯示:我國生物醫學科研及論文中,科研設計和統計分析的錯誤率高得驚人!

造成這一現象的原因很多,主要有以下3點:

第一,國家對統計學在科技和經濟發展中的作用認識不足、重視不夠,國家級重大科研課題在科研設計和統計分析上嚴重缺乏強有力的統計學指導和支撐;第二,我國高等醫藥院校的生物醫學統計學教學品質不夠高,教材嚴重脫離科研實際,致使很多人學了多遍統計學,仍不得要領,幾乎一用就錯;第三,廣大生物醫學科研工作者、臨床醫生和雜誌編輯在統計學方面的先天不足得不到及時且適當的彌補。

很多人都認為統計學只是處理實驗資料的一個計算工具,是學術論文一件漂亮的裝飾品。事實上,這些認識來源於現實世界給人們的誤導:有些統計學水準不高甚至根本不懂統計學的科研人員照樣能獲得國家級的重大科研課題,照樣能獲得國家級的重大科研成果,照樣能在國際上發表高影響因數的學術論文;有些慣於弄虛作假的人(如韓國的黃禹錫、美國的舍恩等)照樣能在國際一流學術期刊上發表造假論文。

希臘約阿尼納大學的Ioannidis等人曾對19902003年間發表在N Engl J MedJAMALancet 3大著名醫學雜誌上且引用次數在1000次以上的文獻進行調查。結果顯示,在49篇高引用率的原始文獻中,45篇聲稱干預方法有效。而報告結果被以後的研究所否定的有7篇(占15.6%),最初報告的療效被誇大的有7篇(占15.6%),因此接近1/3的研究結果沒有經受住時間的考驗。

其實那些被世人仰慕的國際一流學術期刊,缺乏一些最起碼的統計學知識的指導,被一些假東西和經不起時間考驗的科研成果矇騙了眼睛!

通過20餘年的統計教學和諮詢工作,以及與實際工作者的交流和溝通,筆者認為,統計學絕對不僅僅是處理實驗資料的一個計算工具。統計學實際上是將專業知識基本常識數學辯證法融於一體且能透過現象看本質的一門應用學科。

下面兩個摘自中國牌中華牌醫學雜誌的實例足可使人相信:統計學並非高深莫測,也並非僅是計算工具。

例如,某專案論文,研究目的是研究絕經後骨質疏鬆症與血清IL-6TNF-?琢濃度關係。研究方法卻是選擇絕經後骨質疏鬆患者30例,採用Elisa檢測其血清中IL-6TNF-?琢水準,並與正常青年婦女進行對照。顯然,此項研究中,實驗組與對照組在年齡上相差懸殊。而我們由醫學常識可知,婦女處於不同的年齡段,尤其是絕經前後,雌激素分泌水準與機體是否易患骨質疏鬆症有關,故在此項研究中,對是否患骨質疏鬆症這個結果變數而言,婦女的年齡是否絕經是兩個十分重要的影響因素,對照組也應選擇絕經後、但未患骨質疏鬆症的婦女,其年齡分佈和個體的平均健康狀況等各種重要的非實驗因素都應盡可能與實驗組婦女接近或相同,這樣的對照組才有其存在的價值,才能真正提高研究結果的可信度和說服力。該研究者選擇的對照組在關鍵要素上不合格,可以說是形同虛設

又如,某眼科科研中,患者的基本情況是:22例(22只眼,男13只眼,女9只眼;年齡4883歲,平均66.5歲)單純性老年性白內障患者;選擇的對照者為意外死亡的健康青壯年人10只眼(男9只,女1只,年齡2535歲)。我們不難看出,兩組受試者在年齡分佈、性別構成、樣本含量等方面都不具可比性,對照組中受試者選得很不恰當,嚴重違反實驗設計的對照和均衡原則,研究結論當然也沒有說服力。

我們再看看正面的例子。

20世紀3040年代,醫學界曾用金的化合物作為結核病的特效藥,直到20世紀4050年代,有統計學頭腦的人運用隨機對照的臨床試驗方法,才迅速否定了原先的錯誤結論。在第二次世界大戰期間,為了檢驗軍火的品質,人類創造出經濟高效的序貫試驗設計方法。

英國於1942年將正交試驗設計用於農業試驗,後來日本的田口玄一先生和中國的張堣d教授進一步推廣了正交設計在工農業生產中的應用,大大提高了生產效率……實例不勝枚舉。將統計學正確運用於科研設計,不僅可以節省大量的人力、物力、財力和時間,而且可以將事物或現象的複雜內在規律如實呈現,再利用概率論和數理統計學的技術手段,將業已存在於調查和實驗資料之中的統計規律性描述並刻畫出來,以達到透過現象看本質的目的。

統計學思維模式概括起來為八性八思維。具體地說,即統計學具有延展性與概括性、隨機性與均衡性、系統性與代表性以及自悖性與相合性;統計學致力於指導人們從靜態思維到動態思維、從正向思維到逆向思維從簡單思維到複雜思維以及從橫向思維到縱向思維。八性八思維不僅在科學研究中發揮作用,還可以在各個社會領域(包括經濟、文化、教育、工農業生產、心理與健康等)中產生不可估量的積極影響。正確運用統計學,可以幫助科技事業持續快速發展,促進經濟健康穩步上升,也有助於大幅提升國人整體素質。

要做到正確運用統計學,筆者認為關鍵應落實好4點:其一,我國政府應在實際行動中高度重視科研工作的科學性和嚴謹性,制定和完善相應的科技政策和法規,嚴格遵照執行、監督檢查。例如:國家級科研課題、成果和新藥臨床試驗研究等的審批,必須經過嚴格的高水準的統計學論證。其二,我國高等院校的統計學教材應徹底改革,使其經得起科研和生產實踐的檢驗。其三,所有擬在學術期刊上發表的論文,必須經過高水準的統計學專家的嚴格審查,阻止低劣甚至錯誤的學術論文發表。其四,所有從事與科研設計和統計分析有關工作的人員,必須通過相應統計學水準的上崗考試,不符合者應參加統計學知識培訓,直至達到規定標準。

大資料分析給現代社會帶來了新的機遇與挑戰。一方面,與傳統研究側重於揭示事物的共性不同,大資料研究將有助於人們發現事物的個體特性,並針對每一個體的特性給出個體化的解決方案。同時,大資料研究也將使人們能夠從大量個體的差異變化中,揭示其中存在的難以察覺的規律。另一方面,大資料的海量樣本規模和高維數特徵也引入以下顯著特性:資料搜集的偏差性、資料產生的異母體性、計算成本、噪音的累積疊加、假關聯性、外生性,以及測量誤差等等。為了應對這些挑戰,需要引入新的計算和統計方法。

由美國普林斯頓大學范劍青教授作為通訊作者撰寫、發表於《國家科學評論》的綜述文章大資料分析面臨的機遇與挑戰http://nsr.oxfordjournals.org/content/1/2/293.full)闡述了大資料獨有的特點及其對統計分析和計算體系結構的影響。

首先,從計算的角度來看,大資料提供的資料量巨大,這會給實施統計計算和最後完成統計估算和檢驗帶來問題。比如,對於一個列數上百萬的矩陣,一次簡單的矩陣求逆操作在計算上都是困難的。該文概括性地介紹了Hadoop分散式檔系統、MapReduce編程模型、雲計算、凸優化演算法,以及隨機投影技術,以解決海量資料的計算問題。其次,從統計分析的角度來看,大資料經常包含被抽樣個體的大量特徵資訊,即樣本的個異性和高維性。個異性和高維性給統計分析與計算帶來諸多問題,包括異母體、噪音累積、假相關、內生性。以假相關性為例,高維數會增加發現欺騙性關聯的風險。比如,在人類基因表達資料分析中,學者可能會認為第八對染色體上的某個重要致癌基因(MYC)和Y染色體性別決定基因(SRY)有很強的相關性。但是,這可能僅僅是因為考慮的基因數目太高,以至於有些高相關性的出現只是偶然事件。

該文也為大資料分析提供了新的展望。以高維資料下的統計推斷為例,文中給出了高致信區間內的最稀疏解的一般解,並指出許多傳統的理論所基於的外生性假設是不正確的,尤其可能導致錯誤的統計推斷,並得出錯誤的科學結論。以內生性問題為例,范劍青教授和他的合作者指出,線性回歸模型中的外生性假設在高維數下很可能是不正確的:當考慮的回歸變數數目很大時,其中的一些回歸量(引數)很有可能和模型的誤差項相關。他們發現,當內生性問題存在時,流行的高維回歸方法(諸如lassoSCAD)的估計值不具有相合性,即:隨著樣本數變大,估計量和母群體參數的差異不會趨近於零。本文介紹了一種新的、基於廣義矩與高維回歸的方法。這個方法可以克服內生性問題,並給出具有一致性的估計量。