當前位置:
首頁 > 知識 > 近4成經過同行評審的營養健康研究是錯的,到底出了什麼問題?

近4成經過同行評審的營養健康研究是錯的,到底出了什麼問題?

圖片來源:Times Higher Education

作者 Patrick Clinton

翻譯 王可

審校 阿金

編輯 魏瀟

咖啡會不會致癌?黃油到底健不健康?對於這類問題,我們總是拿不準該如何回答。其實,食品營養科學研究存在一些很大的問題:可疑的數據、不可靠的結果、還有無處不在的偏見(不只是針對「餐飲業巨無霸」,比如麥X勞和百X集團)。因此我們真誠地希望:科學家們和學術期刊能夠規範他們的行為,記者們能夠優化一下他們不靠譜的「探測器」,別老一臉震驚地報道一些所謂營養學的「沒營養新發現」。然而,在這天到來之前,我們最好先學學如何靠自己做好過濾工作

最近在統計學界發表的兩篇文章正好為我們找到了一種絕佳工具,儘管它無法一勞永逸地解決問題,但目前來說,已經能提供一些我們急需的保護措施。在這裡,為了能夠了解具體內容,我們需要在數學領域暢遊一下,不過別擔心,跟緊我,你絕對不會覺得太難的。

讓我們找出三篇最近發表的飲食營養研究:

?每天食用 50 克西梅能幫助患有骨質疏鬆的老年女性預防骨密度的降低

(https://link.springer.com/article/10.1007%2Fs00198-016-3524-8)

?48 克黑巧克力可以改善你的腦電波

(https://www.fasebj.org/doi/10.1096/fasebj.2018.32.1_supplement.878.10)

?食用豬肉泥的嬰兒比食用奶製品的嬰兒長得更高

(https://www.ncbi.nlm.nih.gov/pubmed/29722841)

這些研究都經過了同行評審,都聲稱自己的結果具有統計學顯著性,而且他們都指出常見食物和健康結果之間明確的因果關係。然而,這三項研究中很可能會有一個(也有可能全部)最終被證明是錯的。那麼,我們到底應該相信哪個 ?

雙重錯誤製造正確結果

在營養學研究中,有個問題很常見,你很可能在新聞報道中讀到過:像大多數研究一樣,他們會用一種非常反直覺的方法,稱之為「零假設檢驗」

這種方法大致如下:首先,你需要提出你想要驗證的任何問題,比如「藥物 X 可以治癒癌症」。但接下來你不要去試圖直接驗證它本身,因為這在現實世界中是不可能的,你去驗證它的對立面。也就是說,「我要試著去證明:藥物X和治癒癌症這兩件事之間的任何聯繫都只是出於偶然。」這種看起來有些含糊其辭的否命題陳述就是你的零假設(null hypothesis)

然後你就做實驗、分析數據。如果幸運的話,你會發現沒有足夠證據證明藥物 X 和治癒癌症之間沒有關係(是不是已經暈了?)。換言之,藥物 X 和治癒癌症之間的聯繫並不是出於偶然。那麼,你就會順理成章地認為藥物 X 能治癒癌症。

但事實並非如此。有很多變數因素會影響你的結果:年齡、體重、性別、吸煙與否……不勝枚舉。一個好的實驗設計會控制儘可能多的變數,但總會有一些你不知道的其他影響因素。沒有人可以篩選掉所有可能的變數,所以科學研究不可能完美

對於非專業讀者來說,他們很難理解並消化零假設檢驗。但統計學家會告訴你,它幾乎是唯一的,或者說是最佳實驗設計方法。近一百年以來,自羅納德·愛爾默·費雪(Ronald Aylmer Fisher)出版了他那本影響深遠的《研究者的統計學方法》(Statistical Methods for Research Workers)之後,每位未來的科學家都學過這一內容。

而這也是如今我們陷入如此困境的部分原因。

什麼是發生概率?

讓這套奇異證明體系奏效的重點,在於了解需要多少證據來證實或者證偽一個零假設,換句話說,就是你怎麼能確定你的結果具有統計學顯著性?實際上有很多種方法,其中不少方法深奧複雜,但絕大多數研究都使用同一種叫做「P值」的方法(P代表「probability」,即概率)。

計算P值需要用到實驗數據和用來構建實驗的假定條件,P值應在 0 到 1 的範圍內。低P值就是好結果,它說明你的結果不太可能是偶然得之;相反,高P值則代表你得到的結果(關聯性)很可能是偶然產生的。

幾十年以來,這已經漸漸成為一個人們都遵從的傳統:P值等於或低於 0.05 代表結果具有統計學顯著性,說明它「可信」。P值等於 0.05 可以解釋為:實驗結果只有 5%(1/20)的可能性是偶然產生的——這個可能性是可以接受的。

但問題是,實際上P=0.05 原本的意義並非如此,統計學家定義的P值和我們對它的應用之間,存在巨大的鴻溝。當你讀到一個非技術性設定的P值時,你還會看到不少條理清晰合理的解釋,但很明顯它們是錯的。

原因如下:

很多人認為,P值等於 0.05 說明,你的假設理論(那個你真正想要驗證的假設理論,而非零假設)有 95% 的可能性是真的,但事實並非如此。這P值只代表了你實現最終結果的概率,但它需要一個大前提,即你的零假設以及所有其他的假定命題都得是成立的。

「P值不僅不能告訴我們要證明的某個假設理論是否為真,除非我們能百分之百確保每一個用作計算的假定條件都是正確的,否則它甚至和假設理論沒有任何特定聯繫,而這正是太多研究所缺乏的。」在《美國統計學人》(The American Statistician)雜誌中,一些科學家因為擔心P值被過度濫用而如此寫道。

所以,歸根到底,儘管P值是非常有用的工具,但人們很容易錯誤地使用它。因為它並沒有那麼理想,也不能夠直接回答「一個實驗結果或臨床試驗是否有統計學顯著性」這樣的問題,可是非專業人士就喜歡這麼想。正因為如此,如果你開始研究造成「假陽性」結果和其他錯誤的因素時,我可以告訴你,一般來說,一個常規的健康相關試驗,如果在準確性的正常範圍內操作、併產生「陽性」結果的情況下,P值為 0.05 或 1/20 其實是不正常的,正確的P值更接近 1/3

這聽起來可能很瘋狂,但是別忘了,統計學家 John Ioannidis 曾研究過在主流期刊上發表的高引用率科學文獻,他得到的結果更糟:接近 40% 的研究結果被證明是錯誤的。所以,拿這些東西指導我們的生活?算了吧。

更好的 P 值,還是取代它的工具?

實話實說,統計學領域幾十年前就意識到這個問題了。我在前文中引用的《美國統計學人》聲明就已經強調,用P值衡量假設理論的正確性是一種非常普遍的錯誤。那篇文章提供了一些替代性的選擇,因為過於技術性,在這裡就不詳述了。但無論是什麼辦法,都會需要成百上千的研究人員和各學術期刊齊心協力,更認真地對待科研中的統計學部分。即使是這樣,也要花上幾十年才可能實現。

那我們該怎麼辦呢?

今年 1 月,72 位統計學界的著名學者向《自然-人類行為》雜誌提交了一份提議。提議認為,既然我們不能很快地(也可能永遠不能)消滅基於P值的零假設檢驗,那麼我們至少要設定一個更合理的P值——用 0.005 來代替 0.05,P值處於這兩個值之間的研究結果只能被稱為「有啟發性的」(這個建議主要針對最新發現。跟蹤性研究要求知識更加複雜,應該區別對待)。作者們說,應該要把「假陽性」概率降低到 5%——這個數值就是我們之前用P=0.05 時認為我們會得到的假陽性概率。今年 4 月,John Ioannidis 在《美國醫學會雜誌》(Journal of the American Medical Association)上發表上述觀點。這個解決方法雖然只是暫時性的,但是也是必要的。

這是個好辦法,但要花上幾十年來實施。那麼我們之後該怎麼做?

科學家們和各期刊會在他們接下來的醫學健康(及營養學)研究中採取這個簡單直接的方法嗎?讓我們拭目以待。有幾家已經這樣做了,一些專科醫生甚至已經開始使用更加嚴苛的標準。比如群體基因組學開始用 0.00000005 作為分界值。

跟著我說:我不在乎

我很確定,這 72 名統計學家提出的建議是針對科學家和學術期刊的。但在他們做到這一點之前,我們也許也可以親自採用一下這個建議。

這個時候,讓我們回頭看看最開始找到的三篇論文:

?食用西梅能幫助患有骨質疏鬆的老年女性預防骨密度的降低。P

?巧克力改善腦電波?他們關注了多種腦電波,最強的統計關聯值為 0.01,但他們只有四個被試對象。不感興趣。

?給嬰兒餵食豬肉泥會使嬰兒長更高?這個比較棘手。P值等於 0.001,所以看起來真的是可能會有點什麼。但是嬰兒長得更高有什麼意義嗎?科學家們如果想要繼續這個研究,就請說明一下它的結果既具有統計學顯著性,而且也有現實意義。

要澄清的一點是,並不是任何P值大於 0.005 的研究結果都是錯的,這種觀點也是不對的。隨著時間的推進,科學研究將會使用更加複雜的統計學分析,這會使P

與此同時,你當然是想吃什麼就吃什麼,這篇文章的重點不是要勸你不要吃西梅和巧克力,然後給你的寶寶多吃豬肉泥。想吃就吃,享受食物帶給你的慰藉效果,沒準你會吃得很開心。但是,一定不要把這些研究當成終極真理。他們可能只是去往真理的一步,但在多數情況下,整段行程仍將是漫長而難以預料的

而你要做的,就是接受這樣的現實,忽略掉大部分你讀到的營養學研究。記者需要找到更有趣更嚴謹的題材才能套路你,大學出版社需要發掘更吸引人的新聞主題,而你再也不會被那些美食博主和電視醫生的花言巧語所愚弄。除非你看到了那個 0.005,在這之前,請你保持冷靜,堅定如磐石

這個標準聽起來有點嚴格,但是這是為了科學。你同意嗎?

https://newfoodeconomy.org/nutrition-research-statistics-problem/


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 科研圈 的精彩文章:

這個世界上,有一群專門研究「噁心」的科學家
我們如何記住「這個人是誰」:社交記憶的神經機制

TAG:科研圈 |