如何識破新聞中的誤導數據
作者:Liberty Vittert/The Conversation
審判長,火眼金睛 Credit:HW
根據埃塞克斯大學的研究人員根據性行為檔案中所作的研究,發現「性慾」可以通過人們手指的長度來確定,這個消息最近還蠻火的。
然而我火眼金睛,一看就知道這全是扯淡。
科研結果的發表是很嚴格的,數據樣本是不是足夠廣泛,有沒有嚴格的同行審議,一篇新聞報道基本是不在乎這些嚴謹的過程的,畢竟抓人眼球更重要,所以不必真的花很多心思去針對這樣的新聞本身。
但你如果不想被這樣的文章誤導,還是要稍微研究一下裡面關於數據的一些「貓膩」的。
對我而言真正的風是什麼?
比如《八年研究表明,愛吃炸薯條,死亡幾率兩倍高》這樣的,我正吃薯條呢,你給我來一這個???
嗯,是的,根據美國臨床營養學雜誌發表的同行評審研究,這是真的。吃炸薯條會增加你死亡的幾率。但是,吃多少炸薯條,而且,我本來的死亡幾率是多少?不知道啊!
該研究表明,如果每周吃三次或更多的炸薯條,你的死亡幾率會增加一倍。因此,讓我們在這項研究中採用一個普通人的樣本:一個60歲的男人。無論他吃多少炸薯條,他的死亡幾率是多少?1%。這意味著,如果有100名60歲的男性,其中至少有1人將在明年死亡,僅僅是因為他是一名60歲的男性。
現在,如果所有這100名男性至少每周吃三次炸薯條,是的,他們的死亡幾率會增加一倍。1%翻倍=2%。因此,在100名男子中,明年2人將會死亡。他們每周三次或多次吃炸薯條 - 聽起來其實也還行啊。
這是一種稱為相對風險的統計概念。如果患上某種疾病的幾率是十億分之一,即使你的患病幾率提高四倍,仍然只有十億分之四——基本不會發生。
因此,下次當看到幾率增加或減少時,應該問的第一個問題是「原始幾率是多少」。
睡前吃乳酪等於被床單勒死?
嬰兒箱已成為新父母的時尚禮品,旨在為新生兒提供一個安全的睡眠場所。該倡議源於20世紀30年代末的芬蘭,旨在減少嬰兒與睡眠有關的死亡。紙板箱里包括一些必需品:一些尿布、嬰兒濕巾、連體衣、乳墊等。
隨著這些嬰兒箱的推出,芬蘭的嬰兒死亡率迅速下降,目前是世界上嬰兒死亡率最低的國家之一。 因此,我們假設這些嬰兒箱導致嬰兒死亡率下降是有道理的。
但還有其他的條件發生了改變——產前檢查。買嬰兒箱之前,婦女在懷孕的頭四個月開始就要去診所檢查。
1944年,31%的芬蘭母親接受了產前檢查。1945年,比率已躍升至86%。嬰兒箱對嬰兒死亡率的變化不負責任; 相反,這是教育和早期健康檢查的結果。
這是一個典型的相關性與因果關係不同的情況。嬰兒箱的引入和嬰兒死亡率的降低是相關的,但不是因果關係。
然而,這個小小的事實並沒有阻止嬰兒箱公司遍地開花。每個只賣449美元,暢銷得很。
因此,下次當你看到一個關聯 - 就像吃乳酪等於被床單勒死這種 - 你應該問「還有什麼可能導致這種情況發生?」
當誤差幅度大於效果時
美國勞工統計局最近的數據顯示,全國失業率從8月份的3.9%下降到9月份的3.7%。在編製這些數字時,主管顯然不會詢問每個人是否有工作。它詢問了一小部分人口樣本,然後將該群體的失業率推廣到整個美國。
這意味著任何特定時間的官方失業率都是一個估計 - 一個很好的猜測,但仍然是猜測。這種「正負誤差」被統計學家稱之為置信區間。
數據實際上表明,全美國失業人數似乎減少了27萬人,但由置信區間定義的誤差幅度為正負26.3萬。採樣總是帶有誤差範圍,並且將單個估計值視為範圍更準確。在這種情況下,統計學家認為,失業人口的實際數量在7千和53.3萬之間。
這與性慾和手指長度發的問題相同 - 與這些估計相關的正負誤差可以簡單地否定結果中的任何確定性。
置信區間讓我們的生活變得混亂的最明顯的例子就是民意調查。民意調查人員採集人口樣本,詢問該樣本將投票給誰,然後推斷整個人口在選舉日將要選誰。當選舉結束時,與他們的樣本民意調查相關的正或負誤差否定了對誰將贏得選舉的任何真實因素,使得選舉「難以預測」。
下次看這樣的數據時,先留意一下置信區間吧。
這三點知道了也不能百分百讓你不被騙,但還是有用的啦。
本文譯自 popsci,由譯者 HW 基於創作共用協議(BY-NC)發布。


TAG:煎蛋 |