為什麼有時各個部分均佔優而整體不佔優?
(作者:顧森,科普作家)
導語
你相信統計數據嗎,它們有時會耍「障眼法」。
十萬個為什麼:
為什麼這麼說呢?
有時候,統計數據會出現一些極其反常的現象。讓我們來看一看下面這個有趣的例子。假設科學家研發出了一種治療某種疾病的新葯。不過,實驗結果表明,這種新葯的效果並不比原來的葯更好,如表所示:
簡單計算就能看出,新葯只對40%的人有效,而原葯則對50%的人有效。問題出在哪裡呢?是否因為這種新葯對某一類人有副作用?還是存在其他原因?於是研究人員把性別因素考慮進來,將男女分開來統計,如表所示:
我們不妨實際計算一下:對於男性來說,新葯對高達70%的人有效,而原葯則只對60%的人有效;但對於女性來說,新葯對30%的人有效,而原葯則只對20%的人有效。矛盾的結果出現了:新葯不但對男性更加有效,對女性也更加有效,但對整體人群則不及原葯!1951年,英國統計學家辛普森首次發現了這種怪異的現象,因此這種現象就被叫作「辛普森悖論」。
辛普森悖論也叫辛普森效應,它其實不是一個悖論。
其數學原理是:當時,並不一定總是。如果,就會產生辛普森效應。它在分組樣本數據大小差異較大、發生頻率差異較大時容易出現這種現象。比如,在上面的例子中,參與新葯試驗的女性人數遠大於男性人數,原葯則相反,而且,藥品對男性的有效率遠大於對女性的有效率。
餅圖是展示統計結果的常用方式
在醫藥衛生領域的統計數據中,這樣的現象時常會發生,如流行病學中的「混雜效應」實際上就是辛普森效應。類似的事情在人類社會其他領域中也有發生。美國勞工部曾發表過一份報告顯示,於2009年爆發並影響之後多年的全球金融危機期間,美國總體失業率要低於20世紀80年代經濟衰退期間的總體失業率。然而,分別統計大學畢業生、高中畢業生以及高中輟學生等各個群體的失業率數據後,會發現這些群體在全球金融危機期間的失業率,均高於20世紀80年代經濟衰退期間。究其原因,是由於2009年以後美國每年大學畢業生人數佔總人口的比例遠高於20世紀80年代,而大學畢業生的失業率則遠低於高中生或高中輟學生。
1973年,美國加利福尼亞大學伯克利分校曾因性別歧視被起訴,因為有統計數據顯示,當年男性學生的錄取率遠遠高於女性學生。然而,校方仔細檢查了學校每個院系裡的男女學生錄取率,發現情況並不是那麼回事。事實上,幾乎所有院系的女性學生錄取率都更高一些。最終,伯克利分校在這次訴訟中獲勝。
編輯:魯凡英
點擊展開全文


※什麼!人從豬身上移植器官,這樣也可以?
※為什麼肚子餓了會咕咕叫?
※友誼會使歡樂倍增
※海洋動物是怎麼睡覺的?
※趣味科學:全國食品安全宣傳周:「食」面埋伏,該如何破?
TAG:科普中國 |
※中分短髮的優點在於何處 為什麼那麼多人選擇它
※氣墊bb霜怎麼樣 它有什麼優點
※有個不走心的對象是一種什麼體驗?
※有個活不好的男友是種什麼體驗?
※中分有什麼特色 哪些人比較適合它
※沒有什麼疲勞是一個熱水澡解決不了的
※曹操為什麼能夠脫穎而出,一統北方?這與這五個優點密不可分
※水膜是什麼 它有哪些特別的好處
※堆堆襪不適合什麼人 3種人群不要選擇這種單品
※成考有什麼類別區別,都分別適合哪些人學習
※智能窗帘改變生活,它都有什麼優點?
※不管是什麼樣的面膜 其實真正的作用只有這一個
※這種分幣今年還發行嗎?為什麼現在還有硬分幣
※有一個摳門男票是什麼樣的體驗?
※電夾板怎麼弄捲髮 它有什麼優點
※蜂蜜到底什麼時間喝才對身體有益?營養專家:只有這兩個時間段!
※情侶間佔有慾強是種什麼體驗?
※每天靠牆站幾分鐘,身體會有什麼變化?好處居然這麼多!
※有個男朋友都有什麼好處,單身妹紙都來體驗一下
※做一個隨和的人有什麼不好