你可能對真相一無所知……
上個月小編的朋友圈,刷屏的毫無疑問就是《我不是葯神》這部電影啦!
說好的喜劇,生生把進電影院里的眾人看哭了。
看完不得不說,果真是一部關注醫療現實的良心佳作。
這不,總理就國產葯作重要批示,要求有關部門加大國產廉價葯生產供應保障力度。
進口抗癌藥近期價格也出現了下降。
我們經常犯的錯誤
不過今天小編要說的是另外一件事,電影裡面有個情節,大概是這樣的:
程勇(徐崢飾演)被一對夫妻找上門,質疑他賣假藥,程勇說:「別人吃了我們賣的葯,怎麼就沒事?你們吃了就出問題,那一定是我們的葯出問題嗎?難道不會是吃了其它東西出問題嗎?」後來也發現,他們的確是吃了張院士(王硯輝飾演)販賣的假藥才出問題的。
然而,除非程勇對每個吃過他們葯的人做了全面的跟蹤調查,不然他說的「別人吃了我們賣的葯,怎麼就沒事?」在理論上也是有缺陷的。很可能出現的情況是,吃了他的葯有效的人,繼續和他買葯治療,然而無效或者出問題的人,可能再也不會和他買葯了,結果是,只有「活著」的人的數據被「統計」了。
這種「活著→會說話→數據被收集」的邏輯是一種常見的邏輯謬誤。在統計學的概念上講,叫做「倖存者偏差」(Survivorship bias):只看到經過某種篩選而產生的結果,而沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息。倖存者偏差事實上是一類「選擇偏倚」,就是說,你觀察到的樣本可能是被篩選過的有偏樣本。
一個例子
前幾年被《人民日報》點名過的「尿療之爭」事件,同樣說明了這個道理。
一家在香港註冊的「中國尿療協會」對外宣稱,喝尿能夠治療感冒、眼病、口腔潰瘍以及便秘等問題。為了讓人信服,還引經據典,讓「尿友」講故事。
「肺癌患者早期手術後,肺一直沒有長全,喝尿半年就好了......」「多根肋骨骨折患者,住院期間私下不斷地「尿療」,恢復速度令醫生驚訝...... 」
聽起來略顯荒謬的故事,被說得「頭頭是道」,雖遭醫學專家反對,但信以為真的人不乏少數。
「尿療」之爭其實也可能是一種「倖存者偏差」:所有宣稱喝尿有奇效者,都在統計範圍內並被媒體宣傳;而喝尿無效者甚至出現不良反應者,則成了「沉默的數據」。這種抽樣研究方式就會讓人有錯覺:尿療確實人人都有效。
我們不妨用數學公式來解釋這一問題,基於條件概率的貝葉斯公式如下:
套在上述「尿療」事件,可以大致這樣認為:假設A指的是「治癒」的概率,B指的是接受「尿療」概率,那麼因為被報道和宣傳的都是接受了「尿療」而且治癒的人,因此,會高估了治癒的人裡面接受「尿療」的概率,也就是 P(B|A)會偏大。在其他條件不變的情況下, P(A|B)也會被高估,也就是接受了「尿療」並且被治癒的概率被人為謬誤地放大了。
用集合的概念解讀可能更為直觀:假設所有接受「尿療」的患者全集為X,有X的子集 X1,特徵是「被報道」和「治癒」,X1就是倖存者,X另外的子集X2是未被報道的病患,事實是沒有被治癒的,然而被誤以為也是「治癒」了。
另一個例子
2018年世界盃早已偃旗息鼓,但彼時賽場內外的故事卻遠不止足球本身那麼簡單。比如,有網友就表示比賽時間收到了自稱莫斯科「有人」的簡訊,號稱有「內部信息」預測比賽結果,結果對了再「打錢」買下一場。結果還真對了,當你打錢買「內部消息」時,你就已經「中招」了……
事實上,這也是「倖存者偏差」的典型案例:假設騙子給900人發簡訊,其中300人發A隊贏,300人發B贏,300人發平局。等結果出來後,再在上一輪發了對的信息的300人裡面給100人發A隊贏,100人發B隊贏,100人發平局。只要發的人夠多,總有人會認為真有「內部消息」,這些人就是「倖存者」。只要有人相信,就會有人打錢,你以為這回賺大了,其實你對真相一無所知,騙子套路深著呢……
倖存者偏差和我們的統計調查工作
倖存者偏差和我們的統計工作無疑是息息相關的。例如,我們在對工業企業,特別是小微企業進行調查時,由於小微企業存活率低,每年都會有相當一部分企業消亡,而存活下來的企業無疑是「優勝劣汰」的結果,會不斷發展壯大,如果根據小微企業調查結果推斷經濟運行形勢,則有可能出現存活企業營收、資本不斷增長,產品價格提升,然而投資、庫存等社會總需求指標不見好轉的「背離」,這事實上就是只關注了存活下來的小微企業「倖存者」。
又比如,我們去社區公園調查市民是否經常前來鍛煉休閑或者對公園的環境是否滿意,很可能就存在「倖存者偏差」的謬誤,因為大部分來這裡放鬆休閑的人都是滿意公園環境並且經常前來的人,而那些少鍛煉、不喜歡的人就不會來了,當然也不會給你填問卷。在設計問卷調查方案時,調查樣本如何選取才能避免「選擇偏倚」,是很深的學問呢!


TAG:珠海調查 |