黑天鵝:怎麼證明我的病是你治好的?
人類對於因果關係可能會出現很多謬誤,主要是兩類原因造成的:一個是時間先後順序可能會迷惑我們,另一個原因就是統計學上的「倖存者偏差」。
1
時間錯誤造成我們對因果關係有錯誤的認識
比如說我先從屋子裡推門走出去,你緊跟著從屋子裡也推門出去,雖然時間有先後,但是並不能說我推門出去是你出去的原因。到了社會生活的方方面面的場景里,我們卻經常把時間的先後順序錯誤地以為是因果關係。
比較喜歡這麼乾的是媒體,2003年12月薩達姆被美國逮捕,當時彭博新聞社發的頭條標題說,美國國債價格上漲,薩達姆被捕可能不會抑制恐怖主義。
其實這個標題是說了兩條新聞,把這兩條新聞並著說其實是想暗示薩達姆被逮捕了之後,美國資本市場有了信心,國債的價格就上漲了,凸顯了市場對政府的信心劇增。
發完這條新聞之後,國債的價格馬上就下跌了,因為國債的價格就是過山車一樣,上午漲了下午跌都是非常正常的事情。他們馬上又發了一條新聞,標題說,美國國債價格下跌,薩達姆被捕刺激了風險資產的吸引力。
意思就是薩達姆被捕這事把大夥注意力都吸引到風險資產上去了,像國債這種比較安全穩妥的投資吸引力就下降。
同樣一個事件,都是薩達姆被捕,用來解釋兩件完全相反的事情,新聞標題對因果關係的理解特別混亂。實際上在媒體操作中我們經常看到這種說法,把時間先後出現的兩件事認為是一件事導致了另一件事。
每天股市的大盤收盤之後,如果大跌了,好多媒體會去採訪證券公司所謂的首席分析師,他們分析的邏輯全是按時間的先後順序去找原因。
比如市場大跌,他們會聯繫一下最近國家政策上有什麼事,市場上有幾個大的合併,國際上黃金價格有什麼區別,美聯儲那邊有什麼動靜,綜合出一個原因來解釋一下為什麼市場信心出現了下降,導致了股票的大跌。
所以不是只有我們普通人會把先後順序當成因果關係,如果所有的分析員都是按這個邏輯思考資本市場的波動,那一定會忽視很多特別大的意外事件,像黑天鵝這種事情就肯定會出來。《黑天鵝》作者塔勒布就特別喜歡奚落這種交易員,說他們特別呆板,只會拿些條條框框往上放,其實發現不了市場真正的變化。
咱們現在經常研發一些新的藥物來治療一些比較難治的病,比如糖尿病、老年痴呆症。這種新葯的研發是非常複雜的過程,研發、論證,到藥物上市一般最快也得五六年的時間。
論證過程其實就是論證因果關係的過程,要證明吃了這個葯確實能治好這個病。
你要發明一個新葯治糖尿病,要證明這個新葯對治療糖尿病有突出的效果,就要做一個證明。這個過程在醫學上就叫隨機雙盲實驗。
隨機就是說樣本一定要保證是隨機抽樣,保證每一個樣本都是獨立的,樣本與樣本之間是沒有關聯的,所以不能找某一類人群直接抽樣。樣本之間彼此有關聯,導致抽樣出來的結果是不均勻的,這在統計學上是一個巨大的禁忌。
多說一句,心理學很多時候會被自然科學家質疑,主要原因就是研究方法不是特別嚴謹。心理學經常拿大學生去做實驗,而且很多老師做研究就直接找本校的大學生去填寫問卷,樣本不獨立。
所以好多人諷刺心理學的研究,說他們應該改個名叫大學生心理學。大學生的心理無法代表全社會所有人群的心理狀態,所以這種質疑是有道理的。
說回隨機抽樣,要治糖尿病,那要在全球病人的資料庫里用電腦隨機抽樣,對他們進行分組,一般分成兩組,一組用來做實驗試藥,另一組叫做對照組,對照一下效果究竟高出多少。對照組一般是不吃藥的,會給他們吃安慰劑,就是形式上要表示一下,比如鈣片、vc這種東西。
雙盲包含兩方面。
一個是不能讓參與對照組、實驗組的病人知道。不能告訴他們誰吃的是真葯誰吃的是安慰劑。醫學上有一個安慰劑效應,如果你失眠,我給你一片葯,說是安眠藥,特別有效果。你吃了之後回去睡覺一定就非常踏實,因為給了你一種心理上的安慰。雖然我可能給你的是一個鈣片,但只要你認為是非常有效的安眠藥,就會起到效果。
所以不能讓病人知道誰是實驗組誰是對照組,很可能給他一個心理安慰,測這個藥物效果可能就加大了心理的因素。還有一類需要保密的人群,就是操作實驗的研究人員。實驗人員本身也有主觀的傾向,因為參與了這個葯的研發過程,可能比較傾向於相信這個葯是有效果的,記錄他們的反應的時候可能就會摻雜上主觀因素。
隨機雙盲實驗不僅隨機加雙盲,還得保證是大樣本,必須保證你隨機抽樣來的這些病人數量足夠。很多時候都是有上千人才能保證效果是比較大範圍的有效,而不是靠運氣碰巧。
還有一個重要的點,必須保證這個實驗的效果可復現。你把這個效果寫成論文發到頂級的學術期刊上之後,其他人照著你這個方法原封不動地做一遍之後,也能出現同樣的效果,這才叫有效。如果說只有你操作有效,別人操作沒效果,那肯定不行。
這麼複雜的一套機製做下來之後,基本上能保證把其他的干擾因素排除出去,單純地去測試這個葯對治療這個病的效果。
即便這樣也不能保證萬無一失,只要是個生物體身上的變數就太多了,還是沒法百分之百地保證因為這個葯能治好病。它也可能有副作用,所以還得持續觀察幾個月,三個月沒有副作用基本上可以排除掉絕大多數的有副作用的情況了。
但是在一些非常罕見的情況下也有一些副作用超過三個月才能顯示出來,偶爾也有一些葯上市之後出現大範圍的副作用。不過在這種非常嚴格的控制下可以把這個概率降到非常低。
網上老是有爭議,中醫跟西醫不停地爭。支持中醫的人可以舉出好多神奇的例子說中醫有效,支持西醫的人可能就講科學的範式,其實西醫和中醫的爭論爭的就是因果關係的證明方式。
嚴格說來這不是中醫和西醫之爭,中國人現在也參與醫學的研發,所以所謂的西醫實際上是不存在的,應該是現代醫學、中國古代醫學方法論和價值觀上的衝突。
現代醫學好多人經常說:科學是反經驗主義。很多人覺得否定傳統民族文化不行,針灸就是很有效。
其實沒有科學研究說中醫無效,科學是沒法證明一個東西無效的。科學說中醫的問題一定是這麼表述:沒有證據顯示這些藥物或者方法是有效的。沒有證據表示它有效跟證明它無效是兩件事。證明人家無效只是個價值判斷。
現代醫學的主要特徵就是反對經驗主義。中醫上有一句經典的名言,叫神農嘗百草。
這其實就包含了中醫做事的方法論,我去山上采各種草藥,拿回來配成藥方,在生病的人身上做實驗,把實驗結果匯總就得出來了。這個書籍在這個行業里就逐漸流傳開來,大家都得出結論,這個葯能治這個病,這就是典型的經驗科學。
經驗科學特別難發現實際上的因果關係,主要原因就是它是用時間的先後順序去證明因果關係的。比如說你得了一種病,中醫給你開了一個藥方,你吃了這個葯之後病就好了,他用這個來證明這個葯是有效的。跟科學實驗排除掉所有干擾之後,只剩下單純的藥物效果,可靠性相比差一些。
而且人體疾病有80%屬於自限性,就是說什麼葯都不吃,靠自身的免疫系統就能好,無非就是花點時間。比如感冒,你不用吃什麼葯,只要卧床休息幾天,多喝點水,肯定就會好。
感冒了,喝了中藥之後究竟是葯起了作用,還是你喝葯的時候配著喝了很多水,這個水起了作用,其實是說不清楚的。這麼分析下,現代醫學治好病的概率更高。一個人即便信中醫,他老婆要生孩子的時候他一定還是會去醫院。
中醫如果想像現代科學一樣去做隨機雙盲驗證,這就要求必須像現代科學一樣,所有的指標都可以測量,能夠量化。
可是中醫做不到這一點,比如望聞問切,沒有一個統一的標準。雖然中醫典籍里講了這個人的面相怎麼樣,舌苔怎麼樣,眼瞼如果發紅怎麼樣,發黃怎麼樣,發白怎麼樣,不同的顏色對應著不同的治療方案。問題是發紅、發黃、發白由主治醫生確定,沒有一個統一的標準。
前幾年上海中醫藥大學發過一篇論文,叫《中醫臨床醫生四診信息判讀及診斷一致性探討》,他們自己反思中醫的問題。找了同一個病人,找了上海醫院裡的很多主任醫師或者中醫藥大學研究中醫的教授,共16個。
讓他們這16個人對同一個病人進行望聞問切,結果亂得一塌糊塗。有人說他舌苔發紅,有人說他舌苔發黃,有人說他臉發白,有人說他臉發黑。
這就是說中醫第一步就對這個病的描述都不一樣,後面解決方案肯定都不一樣。而且中醫里騙子特別多,好多人打著中醫的旗號賣假藥,所以一個普通人如果出了問題,哪怕相信中醫的技術,找靠譜的人也非常難。
因果關係這事確實是非常複雜,非常難論證。不管是治病還是股票因為什麼原因漲,並不是先出現一個東西然後再出現一個結果就代表是因果關係。
2
倖存者偏差
這個詞來源於一個故事,二戰的時候美國整天出去打仗,之後會發現空軍損失非常嚴重,每次只能回來一部分。所以他們就覺得應該把飛機加固一下,給機身上加一層厚鋼板,子彈就打不穿了,飛機的傷亡率就下來了。
可是這會造成一個問題,鋼板太重,飛機整體負擔太重,在空中飛的時候可能就不靈活,所以不能給飛機的每一個位置不加區分地全部加上鋼板。
哪些位置容易受到攻擊?有人說去數數飛機上哪個地方彈孔最多,就是需要加厚的地方。結果發現飛機的機翼中彈最多,引擎部位最少。所以他們就覺得應該把鋼板夾在機翼上,引擎的部分不用加。
有很多數學家隨軍打仗,看了一眼說,你們快別瞎掰了,恰好相反,你們應該把鋼板夾在飛機引擎上。只要引擎上中過彈的飛機都掛掉了,根本就沒飛回來,機翼上中彈這麼多還能飛回來,就說明機翼打幾槍沒問題。數學家確實是對的,鋼板夾在引擎上之後飛機的傷亡率大大下降。這故事就是所謂的倖存者偏差。
小學應用題基本上都是上來先假設,然後求結果,所以數學家的腦子裡有一個假設的思維。哪裡彈孔多就應該去補哪,這個從感覺上是對的,但是前提有問題。這個的前提是,假如出去打仗的所有飛機跟最終飛回來的飛機是同一個樣本,也就是說一架都沒損失的話,那一點問題都沒有了。
可是這個假設不成立,明明犧牲了好多飛機。數學家一下就發現了這個假設上的謬誤,如果把這些倖存下來的飛機當成全部的樣本就會造成一個認知上的偏差,這就是倖存者偏差的來源。
倖存者偏差在生活中非常常見。好多藥廠的葯可能治病治死了人,家屬就去找律師要巨額的賠償,很可能過幾年就把那個葯給停掉了,都覺得老百姓維護了自己的權利。
問題是,假如這個葯治好了絕大多數人呢?只是對很少一部分人來說有風險,但對於絕大多數被這個葯治好的人來說,你是聽不到他聲音的。
這也是新聞媒體的邏輯,只傳播壞事,好事誰傳播?所以這就導致倖存者偏差。沉默的大多數的利益這時候是得不到保障的。再回頭看這個葯停掉到底對人類這個整體來說是好事還是壞事,肯定是有壞處,所以這種倖存者偏差就導致我們認知陷入了偏狹。
還有一種顛倒因果關係的例子。我們會發現從事不同運動運動員身材好像不太一樣,自行車運動員好像屁股一般都特別大,跑步的運動員一般都比較瘦,舉重的運動員四肢一般都很粗壯。我們會得出一個結論,從事什麼運動就會把人的體型往這個方向培養。
但是身材這種東西基本上是靠先天的。菲爾普斯那大長手是怎麼用游泳拉扯到那麼長的?這是不可能的。所以肯定是先有了這個身材,才適合去游泳,去舉重,然後最終這些運動員勝出,成為這個項目的倖存者,之後我們才會得出一個結論,跑步的人一般都是這種身材,游泳的人都是這種身材。
據說有一些職業賭徒,他們流行一種說法,叫做新手的好運氣。就是說你剛進這行,一般運氣都特別好。據研究發現這些剛入行的職業賭徒確實勝率非常高。
這就是個倖存者偏差,賭徒一開始跑來賭博,可能有兩種結果,要麼運氣特別好,要麼運氣特別差。特別不走運的人就不玩了,而之前運氣比較好的人就會接著玩下去。只要接下去運氣一直不錯,那最終就會成為一個職業賭徒。
如果說因為是初學者所以有好運氣,這個因果關係就是一個倒置的。
好多做互聯網產品的人要注意用戶的意見,可能天天去看用戶的留言,但要是照著用戶留言去改,你可能會把這個產品做死。
因為這些用戶第一次用你的產品,一部分喜歡一部分不喜歡,而不喜歡你這個產品的用戶絕大多數直接離開了,那些寫留言的是覺得還行的,本身就是倖存者,所以他希望你去改進的方向可能並不一定是你這個產品真正需要改進的方向。真正不滿的人根本就不會跟你溝通。
所以你看用戶意見反饋的時候一定要有倖存者偏差的意識,聽用戶的意見但是不能照單全收。
名人傳記里記載的經驗技巧都是基於當時的環境形成的,而我們拿到現在這個環境基本上是不行的。還有一個更重要的原因,你其實區分不出來哪些名人成功是靠運氣,或者說他有多大程度是靠運氣。這裡邊也存在一個倖存者偏差,因為他們都是成功人士,你想去總結因果關係,看看他們是不是因為這幾個地方做得好所以成功了,那你可能會死得很慘。
本文圖片均來源於網路,如有侵權,請聯繫刪除。


※窮查理寶典:心理學為啥不太准?
※巨富:我們和土豪差距會縮小嗎?
TAG:老馬商書房 |