當前位置:
首頁 > 知識 > 他們試圖重複心理學的多個經典實驗,竟然只有一半成功了

他們試圖重複心理學的多個經典實驗,竟然只有一半成功了

最近,心理學界遭受了一點小震動:又有一些著名實驗沒能重複。

發表這些重複結果的,是一項名為Many Labs 2的大規模國際合作項目。過去幾年間,該項目背後的200多名心理學家試圖重複28項高引用和轟動性的研究,最終發現只有一半的重複實驗能得出和原始研究一致的結論。如果這發生在六年前,或許是震撼學術界的大新聞。而現在,結果已然在預料之中 。

圖 | JASIEK KRZYSZTOFIAK / NATURE

可重複性再遭審視

其實,「可重複性危機」已經困擾心理學界好幾年。雖然各種質疑、捍衛之聲聚訟紛然,越來越多的人已經意識到,即使是那些業界公認的心理學現象,也不一定是真的。也就是說,你還未更新的舊教材,收藏列表裡的Ted演講,都有可能錯了。

比如說,「自我耗竭效應」——人的意志力是有限的,會隨著過度使用而減少。提出這一理論的研究者最初發現,當被試面對巧克力的誘惑執行困難任務時,堅持下來的時間並不長。他們指出意志力對精神能量的消耗,就如同肌肉鍛煉後會產生疲勞一樣。這個理論很符合科學家的直覺,也備受暢銷書作家的追捧。在人們通過各種實驗知曉一系列消耗意志力的事項後,重複實驗卻發現,自我耗竭效應並不明顯,很難找到支持它的證據。

圖 | Lisa Larson-Walker

為了嘗試重複更多經典實驗,開放科學中心(Center for Open Science)於2013年成立。但他們的首次結果並不足夠樂觀:在100項已發表的心理學實驗中,只有不到40%成功重複。而作為該中心的新項目,Many Labs 2的結果表明,在更嚴格的統計學標準下(p重複成功率僅為50%。

相當諷刺的是,似乎心理學領域最可靠的發現之一,就是僅有一半實驗能被成功重複。

開放科學中心 | cos.io

沒按原始方向走,所以重複不出來?

有懷疑者認為,可重複性的「危機」壓根不算危機,很容易就能解釋清楚。首先,重複實驗本身可能樣本太小。此外,這些實驗的研究人員可能水平不夠,或者不明白原始實驗的具體操作。再者,人和人之間也有區別,同一個實驗,由兩組不同的科學家在完全不同的志願者身上做,結果自然可能大相徑庭。

圖 | MáGOZ

Many Labs 2就是專門設計出來回答這些質疑的。他們總共招募了15305名被試,平均每個實驗的被試數量是原始版本的60倍之多。這些研究人員與原版實驗的科學家們深入交流過,確保每個細節準確無偏差。而且,重複實驗的被試來自36個國家,每項實驗都重複了多次,以判斷被試的文化和背景是否對實驗結果產生影響。

儘管這項工程的樣本巨大,操作方式也得到了被重複的研究者的認可,他們依舊沒能驗證許多研究的結果。

重複失敗的實驗包括:潛意識接觸過「熱」這個概念的人更容易相信全球變暖;道德上「骯髒」的行為會迫使人們需要清潔自己的肉體,就像麥克白夫人那樣;一個人成長中擁有更多兄弟姐妹,行為也就更利他……

Gabriel von Max畫作《麥克白夫人》(1885)| Wikimedia Commons

實驗結果不一樣,人群差異來背鍋?

除了樣本量的問題,有些研究者認為,重複實驗還應考慮被試的某些特徵,比如性別和人格特質等。可Many Labs 2的結果證明,在12起案例中這些特徵都無關緊要,實驗結果是相對穩定的。

當重複者在不少實驗中把被試的地域、文化背景當作變數,結果也同樣令人意外:一項實驗若是在一組志願者身上重複成功,在其他組也都是成功的,反之亦然。這個細節尤為重要,因為它反駁了一種最常被提及的說辭——要一個實驗無論在哪都能得到一致的結果,當然是不可能的。

負責該計劃協調工作(也是開放科學中心的成員)的布萊恩·諾賽克(Brian Nosek)說:「他們會說,你沒能重複實驗?肯定是因為你是在俄亥俄州做的,而我是在弗吉尼亞州做的,兩個地方的人不一樣。但我們的結果證明,重複實驗失敗的理由沒那麼好找。

圖 | Yiran Ding / Unsplash

不過,人類行為的文化差異並非無關項。許多研究人員指出,來自經濟狀況好、教育水平高的西方工業化民主國家,也就是所謂的「怪異」(WEIRD)國家的志願者,他們的思維和其他地方的人不太一樣。因而,相關研究也就更容易出現差異性。

在Many Labs 2的絕大部分實驗中,「怪異」國家和其他國家的志願者沒有體現出重要差異。但有人指出,這些分析並不嚴謹,因為「非怪異」國家的人被當成了一個整體。跨文化研究應該將所有的文化背景考慮在內,並單獨分析它們的影響。

諾賽克接受這一質疑。他很希望看到大規模重複項目囊括更多非西方社會的志願者,並著眼於那些可能與「非怪異」國家的多樣性息息相關的現象。

圖 | Pixabay

重複危機的確存在,但未來沒那麼絕望

心理學家桑傑·斯瑞瓦斯塔瓦(Sanjay Srivastava)認為,Many Labs 2實驗結果的相對一致性其實是個好兆頭。一方面,它表明大規模重複失敗很可能就是學術不端行為導致的。但另一方面,實驗結果缺乏差異恰恰意味著心理學的本職工作做得很優秀:研究人員成功地把參差錯落、難以捉摸的人類心智塞進了實驗室里

「實驗室之外的真實世界裡,現象可能隨情境而變。」他說,「但在我們經過嚴謹設計的研究和實驗中,結果的混沌和不可預測性消失了。這意味著我們能夠實施可供驗證的社會科學研究。」

圖 | 圖蟲創意

如果情況與之相反,那才是心理學真正的噩夢。如果我們發現人類實在太善變,連最嚴格的重複實驗都導致了五花八門的結果,「那麼我們就沒法解釋這些實驗,連陽性結果都無據可依了。」斯瑞瓦斯塔瓦說,「如果真是這樣,我們可以不把重複失敗當回事,但那些原始研究也淪為了笑話。長遠來看,Many Labs 2帶給我們的結果是積極樂觀的。」

作者:Ed Yong

編譯:有耳

編輯:EON、Ent

編譯來源:

The Atlantic, Psychology』s Replication Crisis Is Running Out of Excuses

參考文獻:

The Atlantic, Psychology』s Replication Crisis Is Running Out of Excuses

Nature, Replication failures in psychology not due to differences in study populations

Science, Estimating the reproducibility of psychological science

https://psyarxiv.com/9654g/

Slate, Everything Is Crumbling

一個AI

其他學科的別幸災樂禍,你們日常做實驗不也是玄學嘛。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 果殼 的精彩文章:

擱以前,什麼樣的人能穿貂兒?
起底故宮彩妝「奪嫡」大戲,究竟誰家產品值得買?

TAG:果殼 |