2005年8月,期刊PLOS Medicine上發表了一篇文章,題目是《為什麼大多已發表的科學研究結果都是錯的》(Why most published research findings are false)。在這篇文章中,首當其衝受到質疑的對象,就是心理學。
在2010年發表的一篇論文中,研究者發現心理學領域的陽性結果,也就是實驗證實了某個假說的結果比例最高,大約能佔9成。他們懷疑這其中涵蓋了大量的假陽性結果,也就是說某項研究看起來證明了某種觀點,但這其實只是人為或巧合帶來的錯覺。
為了檢驗這些實驗,在過去十年間,一批心理學研究團隊採取了一種簡單粗暴的方法,那就是把過去的心理學實驗重複一遍。他們會嚴格遵循當時的實驗方法、實驗材料,遵循或適當改進實驗方案,並且大量增加樣本量。
終於,2015年8月,一部分重複結果發表在了Science上,其中,270位研究人員共同重複了100項心理學實驗。然而研究結果卻令人震驚:僅有36%的實驗驗證了當初發表的結論。我們都知道,想要判斷一個科學發現的質量,可重複性是一個重要的指標,這項研究引發了一場地震:難道三分之二的心理學研究都是假的嗎?心理學究竟還靠譜嗎?
在回答這個問題之前,先讓我們看看都有哪些理論遭到質疑:
實驗一:
2010年哥倫比亞大學的研究者發現,有一種 「徵服者姿態」特別好用。這個姿勢是將雙手高舉,形成V字。論文把這個姿勢命名為power posing,並且說這種姿勢能讓睪酮水平上升,與壓力有關的皮質醇水平下降。其結果就是,做出這個姿勢的人,會覺得自己變強了。
實驗二:
2012年,普渡大學的研究者針對著名的「艾賓浩斯錯覺」進行了一項實驗。艾賓浩斯錯覺指的是當一個圓形被較小的圓所包圍的時候,看起來會比被較大的圓包圍的時候要大。而在2012年的這項研究中,研究者在高爾夫場地裡製造了這種錯覺,他們提出,當我們讓球洞看起來更大的時候,玩家就更容易把球打進洞裡。
實驗三:
20世紀70年代,奧地利心理學家瓦爾特米舍爾提出了你經常在雞湯文中讀到的案例:「棉花糖測試」。米舍爾找了一批4-5歲的孩子,分別發了一塊棉花糖,並且讓他們自己待著。他告訴孩子們:我過一會就回來了,如果那時你們還沒吃掉第一塊棉花糖的話,就能得到第二塊。隨後米舍爾追蹤了這些孩子的成長軌跡,發現那些當年成功抵制了誘惑的孩子,在各個方面都更加成功。
經過重複驗證,這三項實驗的結果全部被推翻了。在power posing問世5年之後,瑞士蘇黎世大學的研究者將樣本量從原始研究的42人,增加到了200人,卻沒能得到同樣的結論。對於高爾夫場裡的艾賓浩斯錯覺,也沒能得到成功重複,並且研究者還注意到,原論文可能操縱了實驗數據。而對於著名的「棉花堂測試」,2018年的一項重複研究對918人進行了10年以上追蹤觀察,研究者發現,棉花糖實驗的預測能力並沒有米舍爾所說的,以及人們想像中的那麼強。
除此之外,還曾有研究「證明」了以下結論:
1、當想著一個沉重的秘密時,我們會將山丘的坡度高估13°,因為感覺自己快完蛋了。
2、如果用牙齒咬著一根鉛筆,我們會覺得一幅圖更加有趣,因為我們被迫做出了微笑的表情。
3、在一場智力桌遊中,想像一位教授的形象能讓我們表現得更好,因為人們通常會把教授和智慧聯繫起來。
4、在照片上笑得更真誠的人將更加長壽,因為微笑表明這個人更容易流露積極情緒,進而能更好地應對壓力。
這些研究聽起來都很有趣,也因此往往能得到大量曝光。根據google scholar的統計,咬著比的研究已經被超過2000篇論文引用。而「power posing」研究的參與者之一,就曾在TED大會上建議求職者在面試前做出這個姿勢。同一場大會,她之後的演講者,則介紹了嘴裡咬著筆的研究,這場大會錄像的觀看次數,已經超過了5000萬。然而我們很遺憾地告訴大家,過去十年間的重複實驗推翻了以上所有的發現。
那麼我們回到開頭的問題:心理學還靠譜嗎?事實上,過去十年間心理學的可重複性危機,更像是一個好消息,這意味著心理學成為了少數走上了自我修正道路的學科之一。在大量的重複實驗中,即使是失敗的重複也常常能為心理學家帶來新的認知,或是引入原始研究中沒有的維度。
比如那個打高爾夫球的重複實驗,失敗的重複幫心理學家排除了一個錯誤答案。這項研究的核心問題是:大腦中負責形成有意識圖像的通路,和其他利用視覺控制動作的通路是相互獨立的嗎?而最終的結果證實確實如此,因為儘管被試感覺球洞變大了,但在打出高爾夫球時,他們大腦中形成的無意識圖像並沒有受到艾賓浩斯錯覺的影響。
而有時候,即使重複實驗失敗了,但也並不意味著原始研究的結論是錯的。比如我們之前提過的,桌遊與教授的實驗。它背後的理論其實是心理學中的經典效應「啟動效應」。其實大量心理學研究已經證明了,語言或他人能在無意識中影響我們的判斷和決策,尤其是通過激活刻板印象的方式。儘管在這項研究中,它沒能被重複出來,或者說教授的形象並沒有「啟動」我們大腦中的那一點智慧,但啟動效應仍然是個經得起檢驗的心理學現象,啟動效應領域所發表的眾多研究也依舊是有效的。
因此我們會發現,心理學這門科學的基石依然穩固。可重複性危機並沒有推翻整個領域,恰恰相反,「潮水退去,才知道誰在裸泳」。這場危機恰恰提升了心理學自我質疑的能力,使其變得更加成熟。
我們需要知道的是,科學的認識永遠是暫時的,知識是種種建構,它們有朝一日都會被結構,從而得到更好地重構。正如美國天文學家菲爾·普萊特所言:「科學的一部分過程,就是承認我們有時會犯錯。這可能會非常、非常困難。但它的另一面是最美好的,那就是更進一步的認知和理解。」