作者 | Dorothy Bishop(牛津大學心理學家)
編譯 | Leon
責編 | 雪月
認知偏差是如何誤導我們的?
過去的十年裡,由於激勵機制的改變(如修改晉升和文章發表的標準、支持論文的開放獲取、不盲目追求「重大突破」等),可靠的、可信的科研工作獲得了越來越多的支持。但是研究人員需要更加注意這些無處不在的「陷阱」。科學家在沒有經過安全培訓的情況下不允許處理危險物質。同理,學者不應該運用p值或類似的統計測量值,除非他們真正理解p值的含義是什麼。認知的偏見會讓我們看到不正確的結果,錯誤的推理會導致質量低下的研究,即使起初的意圖可能是好的。
人們都傾向於忽略那些與我們的結論相矛盾的證據
當我們面對新的數據時,我們會「先入為主」,已經存在的想法會讓我們看到不存在的東西。這是確認偏差(confirmation bias)的一種形式:人們偏向於尋找與自己認知相符合的信息。人們會選擇性地分離重要的信息,但是這種信息的過濾可能導致科學上的錯誤。
1913年,物理學家Robert Millikan對電子電荷的測量就是一個例子。儘管他聲稱,論文包含了油滴實驗的所有數據點。但他的筆記本上還有其他未寫入論文的數據點,這些點只會略微改變最終的值,但會帶來更大的統計誤差。關於Robert Millikan是否有意「選擇數據」,一直存在爭論【1】。
我們對概率和統計存在另一種誤解,因為小樣本中固有的不確定性很難把握【2】。舉個例子,假設5%的人感染了病毒,我們有100家醫院,每家醫院可以檢測25人,另外100家醫院每家可以檢測50人,還有100家醫院每家可以檢測100人。問:有多少醫院檢測不出病例?答案是,可檢測25人的醫院,28%的醫院檢測不出病例。可檢測50人的醫院,這個比例降低到8%,而可對100人進行測試的醫院,該比例只有1%。平均下來,醫院能夠檢測出的陽性病例數是相同的,但在樣本較小的情況下,誤差的範圍要大得多。
這種非線性關係很難直觀地展現出來。人們低估了小樣本的不確定性有多大,進行研究時缺乏檢測所需的統計能力。
研究人員也沒有意識到,p值表示的結果的顯著性在很大程度上取決於你的研究內容。變量越多,你就越有可能得到到一個虛假的「統計學意義」。例如,如果你測試14種代謝物是否與某種疾病有關,那麼至少有一個p值低於0.05的概率不是1/20,而更接近1/2。
研究人員需要養成良好的習慣,避免被確認偏差引入歧途。與我們期望相反的實驗結果需要引起特別的注意。1876年,達爾文說,他習慣把每一個與一般性結果相反的論文或發現記錄下來,因為它們更容易被忘掉。
我們都發現很難看到自己工作中的缺陷:這是人類認知的一部分。但是通過加深對這些盲點的了解,我們完全可以有效避免它們。
原文連結
https://www.nature.com/articles/d41586-020-02275-8
製版人:十一
參考文獻
1. R. C. Jennings Sci. Eng. Ethics 10, 639–653; 2004
2. A. Tversky and D. Kahneman Psychol. Bull. 76, 105–110; 1971