什麼是倖存者偏差?
倖存者偏差,指的是在做統計分析時,我們只專注於那些成功的例子,從而得出以偏概全的錯誤結論。
簡單來講,成功的例子往往只屬於少數,如果我們只看成功的倖存者,而忽略那些大部分的「失敗者」,那麼就會得出很多不符合常理的荒唐結論。
我們先來看下倖存者偏差的故事來源。
二戰期間,為了加強戰鬥機的防護,英美軍方調查了作戰後倖存飛機上彈痕的分布,決定哪裡彈痕多就加強哪裡。然而統計學家亞伯拉罕·瓦爾德(Abraham Wald)力排眾議,指出更應該注意彈痕少的部位,因為飛機有些部位一旦被打中,就是致命的,很難有機會返航,而這部分數據被忽略了。事實證明,瓦爾德是正確的。
生活中我們最容易想到的例子就是讀書無用論,比如說某某人沒上大學,一樣取得了成功,給他打工的都是大學生,這樣的事情當然有,但概率極其的小。正常情況下,讀書少的人都在給讀書多的人打工,而這樣的事大家都覺得理所當然,所以不會有新聞報導,而往往很多人只注意到被報導出來的小概率事件,記住,報導出來的只是個例,我們要看的是沒被報導出來的大多數。
還有如,飛機失事和車禍,哪個概率高?
很明顯,車禍發生概率更高,而且死亡人數也更多,但是因為,飛機失事是大事,一般都會有新聞報導,而車禍很少被報導,或者說車禍因為發生普遍,即使報導出來了,我們一般會忽略,所以,大家得出結論:飛機不安全。。
這就是典型的倖存者偏差問題,事實上飛機遠比汽車安全。
再舉一個生活中我們常見的例子,平常大家刷朋友圈,是不是感覺大家都過得挺好的,其實這也是倖存者偏差,因為大家只會選擇把自己生活好的一面展示出來,這就給了我們一個大家都過得非常好的錯覺。
可以說,倖存者偏差在生活中處處可見,我們要做的就是不要輕易下結論,而是要把正反面的數據找出來做對比,這樣得出的結果才不會落入倖存者偏差的圈套。