我們都聽過一句俗語,叫做「好人不長命,禍害遺千年」。每當遇到什麼天災人禍,老人們就愛說這話,就像遇到車禍的人,大多數是好人,然而車子真的會選人來撞嗎?
顯然是不可能的。在這件事情上,我們大多數人都犯了謬誤,忘記了一個客觀的情況:壞人只佔這世界上的一小部分,絕大多數人都是好人,所以車禍中受傷害的自然是好人多了。我們在理解生活中一些問題時,經常會忘記一些事情的先決條件。
除此之外,在更多的情況下,我們甚至根本不知道這些先決條件(信息),這不光會影響我們對事物的理解,還會影響我們做出任何決定。
此時,你一定在想有沒有什麼方法,能讓我們更好地「摸著石頭過河」?
沒錯,答案就是題目中的貝葉斯定理。高中的讀者在概率的部分應該會學習到它。當然,沒有聽說過也不要緊,在下面的文章中,會有關於它的解釋。就是這樣的一個數學定理,能讓我們更好地做出決定,更好地理解事物。
接下來,就讓我們一起來了解一下這個定理,以及它如何能讓我們的生活變得更好吧!
貝葉斯定理
要理解貝葉斯定理,我們先來看一個「對方到底喜不喜歡你?」的例子。李雷經常單獨找韓梅梅聊天,而韓梅梅想知道李雷是不是喜歡自己。在這裡,李雷喜歡韓梅梅是事件A,而李雷經常和韓梅梅聊天是事件B。
在這裡,我們先認識一些數學符號,P(A)表示A發生的概率,P(B|A)表示在A發生的條件下,B發生的概率,P(A∩B)則表示A和B兩事件都發生的概率,其他同理。
根據條件概率的定義,在事件 B 發生的條件下事件 A 發生的概率為:
同樣地,在事件 A 發生的條件下事件 B 發生的概率為:
通過P(A∩B),我們可以得到:P(A)×P(B|A)=P(B)×P(A|B),進行簡單的變換,就可以得到著名的貝葉斯定理了:
以上是我們得到最基本的貝葉斯公式的推導過程。在貝葉斯定理中,A是你要考察的目標事件(如喜不喜歡韓梅梅),P(A)是在沒有其他任何信息幫助下,這個目標事件的概率,被稱為初始概率。公式左邊P(A|B)是指當發生B事件(如單獨聊天)後,我們得到的新的觀察,被稱為後驗概率,也就是我們最終尋求的事件概率。
在現實生活中,我們大腦決策的過程就是應用貝葉斯定理的過程。我們的手中只有有限的信息,而決策就是要利用有限的信息,儘量做出一個最優的預測。正如法國著名的天文學家和數學家皮埃爾·西蒙·拉普拉斯所說的一樣:「人生最重要的問題,在絕大多數情況下,真的就只是概率問題。」
概率是個主觀值,完全就是我們自己的判斷,我們可以先估計一個初始概率 ,然後每次根據出現的新情況,掌握的新信息,對這個初始概率進行修正,隨著信息的增多,慢慢逼近真實的概率。這個方法完美的解決了信息少的問題,我們不用等樣本累積到一定程度,先猜一個就行動起來了。
讓我們回到李雷和韓梅梅身上。韓梅梅如何推測李雷喜歡自己的概率呢?首先,韓梅梅只能主觀想出一個初始概率,在沒發生B(李雷單獨找韓梅梅聊天)之前,韓梅梅推測李雷喜歡自己的概率很低,只有5%(P(A))。
假設如果一個人喜歡另一個人,那麼他經常找對方聊天的概率是80%;一個人不喜歡另外一個人,他經常找對方聊天的概率只有20%。即P(B|A)=0.8,P(B|非A)=0.2。
注意經常找對方單獨聊天的情況存在兩種:喜歡並單獨聊天或不喜歡也單獨聊天,因此P(B)=P(B|A)×P(A)+P(B|非A)×P(非A)=0.8×0.05+0.2×0.95=0.23。
在李雷喜歡找韓梅梅聊天的情況下,李雷喜歡韓梅梅的概率漲到了:P(A|B)=P(A)×P(B|A)/0.23=0.05×0.8÷0.23=17.4%。
如果隨著韓梅梅後來的觀察,她又發現了別的「蛛絲馬跡」,如李雷經常偷看自己,那麼利用貝葉斯定理,李雷喜歡韓梅梅的概率肯定還會進一步上升。
別忘了先決條件
或許有人會說,這不就是常識嘛,新情況(信息)和自己原來預期得一致,就強化原來的看法,否則就弱化,用得著弄這麼複雜嗎?
的確,人腦思維的方式和貝葉斯定理是一致的。但是我們的大腦有一種證實傾向,即我們往往會高估了新情況的作用,但是貝葉斯定理不會,它會糾正我們的認知偏差。
我們再舉一個貝葉斯定理的經典例子。現在的醫藥檢測手段越來越先進,某種罕見病檢測結果的準確度為99%。如果小張去醫院做檢查,檢測結果為陽性,那麼小張真的得病了的概率是多少呢?
如果缺少貝葉斯思維,你肯定會想當然地說出來,不是99%嗎?可是你別忘了,該疾病是一種罕見病。
我們使用貝葉斯定理,A表示「真的患病」,B表示「檢測呈陽性」。根據現有條件,P(B|A)=99%,P(B|非A)=1%。假設一般人群中罕見病患者的比例為0.5%,即P(A)=0.005。代入公式:
儘管檢測的準確度高達99%,但貝葉斯定理告訴我們,哪怕這個人真的被檢測到陽性,他真的患病的可能性也只有33%左右,沒有患病的可能性比較大。在醫學中,沒病,但是檢測結果顯示有病的情況稱為假陽性。一般,像愛滋病等罕見疾病檢測第一次呈陽性的人,還需要做第二次檢測,第二次依然為陽性的還需做第三次檢測。
同樣地,我們也可以從中得到一些啟示,貝葉斯定理可不僅僅是計算,更是一種思考方式。
首先,初始概率其實很重要,初始概率越準確,得到真實的概率就越快速、越容易。
其次,我們在生活中,遇到一些問題,不應該反應過度,因為事情可能並沒有我們想像得那麼糟。在思考時,不要忘記將客觀情況考慮在內。
再次,我們要充分重視突然出現的特殊情況。在例子中,我們已經看到了,千分之幾概率的事情,因為特殊情況出現,概率一下子就提高了60多倍。因此,每當出現特殊、罕見情況的時候,我們要保持高度警惕,當然,這也要結合檢測精度來考慮。
最後就是一定要先行動起來,大膽假設,小心求證,不斷調整自己的看法。當信息不完全時,我們要先做一個預判,先行動起來,而不是乾等著,白白錯過時機。
除了對我們生活的指導,貝葉斯定理在基因分析,預測基因變化的概率方面也有非常重要的應用。教育學家也發現,孩子學習的過程也是一個貝葉斯預測的過程。股票市場、期貨市場、垃圾郵件過濾和人工智慧等也會用到貝葉斯定理,感興趣的小夥伴可以多多了解一下。