全文共2598字,預計學習時長8分鐘
生活中,我們常常需要在變化了的或者不確定的情況下做出決策,這時,貝葉斯定理就是你的最佳助手。它本應用於日常生活為人們創造價值,但卻局限在了教科書和機器學習應用程式領域。到了該解放它的時候了!
也許你知道貝葉斯定理的含義,但是卻從不知道該如何使用它,在看到「紅酒可降低患痴呆症風險」這樣的標題時無法立刻想到這與貝葉斯定理有關。那麼,本文將幫你熟練掌握它。
首先,筆者將回顧貝葉斯定理,探討為什麼筆者認為它很難記住,並用敏感性和特異性來表述。接下來,筆者將探討幾種運用貝葉斯公式對新聞中經常出現的挑釁性言論做出適當反應的方法。最後,筆者會列出一些平常使用貝葉斯定理的注意事項並對文章內容加以總結。
在正式開始之前,筆者將定義所有出現的術語:
1. 貝葉斯定理告訴人們在給定新條件的情況下如何修改某些結果的概率估計。在日常生活中,當有更多證據顯示時,該定理有助於更新人們的看法或確定某一結果(比如癌症)在某種情況下(比如抽菸)是否更有可能顯著出現。
2. 人們需要三種信息來正確更新自己對某一結果的看法:結果的基礎比率、證據的敏感性和特異性。新聞往往只能提供敏感性。
3. 在沒有這三種信息的情況下,請試著自己填補信息的空白,並警惕那些有著極高/極低基礎比率或證據的邊際概率很高的情況。
貝葉斯定理的敏感性和特異性
貝葉斯定理告訴人們在給定新證據的情況下如何計算某一結果的後驗概率。後驗概率表示為P(A|B)的條件概率。
當該公式由一堆字母表示時,很容易把它們混淆,忘記誰是分子誰是分母。因此,筆者喜歡用結果和條件來表示。
從數學上講,確實沒有理由將一個事件稱為「結果」,而將另一個事件稱為「條件」。但在現實生活中,有些事情是人們想要了解卻又無法直接測量的——比如,得癌症的可能性。這是一種結果,而醫學診斷結果之類的證據是用於估計此類結果概率的條件。
P(outcome)指的是人們感興趣事物的先驗概率或基礎比率。它與人們看法更新的概率成正比是有道理的,否則,人們一遇到新證據就會改變他們之前的看法。
P(condition)稱為條件的邊際概率,將其視為一個實體可能有點奇怪。這是在結果為真或不真的情況下,觀察人們擁有的條件或證據的總概率。
接下來是另外兩個術語:敏感性和特異性。比如說,有70%的醫學生彈鋼琴。這意味著以彈鋼琴作為醫學生身份的證據的敏感性為70%。
不過可以肯定的是,是否是一名鋼琴演奏者並不能有力地證明某人是否是醫學生,特異性低是其中的一個原因。也就是說,很多不是醫學生的人也會彈鋼琴。
為了使某個條件能對結果的概率產生極大的影響,其必須具有高度的敏感性和高度的特異性。此外,為了得出後驗概率的估計值,除了證據的敏感性和特異性之外,人們還必須對結果的基礎比率有所了解。
下面是對貝葉斯公式的改寫,這與上述直覺一致:
筆者發現新聞報導通常不會提供全部必要細節來幫助人們得出完全基於數據的看法。貝葉斯定理告訴人們調整看法的程度往往是違反直覺的,特別是在處理罕見事件的時候。「90%感染新冠肺炎的人穿有鞋帶」無疑是合理的,筆者將告訴你如何避免對這樣的陳述反應過度。
需要注意的情況
同樣,計算結果的後驗概率需要三種信息:結果的基礎比率、條件的敏感性、條件的特異性。如果敏感性或特異性沒有什麼特殊情況(~0.5),那麼就說明後驗概率和基礎比率相差不大。
在這種情況下,如果人們當前的行為是由自己的思想來引導,那麼就有可能不需要調整自己的認知來對新數據做出解釋。但是,如果新聞只提供一種或兩種信息,那該怎麼辦呢?可採取如下選擇:
· 承認自己無法有意義地合併新數據,然後把這件事拋諸腦後。
· 判斷缺失的信息。
在某些情況下,確實無法判斷出丟失的信息,但是過度依賴這種選擇是很危險的。新聞中經常會提供敏感性因素,而查找基礎比率和邊際概率(也就是特異性)也不是一件難事。只要估計值表現出低基礎比率、高邊際概率或高基礎比率,筆者就會警惕。
低基礎比率
「90%的天才兒童的母親說她們在懷孕期間食用了貝類。」
這句話中,人們感興趣的結果(有一個智力超群的孩子)是很少見的。這意味著除非要測試的條件在敏感性和特異性方面極為苛刻(如果未在科學期刊中直接報導,可能就不會如此),否則後驗概率也可能很低。
高邊際概率
「幾乎所有尋求抑鬱症心理諮詢服務的美國大學生都擁有智慧型手機。」
和擁有帶鞋帶的鞋一樣,目前擁有智慧型手機也十分普遍,但抑鬱症心理諮詢服務不是這樣。換句話說,擁有智慧型手機的邊際概率很高。這可能是一個警告信號,表明該條件的特異性很低。
換句話說,可以假設幾乎所有未尋求抑鬱症心理諮詢服務的大學生也都擁有智慧型手機,這意味著擁有智慧型手機並不是學生尋求諮詢服務的有力證明。
高基礎比率
「95%的坐過飛機的人都沒活過100歲。」
先別急著退機票,請考慮這樣一個事實:活不到100歲的現象相當普遍。在100歲之前死亡的可能性很可能低於基礎比率。無論如何,後驗概率的差異可能都不足以保證生活方式的改變。
注意事項和總結
本文希望為各位提供的看待貝葉斯定理的另一種角度,能讓其更直觀、更容易應用於日常生活當中。但功能越強大,責任也越大,所以請留意以下注意事項:
· 不要因為新聞沒有明確提供使用貝葉斯規則所需的所有要素就對其持全盤拒絕的態度。如果用它去過濾自己不喜歡的新聞,很可能導致有動機的懷疑主義的風險。
· 即使確定了某些新信息並不能完全改變自己的看法進而改變自己的行為,那也並不意味著這些信息絲毫沒有改變自己的看法。如果越來越多的證據指向同一件事,那麼最終整體的看法也將發生改變。忘掉所有的證據而回歸到先前的證據不會起作用,你會認為原來的證據不夠充分。
· 雖然筆者在上述示例中直接給出了敏感性,但新聞標題往往會直接顯示結果(比如「智慧型手機會增加患抑鬱症的機率」),而隨後只會在主體部分中給出證據的敏感性。這樣的標題黨太多了。
記住以上這幾點,也許你能以一種更為慎重、更具數據思維的方式來面對各類信息。不過即使這樣,傳聞類證據仍是毫無價值的。
留言點讚關注
我們一起分享AI學習與發展的乾貨
如轉載,請後臺留言,遵守轉載規範