橘子OR藍莓?這個例子讓你精通貝葉斯定理

2021-01-11 讀芯術

全文共2450字,預計學習時長5分鐘

貝葉斯定理可能是數理統計與概率論領域最重要的定理。因此,該定理經常應用於數據科學領域。本文將通過實際問題對貝葉斯定理進行直觀推導。

簡介

以18世紀英國數學家託馬斯貝葉斯命名的貝葉斯定理是確定條件概率的數學公式,其在數據科學領域具有重要意義。例如,貝葉斯定理的眾多應用之一是統計推理的一種特殊方法---貝葉斯推理。

貝葉斯推理是在獲得更多證據或信息時運用貝葉斯定理對假設概率進行更新的一種方法。貝葉斯推理已在廣泛領域內得以應用,包括科學、工程、哲學、醫學、體育和法律。

例如,在金融領域,貝葉斯定理可用於評估向潛在借款人提供貸款的風險。在醫學領域,該定理可根據人們患病的可能性與測試的一般準確性來確定醫學測試結果的準確性。

現在讓我們看一些實際問題:

問題陳述

假設現有兩個碗,X與Y,碗裡都裝滿了橘子和藍莓,並且你很清楚每個碗裡有多少橘子和藍莓。若我問你,從X碗裡取出橘子的可能性是多少,那你能準確說出其概率。因為碗X裡橘子和藍莓共11個,其中3個是橘子,故取出橘子的概率是P(橘子)=3/11。

碗X和碗Y內都裝滿了橘子和藍莓。

相反案例:

現進行隨機抽取,取出的是一個藍莓,並且假設我們不知其來自碗X還是碗Y,你能說出藍莓是從哪個碗內取出的概率嗎?

該問題可用貝葉斯推理來解答。

貝葉斯定理推導

為推導出貝葉斯定理,我們將進行一個模擬實驗:擲骰子。當骰子的點數小於等於4時,從碗X內隨機取出一個物品,當點數大於等於5時,則從碗Y內隨機取出一個物品,重複進行300次(N=300)。簡單起見,將上述物品簡稱為:

Blueberry:=B, Orange:=O, Bowl X: =X, Bowl Y:= Y

當一枚均勻骰子連續擲300次(N=300)後,我們將得到關於從兩個碗裡取出的物品數量的統計結果。該實驗的假設結果如圖1所示。其中,s代表碗或取出的物品的「來源」,y是可觀察變量(藍莓或橘子)。

圖1:統計結果

該表顯示:

從碗X中取出藍莓的次數為148: n(s=X, y=B)=148從碗Y中取出藍莓的次數為26:n(s=Y, y=B)=26從碗X中取出橘子的次數為51: n(s=X, y=O)=51從碗Y中取出橘子的次數為75:n(s=Y, y=O)=75

根據這些統計數字,現提出一些有趣的問題:

從碗X中取出隨機物品的概率為多少?

為得出此概率,即P(s=X),我們須用僅從碗X中取出的物品數除以總物品數N=300。這裡,n(s=X, y=B)=148表示從碗X中取出的藍莓數量,n(s=X, y=O)=51 表示的是從碗X中取出的橘子數量。由此,我們得出從碗X中取出隨機物品的概率,如下:

公式1:從碗X中取出隨機物品的概率

注意:該概率被稱為「先驗概率」。在貝葉斯統計推理中,先驗概率是在數據收集前事件的概率。該案例中p(s=X)告訴我們的是從碗X中抽取隨機物品的概率,但該物品是橘子還是藍莓未知。

同樣,從碗Y中取出隨機物品的概率p(s=Y)為:

公式2:從碗Y中取出隨機物品的概率

取出橘子或藍莓的概率為多少?

這次我們想知道在不考慮特定碗的情況下取出橘子或藍莓的概率。該概率可分別表示為p(y=O)和p(y=B)。計算方法與前一案例類似。我們用取出特定物品的次數除以總抽取次數,由此得出的概率可用公式3和公式4表示。如下:

公式3:取出橘子的概率

公式4:取出藍莓的概率

從碗X中取出藍莓的概率為多少?

現在我們來計算聯合概率p(s=X, y=B),其表示的是從碗X中取出藍莓的可能性。

注意:聯合概率是指事件1與事件2同時發生時的概率。在該案例中,事件1是「從碗X中進行隨機抽取」,而事件2是「取出的物品為藍莓」。

該聯合概率可用從碗X中取出藍莓的次數除以總抽取次數來計算,如下:

公式5:從碗X中取出藍莓的概率

同樣,從碗Y中取出藍莓的概率為:

公式6:從碗Y中取出藍莓的概率

另外,從碗X中取出橘子的概率為:

公式7:從碗Y中取出藍莓的概率

假定已對碗X進行隨機抽取,那麼取出的物品為藍莓的概率為多少?

現在問題變得有趣了。讓我們來計算第一個條件概率。在該案例中,可以確信的是我們從哪個碗中進行隨機抽取,例如,我們從碗X中抽取。基於此,我們可以計算出從碗X中取出藍莓的概率。

該條件概率可用p(y=B| s=X)表示,其中s=X表示該條件為「從碗X中進行隨機抽取」。為計算出 p(y=B| s=X),我們須用從碗X中取出藍莓的次數除以從碗X中取出的總物品數,如下:

公式8:給定條件為從碗X中隨機抽取時,取出藍莓的概率

乘積規則

現在讓我們來看看第一個重要統計規則。這裡我們用先前得出的從碗X中取出藍莓的概率 p(s=X, y=B),然後通過分子分母同時乘以(n(s=X,y=B)+n(s=X, y=O))對該公式進行擴展,該擴展不會改變概率p(s=X, y=B)的值。

現在仔細觀察該公式,就會發現 p(s=X, y=B)的新的表達式是由先前得出的其他兩個概率p(y=B|s=X)和p(s=X)的乘積組成。

公式9:乘積規則

我們稱概率間的這種關係為乘積規則。該規則可通過條件概率p(y=B| s=X)和先驗概率p(s=X)來計算聯合概率p(s=X, y=B)。

求和定則

現在,讓我們重新看一下先驗概率p(s=X ),其表示從碗X中取出隨機物品的可能性。若將該公式分為兩個被加數的和,如公式10第二行所示,可觀察到被加數正是我們先前得出的兩個聯合概率。

公式10:求和規則

我們稱此關係為求和規則。該規則可通過聯合概率的相加計算出先驗概率 p(X)的值。該聯合概率包含先驗概率中的隨機變量 p(X)和任何其他隨機變量y。

貝葉斯規則

在乘積規則中,聯合概率中的隨機變量的順序無關緊要。因此 p(s,y)和p(y,s)的值相等。

公式11

如果讓 p(s, y)和 p(y, s)的值相等,並進行重組,我們將得出p(s|y)的一個新的數學表達式。該表達式就是貝葉斯規則。

公式12:貝葉斯定理/法則

最後:藍莓是從哪個碗裡取出的?

貝葉斯定理為我們提供了條件概率 p(s|y)的計算公式,這正是我們最初問題的答案。

我們可用條件y=B來表示已取出藍莓這一事實。為解答藍莓從哪個碗裡取出這一問題,須計算出 s=X和s=Y時各自的概率 p(s|y=B)的值。得出的這兩個值能告訴我們從碗X或碗Y的取出藍莓的可能性。

現在讓我們來計算s=X時的值。幸運的是,我們需要的概率都已在前述部分計算得出。若將這些概率的值代入公式13 p(s=X|y=B)中,我們將得出以下結論:在已取出藍莓的條件下,從碗X中取出該藍莓的概率大約為86%。該計算方法與其他案例類似,如下:

公式13:貝葉斯定理

若沒有貝葉斯定理,計算出概率 p(s|y)將會非常困難。不過,貝葉斯定理讓我們通過更容易計算出的概率對此概率進行計算。貝葉斯定理的神奇之處就在於:用容易計算出的概率來表示難以計算的概率。

相關焦點

  • 懂貝葉斯定理,學會理解生活
    此時,你一定在想有沒有什麼方法,能讓我們更好地「摸著石頭過河」?沒錯,答案就是題目中的貝葉斯定理。高中的讀者在概率的部分應該會學習到它。當然,沒有聽說過也不要緊,在下面的文章中,會有關於它的解釋。就是這樣的一個數學定理,能讓我們更好地做出決定,更好地理解事物。接下來,就讓我們一起來了解一下這個定理,以及它如何能讓我們的生活變得更好吧!
  • 貝葉斯定理:AI不只是個理科生
    貝葉斯方法則建立在主觀判斷基礎上,你可以先估計一個值,然後根據客觀事實不斷修正。從主觀猜測出發,這顯然不符合科學精神,所以貝葉斯定理為人詬病。1774年,法國的大數學家拉普拉斯也看到貝葉斯定理的價值。就知道你沒看懂……那還是舉個例子吧!我們以COVID-19疫情為例。假設COVID-19的發病率是0.001,即1000人中會有1個人得病。某病毒研究所研發出了一種試劑,可以用來檢驗你是否得病。
  • 為什麼樸素貝葉斯定理會被叫做樸素的?
    樸素貝葉斯算法是一種基於著名貝葉斯定理的分類算法。那麼讓我們先了解一下Bayes定理是怎麼說的,並為樸素貝葉斯算法定理建立自己的理解,它是如何工作的,它為什麼被稱作樸素的?貝葉斯定理在深入研究貝葉斯定理之前,我們需要了解一些術語-獨立事件和從屬事件邊際概率聯合概率條件概率獨立事件和從屬事件考慮兩個事件A和B。
  • 貝葉斯定理:AI 不只是個理科生 | 贈書
    這個問題就是逆向概率問題。通俗地講,就像一個迷信星座的HR,如果碰到一個處女座應聘者,HR會推斷那個人多半是一個追求完美的人。這就是說,當你不能準確知悉某個事物本質時,你可以依靠經驗去判斷其本質屬性。這個研究看起來平淡無奇,名不見經傳的貝葉斯也未引人注意。他寫的論文直到他死後的第二年,才由他的一位朋友在1763年發表。
  • 貝葉斯定理的通俗理解
    樸素貝葉斯是一種基於貝葉斯定理的簡單概率分類器(分類又被稱為監督式學習,所謂監督式學習即從已知樣本數據中的特徵信息去推測可能出現的輸出以完成分類
  • 貝葉斯定理
    此前有業內人士將期貨交易比喻為「賭博」,而貝葉斯定理或許是個提高獲勝率的好辦法。【貝葉斯定理】貝葉斯定理也稱貝葉斯公式,是關於隨機事件A和B的條件概率或邊緣概率的一則定理,指當分析樣本大到接近總體數時,樣本中事件發生的概率將接近於總體中事件發生的概率。
  • 貝葉斯定理:多一點人生經驗還是有用的
    總覺得哪裡不對可能很多人對貝葉斯定理這個名詞還很陌生,但是大家在生活中都會不自覺地用到它,只是很多時候,我們用反了。有趣的是,從概率論的角度來說,這個直覺思維有一個很具有啟發性的科學解釋。生活中遇到的事情跟前面兩個故事差不多。想要男孩卻生了好多胎女兒,我們下意識的認為肯定是男方有問題;輪盤開了10把黑,是不是有人在作弊搞鬼出老千?這些直覺思維都是遵從了貝葉斯定理。
  • 極具震撼力的貝葉斯定理,作為數據科學人的您咋能錯過?
    作者 | KHYATI MAHENDRU編譯 | CDA數據分析師An Introduction to the Powerful Bayes' Theorem for Data Science Professionals概述貝葉斯定理是統計學中最強大的概念之一,而貝葉斯定理也是數據科學專業人員必須知道的定理熟悉貝葉斯定理,其工作原理及其多種多樣的應用本文中有許多直觀的例子來理解貝葉斯定理背後的思想介紹
  • 形象理解貝葉斯定理
    每當你閱讀任何概率書、博客或論文時,大多數時候你會發現這些書中的講解太過理論化。據研究,65%的人是視覺學習者。以圖形方式理解定理和證明是一種可視化信息和數據的有效方式,而且不僅以可視方式呈現數據已被證明長期有效。因此,本文以可視方式透徹展示、講解概率概念。本文安排如下:1. 什麼是條件概率?2. 總概率定律3. 貝葉斯定理4.
  • 基於貝葉斯定理的算法——樸素貝葉斯分類
    不過今天我們介紹的樸素貝葉斯分類器通過獨立假設簡化了概率的計算,節省了內存,可以很好地用於數據量大的情況。下面我們首先來了解這一算法的數理背景——貝葉斯定理。這一算法是由我們在概率論中學到的貝葉斯定理延伸出來的。我們知道貝葉斯公式為:其中,
  • 貝葉斯定理為何能名滿天下?AI從此不再只是個理科生
    這就是說,當你不能準確知悉某個事物本質時,你可以依靠經驗去判斷其本質屬性。 這個研究看起來平淡無奇,名不見經傳的貝葉斯也未引人注意。 貝葉斯方法則建立在主觀判斷基礎上,你可以先估計一個值,然後根據客觀事實不斷修正。 從主觀猜測出發,這顯然不符合科學精神,所以貝葉斯定理為人詬病。
  • 30分鐘了解貝葉斯定理――AI產品經理了解的數學知識系列
    貝葉斯定理提供的是一種逆條件概率的方法,本文簡單總結了貝葉斯定理是什麼,貝葉斯定理應用的理解,以及貝葉斯定理在AI場景下的應用,目的是希望產品經理了解到這個定理的能力後,在設計相關推薦或是具有推理功能的應用場景,能通過貝葉斯定理來解決。
  • 「貝葉斯定理」在生活中很有用,它到底是如何算出來的?
    許多學生因此強記上述公式以準備考試,只求能解題而不求理解;公式反而成為學習貝葉斯定理的主要障礙。本文的主要目的是要破除許多學生對於貝式定理「困難又不實用」的刻板印象。事實上,我們生活之中有許多情況必須要運用貝式定理的邏輯思考,否則便容易產生偏差甚至陷於謬誤。被撞到的都是好人?讓貝葉斯定理算給你看看
  • 透徹理解貝葉斯推理
    例如,如果我們想要在炎熱和陽光明媚的日子裡找到銷售冰淇淋的概率,貝葉斯定理為我們提供了工具,可以使用先前的知識,了解在任何其他類型的一天銷售冰淇淋的可能性(下雨,颳風,雪等)。我們稍後會詳細討論這個問題,所以如果你還沒理解它,請不要擔心。
  • 貝葉斯定理還能用來把妹......
    這個是由貝葉斯定理,結合劉同學嘗試的結果,重新估計小姐姐對劉同學好感度的公式,對於這種無法進行大量重複實驗求取其概率的情況,貝葉斯派的做法是:先假設一個非常主觀的概率,然後通過反覆測量(觀測/嘗試),來修正這個概率,使其變得客觀。而超模君讓劉同學去試探一下,就是為了獲取本次的觀測結果。這個是之前超模君盲猜的妹子對劉同學的好感度,也就是貝葉斯定理中的先驗概率(先於試驗/觀測的概率)。
  • 奧卡姆剃刀和貝葉斯估計
    例子3: 誰把花盆砸了假設你一天晚上到家,看到你擺在客廳裡的一盆花被砸在地板上,除了這盆花之外,家裡沒有任何其他的變化。你腦子裡立刻列出幾個可能的原因(1)花盆被一個鬼魂撞倒了,(2)花盆被一個偷偷闖入你家裡的人碰倒了,並且他沒有拿任何東西。(3)花盆被你家養的貓弄砸了。首先,這三個原因都可以很好的解釋這個現象。
  • 樸素貝葉斯算法及其應用
    在這篇文章中,我們將嘗試以簡單的方式理解什麼是樸素貝葉斯,它是如何工作的以及我們如何應用樸素貝葉斯分類器將文本或評論分類為「肯定」或「否定」,我們將通過電影評論案例進行研究。什麼是樸素貝葉斯?貝葉斯定理是由Reverend Bayes開發的最早的概率推理算法之一(他過去常常嘗試推斷上帝的存在)並且對於某些用例仍然表現得非常好。
  • 科普丨樸素貝葉斯了解一下
    要理解樸素貝葉斯,我們首先需要了解貝葉斯推斷。貝葉斯推斷是一種用貝葉斯定理來迭代假設概率的方法。貝葉斯定理是在掌握與相關事件的先決信息下,計算該事件的概率。假設你想計算星期天下午5點得到一個停車位的概率。那麼你如何計算這一事件的概率呢?是的,貝葉斯定理!數學上貝葉斯定理寫為:這裡"B"是一個條件,"A"是一個事件。
  • 條件概率與貝葉斯統計
    如果使用貝葉斯定理來估計那位女性確實患有乳腺癌的概率,我們可以得到(Canc 即貝葉斯定理中的 A,Pos 則是 B):那麼你是否應該將蘑菇做給丈夫吃(如果你不想成為寡婦的話)?3.貝葉斯更新通過應用貝葉斯定理,貝葉斯推理提供了一種理論方法,可以使用新的證據修正先前的可信度。貝葉斯定理可以迭代使用:觀測到一些新證據之後,可以將原來的後驗概率作為先驗概率,並根據新的證據計算出新的後驗概率。
  • 可怕的貝葉斯定理,看完後忍不住感慨數學太重要了
    學多點知識你好我也好今天,超模君來講講貝葉斯定理。眾所周知,貝葉斯定理是一種在已知其他概率的情況下求概率的方法:圖片來源:HackYourself既然開講了,那就不要停下來了。那我們怎麼去理解這個傳說中不黃但很暴力的貝葉斯定理呢,貝葉斯定理是如何暴力狂虐數學界的?