全概公式與貝葉斯公式是概率論中的兩個重要公式,是求隨機事件概率的兩類方法,二者之間有明顯的區別,下面先來了解一下全概公式。
一、全概公式
全概公式求事件概率的思想是對事件進行劃分,然後求和。如下圖把事件A拆分成5個兩兩互不相容的部分,然後將這5部分的概率求和即可。
那麼問題來了,應該如何將事件劃分成幾個兩兩互不相容的事件呢?
例1 從東昌學院南門口出來一學生,從遠處看看不清楚穿衣打扮,求其穿長褲的概率.
因題目中缺少其它條件,暫不能求具體值.我們先分析一下事件」 穿長褲」.
令A=」 出來一學生,穿長褲」,可以這樣分:
這樣就把A分成了兩部分,且互不相容.如果題目中給出男女生的比例以及男女生中穿長褲的比例即可求解.
劃分的關鍵是對A選擇一個角度進行分類,從來人性別方面分成了男女兩類,實際上也可以這樣分:
這是按照學生的年齡來劃分的.
通過上面的討論我們可以得出劃分實際上是針對事件A的某一個角度進行分類,類與類之間沒有交叉且分類覆蓋所有對象.這就有了如下劃分的定義:
這個劃分無論劃分什麼樣的事件,都可以將其劃分成幾個互不相容的部分:
二.貝葉斯公式
先說一下背景,了解一下法國數學家貝葉斯,貝葉斯全名為託馬斯·貝葉斯(Thomas Bayes,1701-1761),是一位與牛頓同時代的牧師,是一位業餘數學家,平時就思考些有關上帝的事情,當然,統計學家都認為概率這個東西就是上帝在擲骰子。什麼是概率論中的統計學派呢?
你先回答擲一枚硬幣為正面的概率為多少?,大部分人第一反應就是50%的機率為正。不好意思,首先這個答案就不正確,只有當材質均勻時硬幣為正面的機率才是50%(所以不要覺得打麻將的時候那個骰子每面的機率是相等的,萬一被做了手腳呢)。好,那現在假設硬幣的材質是均勻的,那麼為什么正面的機率就是50%呢?有人會說是因為我擲了1000次硬幣,大概有492次是正面,508次是反面,所以近似認為是50%,說得很好(擲了1000次我也是服你)。
擲硬幣的例子說明了古典統計學的思想,就是概率是基於大量實驗的,也就是大數定理。那麼現在再問你,有些事件,例如:明天下雨的概率是30%;A地會發生地震的概率是5%;一個人得心臟病的概率是40%……這些概率怎麼解釋呢?難道是A地真的100次的機會裡,地震了5次嗎?肯定不是這樣,所以古典統計學就無法解釋了。再回到擲硬幣的例子中,如果你沒有機會擲1000次這麼多次,而是只擲了3次,可這3次又都是正面,那該怎麼辦?難道這個正面的概率就是100%了嗎?這也是古典統計學的弊端。
統計學派對於那些比較理想化的實驗比較對路,比如擲硬幣,試驗之前正面概率為1/2是精確的,對剛才說的一些例子真的是不好解釋.
當時貝葉斯發現了古典統計學當中的一些缺點,從而提出了自己的「貝葉斯統計學派」,但貝葉斯統計當中由於引入了一個主觀因素(先驗概率),一點都不被當時的人認可。直到20世紀中期,也就是快200年後了,統計學家在古典統計學中遇到了瓶頸,伴隨著計算機技術的發展,當統計學家使用貝葉斯統計理論時發現能解決很多之前不能解決的問題,從而貝葉斯統計學派一下子火了起來。
什麼是貝葉斯公式呢?
我們知道它求的是一個條件概率,與全概公式相對應,全概公式是用劃分 將A劃分求和,而貝葉斯公式則是在已知P(A)的條件下求Bi的條件概率
三 典型例題
例:一所學校裡面有 60%的男生,40% 的女生。男生總是穿長褲,女生則一半穿長褲一半穿裙子。
(1) 迎面走來一個學生,問他(她)穿長褲的概率是多大;
(2) 迎面走來一個穿長褲的學生(很不幸的是你高度近視,你只看得見他(她)穿的是否長褲,而無法確定他(她)的性別),你能夠推斷出他(她)是男生的概率是多大嗎?
四 小結
總之,全概公式是由多個因推果,是正向概率,而貝葉斯公式是由果推因,是逆向概率.在貝葉斯公式中,通常稱 P(B1),P(B2),...P(B1),P(B2),...為先驗概率,而稱 P(B1|A),P(B2|A),...P(B1|A),P(B2|A),... 為後驗概率。因而,貝葉斯公式實際上是計算後驗概率的公式。