把樣本空間劃分成容易研究的幾種情況。
全概率公式(由原因到結果)考察在每一種情況下事件B發生的概率,計算B的概率。
Bayes公式(由結果到原因)在事件B發生的條件下,考察每種情況出現的條件概率。
【這是本文的結論,明白了的,請直接看例題】
1. 全概率公式
在講全概率公式之前,首先要理解什麼是「樣本空間的劃分」【又稱「完備事件群」。】
我們將滿足
(1)A1,A2,…,An是一組兩兩互斥的事件;
這樣的一組事件稱為一個「完備事件群」。簡而言之,就是事件之間兩兩互斥,所有事件的併集是整個樣本空間(必然事件)。
注:全概率公式的主要用處在於它可以將一個複雜事件的概率計算問題,分解為若干個簡單事件的概率計算問題,最後應用概率的可加性求出最終結果.
例1:有一批同一型號的產品,已知其中由一廠生產的佔30%,二廠生產的佔50%,三廠生產的佔20%,又知這三個廠的產品次品率分別為2%,1%,1%,問從這批產品中任取一件是次品的概率是多少?
編外話:
為了檢查大家是否真懂公式,這裡設P(A)為所求,哈哈!
可以發現,我們在解題過程中,P(A)本身可能不好求,但我們可以根據它散落的「碎片」間接地將其求出。但不是所有情況都是能這樣求出的——我們必須保證B1,B2,…,Bn,⋯⋯是一個樣本空間的劃分(完備事件群)。
這個也很好理解,假如你想將一個碎掉的花瓶重新還原,碎片如果不全,或者碎片之間出現了多餘的「重疊」,還原工作都將以失敗告終。
小結
全概率公式問題的精髓是將複雜問題簡單化
全概率公式問題的關鍵是找到劃分(完備事件組)
在實際應用中, 這個劃分B1,B2,…,Bn是導致A發生的各種可能原因,P(A)是事件A分別在這些原因下發生的條件概率的加權平均。如例1中:
例2:有某電子設備製造廠所用的元件是由三家元件製造廠提供的。根據以往的記錄,有以下的數據:
設這三家工廠的產品在倉庫中是均勻混合的,且無區別的標誌。
(1)在倉庫中隨機地取一隻元件,求它是次品的概率;
(2)在倉庫中隨機地取一隻元件,若已知取到的是次品,分析此次品出自何廠,需求出此次品有三家工廠生產的概率分別是多少。試求這些概率。
2. 貝葉斯公式
編外話:這個公式本身平平無奇,無非就是條件概率的定義加上全概率公式一起作出的一個推導而已。但它所表達的意義卻非常深刻。
在全概率公式中,如果將B看成是「結果」,Ai看成是導致結果發生的諸多「原因」之一,那麼全概率公式就是一個「原因推結果」的過程。但貝葉斯公式卻恰恰相反。貝葉斯公式中,我們是知道結果A已經發生了,所要做的是反過來研究造成結果發生的原因,是X原因造成的可能性有多大,即「結果推原因」。
例3:對以往數據分析結果表明,當機器調整得良好時,產品的合格率為90%,而當機器發生某一故障時,其合格率為30%。每天早上機器開動時,機器調整良好的概率為75%,試求已知某日早上第一件產品是合格品時,機器調整良好的概率是多少?
例4:某地區居民的肝癌發病率為0.0004,現用甲胎蛋白法進行普查。醫學研究表明,化驗結果是有錯檢的可能的。已知患有肝癌的人其化驗結果99%呈陽性(有病),而沒患肝癌的人其化驗結果99.9%呈陰性(無病)。
現某人的檢查結果呈陽性,問他真的患有肝癌的概率是多少?
>這表明,在化驗結果呈陽性的人中,真患肝癌的人不到30%。
>當然,進一步降低錯檢率是提高檢驗精度的關鍵。但在實際中由於技術和操作等種種原因,降低錯檢率是很困難的。
>仔細分析一下會發現檢驗精度低的主要原因是肝癌發病率很低。
譬如,對首次檢查呈陽性的人群再進行複查此時P(B)=0.284,這時再用貝葉斯公式計算得
這就大大提高了檢驗的準確率。
編外話:
這就是為什麼體驗時,醫生讓體驗者複查的原因(以後不要說數學沒用啊)。
例5:無線電通訊中發出X、Y兩種信號信號.發出「X」,收到信號「X」,「不清」,「Y」的概率分別為0.7,0.2,0.1;發出信號「Y」,收到信號「X",「不清」,「Y」的概率分別為0.0,0.1,0.9.已知在發出的信號中,「X" 和「Y」出現的概率分別為0.6和0.4,試分析,當收到信號「不清」時,原發信號為「X」還是「Y」的概率哪個大?
3.條件概率