金伯努利概型
要說二項分布,先要介紹伯努利概型。伯努利概型是瑞士數學家雅各布·伯努利提出的。它是指只有兩種可能結果的隨機試驗。
所謂隨機試驗指的是你做一次試驗,可能的結果不止一個,但是所有可能的結果預先都是知道的,只是你做試驗之後才能知道到底出現的是哪一個結果。最常見的隨機試驗的例子,就是擲骰子。我們在擲骰子之前都知道擲完骰子後,可能的結果只能是擲出1、2、3、4、5、6中的一個,到底是哪一個你事先是不知道的,只有擲完骰子之後,出來了結果,你才知道是哪一個,這就是隨機試驗。
在隨機試驗中,有一類只有兩種可能結果的隨機試驗,我們稱之為伯努利概型。比如扔硬幣,扔完硬幣之後,只有兩種可能的結果,要么正面朝上,要麼背面朝上,這就是伯努利概型。如果我們把一種結果記作1,它的概率為p,另一種情況記作0,其概率為q。我們就可以用下面的式子來表示。
P(x=1) = p
P(x=0) = q
p + q = 1
上面的第一個式子表示結果1的概率是p,第二個式子表示結果2的概率是q,而第三個式子表示只有兩種情況,結果1和結果2共同構成了所有可能的結果。
比如對於扔硬幣,我們就可以記作:
P(x=正面朝上) = 0.5
P(x=背面朝上) = 0.5
二項分布和伯努利概型的關係
二項分布實際上就是做n次獨立的伯努利試驗。比如我們扔10次硬幣,這就是一個n=10的二項分布,這10次扔硬幣的結果可能是10次都是正面朝上,也有可能是9次正面朝上,1次背面朝上,也有可能是8次正面朝上,2次背面朝上,以此類推,直至10次都是背面朝上。10次都是正面朝上的概率是多少?9次正面朝上,1次背面朝上的概率又是多少?這是我們關心的問題。很明顯,這個概率和每一次正面朝上的概率和背面朝上的概率相關。注意二項分布在這裡不考慮結果出現的先後次序,也就是說前8次是正面朝上,後2次是反面朝上,與第1次是反面朝上,然後是8次是正面朝上,最後1次又是反面朝上的情況,我們認為是等價的,都是8次正面朝上,2次背面朝上。
對於二項分布,我們有如下的概率公式:
或者記作
這裡p和q的含義和我們前面說的是一樣的,也就是單次伯努利試驗中的概率,n指的是我們所做的試驗的總次數,k就是總次數中有k次是出現結果1,所以相應地就會有(n-k)次出現結果2。這裡
是組合的標記。
其中n!表示n的階乘,等於1×2×3×…×n。
我們這裡用組合而不是排列,就是因為我們二項分布不考慮結果出現的先後次序,也就是與次序無關。
應用上面的公式,我們可以計算出比如10次扔硬幣中,出現三次正面朝上的概率:
數學上可以證明伯努利概型的期望值等於p,標準差是
。
而二項分布的期望值等於np,標準差是
。這裡我們就不展開討論了。
實際上,當n=1的時候,二項分布就是伯努利概型,也就是扔一次硬幣的情況,這時k可以選擇的值只有1或0。
當k=1時,
當k=0時,
和伯努利概型的公式相同,而且把n=1帶入二項分布的期望值np,標準差
中,也能得到伯努利概型的期望值p,標準差
。
提出伯努利概型的雅各布·伯努利是生活在十七世紀的著名瑞士數學家(就是下圖中這位似乎準備打保齡球的仁兄)。他和他的弟弟——同是著名數學家的約翰·伯努利——之間的相愛相殺是數學界廣為流傳的軼事,我們將來有空再介紹。