概率與統計的概念很多,我們的將通過如下的通俗易懂的方式進行講解。
公司樓下有家饅頭店:
每天早上六點到十點營業,生意挺好,就是發愁一個事情,應該準備多少個饅頭才能既不浪費又能充分供應?
老闆統計了一周每日賣出的饅頭(為了方便計算和講解,縮小了數據):
均值為:
按道理講均值是不錯的選擇(參見這篇文章),但是如果每天準備5個饅頭的話,從統計表來看,至少有兩天不夠賣, 的時間不夠賣:
你「甜在心饅頭店」又不是小米,搞什麼飢餓營銷啊?老闆當然也知道這一點,就拿起紙筆來開始思考。
老闆嘗試把營業時間抽象為一根線段,把這段時間用 來表示:
然後把 周一 的三個饅頭(「甜在心饅頭」,有褶子的饅頭)按照銷售時間放在線段上:
把 均分為四個時間段:
此時,在每一個時間段上,要不賣出了(一個)饅頭,要不沒有賣出:
在每個時間段,就有點像拋硬幣,要不是正面(賣出),要不是反面(沒有賣出):
內賣出3個饅頭的概率,就和拋了4次硬幣(4個時間段),其中3次正面(賣出3個)的概率一樣了。
這樣的概率通過二項分布來計算就是:
但是,如果把 周二 的七個饅頭放在線段上,分成四段就不夠了:
從圖中看,每個時間段,有賣出3個的,有賣出2個的,有賣出1個的,就不再是單純的「賣出、沒賣出」了。不能套用二項分布了。
解決這個問題也很簡單,把 分為20個時間段,那麼每個時間段就又變為了拋硬幣:
這樣, 內賣出7個饅頭的概率就是(相當於拋了20次硬幣,出現7次正面):
為了保證在一個時間段內只會發生「賣出、沒賣出」,乾脆把時間切成 份:
越細越好,用極限來表示:
更抽象一點, 時刻內賣出 個饅頭的概率為:
「那麼」,老闆用筆敲了敲桌子,「只剩下一個問題,概率 怎麼求?」
在上面的假設下,問題已經被轉為了二項分布。二項分布的期望為:
那麼:
有了 之後,就有:
我們來算一下這個極限:
其中:
所以:
上面就是泊松分布的概率密度函數,也就是說,在 時間內賣出 個饅頭的概率為:
一般來說,我們會換一個符號,讓 ,所以:
這就是教科書中的泊松分布的概率密度函數。
老闆依然蹙眉,不知道 啊?
沒關係,剛才不是計算了樣本均值:
可以用它來近似:
於是:
畫出概率密度函數的曲線就是:
可以看到,如果每天準備8個饅頭的話,那麼足夠賣的概率就是把前8個的概率加起來:
這樣 的情況夠用,偶爾賣缺貨也有助於品牌形象。
老闆算出一腦門的汗,「那就這麼定了!」
鑑於二項分布與泊松分布的關係,可以很自然的得到一個推論,當二項分布 很小的時候,兩者比較接近:
這個故事告訴我們,要努力學習啊,要不以後饅頭都沒得賣。
生活中還有很多泊松分布。比如物理中的半衰期,我們只知道物質衰變一半的時間期望是多少,但是因為不確定性原理,我們沒有辦法知道具體哪個原子會在什麼時候衰變?所以可以用泊松分布來計算。
還有比如交通規劃等等問題。
公眾號改版
「星標」我才更方便接收我的消息哦
只需三步
點擊圖片查看