泊松分布及其實際應用場景

2021-01-14 SPSS生活統計學


以下文章內容,來自草堂君的新書《人人都會數據分析-從生活實例學統計》。因為新書中增添和細化了很多知識點,所以草堂君會逐步將這些內容補充到統計基礎導航頁中來,幫助大家建立數據分析思維。限於篇幅,只截取書中部分內容


基礎準備

前面為大家介紹了第一種常見的離散型概率分布:二項分布及其實際生活運用,大家可以點擊下方文章連結及進行回顧:

今天要給大家介紹的是第二種常見的離散型概率分布:泊松分布。泊松分布是以18~19 世紀的法國數學家西莫恩·德尼·泊松的名字命名的,它作為一種常見的離散型變量的分布,在實際生活中有著非常廣泛的應用。


泊松分布的現實應用

泊松概率分布考慮的是在連續時間或空間單位上發生隨機事件次數的概率,簡而言之就是:基於過去某個隨機事件在某段時間或某個空間內發生的平均次數,預測該隨機事件在未來同樣長的時間或同樣大的空間內發生n次的概率。由於泊松分布適用於描述單位時間(或空間)內隨機事件發生的次數,因此它常用於預測某些事件的發生,例如某家醫院在一定時間內到達的人數;超市收銀臺在某段時間內的結帳人數;公交車站在某個時間段的候車人數等。

 

泊松分布推導

泊松分布的概率質量函數可以由二項分布的概率質量函數推導而來,下面為大家列出推導過程。首先由前面我們介紹的二項分布的概率質量函數開始:


假定某個隨機事件在過去的歷史中,在固定長度時間段或固定大小空間內發生的平均次數為λ,那麼就可以將固定長度的時間或固定大小的空間分成n等份;在每等份的時間或空間內,隨機事件發生的概率可以表示為λ/n。若n趨向於無窮,也就是這段時間或空間被分成無數的小段,那麼λ/n的值將趨近於0,也就是在每個等份的時間或空間內,該隨機事件發生兩次或兩次以上是不可能的。根據以上假設條件,在固定長度時間或固定大小空間內,隨機事件發生k次的概率服從二項概率分布,可以表示為:


上面的變換過程,需要用到以下公式代換條件:


泊松分布性質

從泊松分布的概率質量函數可以看出,泊松分布是關於歷史平均次數λ的函數,隨著歷史平均次數λ的不同,泊松分布的概率分布形態也將隨之改變。如下圖,隨著λ從1變成5,泊松分布的形態也由右偏分布(尾巴在右)逐漸變為對稱分布。


泊松分布的均值和方差也可以通過二項分布的均值和方差進行推導。首先前面介紹了二項分布的均值和方差為:


在泊松分布中,隨機事件成功的概率p=λ/n,失敗的概率為q=1-λ/n;因為λ/n趨近於0,所以q=1-λ/n趨近於1。將以上已知條件帶入二項分布均值和方差公式,得到泊松分布的均值和方差:

正因為在泊松分布中的概率質量函數中只有一個參數,減少了對參數的確定與修改的工作量,構建模型比較簡單,因此具有很重要的實際意義。


泊松分布的特徵

泊松分布是一種描述和分析稀有事件的概率分布。要觀察到這類事件,樣本量n必須很大。

λ是泊松分布所依賴的唯一參數。λ值越小,分布越偏倚,隨著λ的增大,分布趨於對稱。

在實際工作中,當λ時,就可以用正態分布近似地處理泊松分布的問題。



生活案例

中國人口眾多,就業問題一直是政府重點需要解決的問題。在經濟發展較為落後的城鄉區域,夫妻老婆店很多時候是一家人賴以生存的謀生方式,商品庫存總是這類小店特別需要注意的地方,因為稍有不慎就會導致虧本,而泊松分布是用於這類小店庫存管理特別好的工具。下面運用泊松分布來解決夫妻老婆店商品庫存量的問題,已知某家小雜貨店,在過去很長一段時間裡,平均每周只會售出2包中華煙,試問店主應該如何確定中華煙的庫存量?

 

分析思路

假定不存在條件的影響,可近似認為:1、該店賣出中華煙是小概率事件;2、購買中華煙的行為是相互獨立的;3、由於是過去很長時間的數據總結,因此可以認為該店賣出中華煙的概率是穩定的;因此該店賣出中華煙的概率服從泊松分布。



根據泊松分布的概率質量函數:


將上面案例中的已知條件嗲如泊松分布的概率公式,可以得到下表結果。由結果可知,如果庫存4包中華煙,那麼有將近95%的概率不會賣斷貨;如果存貨5包中華煙,那麼不會賣斷貨的概率增加到98%以上。

從表格結果可以看出,庫存越多,賣斷貨的概率越小,但是庫存多,壓在貨物上的資金也越多。由此可見,店主應該根據自身的現金流情況,並結合考慮賣斷貨的風險選擇一個合理的中華煙庫存量為宜。


溫馨提示:

數據分析課程私人定製,一對一輔導,添加微信(possitive2)諮詢!目前推出的一對一課程:《問卷分析與分析思維培養》課程

生活統計學QQ群:134373751,用於分享文章提到的各種案例資料、軟體、數據文件等。支持各種資料的直接下載和百度雲盤下載。

生活統計學微信交流群,用於各自行業的數據研究項目及其成果交流分享;由於人數大於100人,請添加微信possitive2,拉您入群。

數據分析諮詢,請點擊首頁下方「互動諮詢」板塊,獲取諮詢流程!

草堂君的統計基礎導航頁文章已經整理發表,可以前往任意電商網站購買

相關焦點

  • 泊松分布在足球博彩中的實際應用
    今天我來和大家分享一下泊松分布(Poisson Distribution)在足球賠率中的實際應用。我相信大家在玩球的時候在某些網站或者APP中都能看到已經幫我們算好的泊松分布概率圖。那這個究竟是怎麼算出來的呢?大致原理又是什麼呢?
  • 泊松分布
    對於離散概率分布,這些函數稱為概率質量函數(PMF)。泊松分布我們將通過一個案例來開始理解泊松分布。假如你真的很喜歡在醫院裡看新生兒。根據你的觀察和報告,你知道醫院平均每小時出生6個新生兒。你發現你明天要出差,所以在去機場之前,你想最後一次去醫院。
  • 機器學習:泊松分布與指數分布
    打開APP 機器學習:泊松分布與指數分布 阮一峰 發表於 2017-11-29 03:44:03 我舉一個例子,什麼是泊松分布和指數分布
  • 泊松分布與二項分布
    如果我們學習的意義是為了通過考試,那麼我們大可停留在「只會做題」的階段,因為試卷上不會出現「請發表一下你對泊松公式的看法」這樣的題目,因為那樣一來卷子就變得不容易批改。所以現在的大部分考試都會出一些客觀題。而如果我們學習的目的是為了理解一樣東西,那麼我們就有必要停下來去思考一下諸如「為什麼要有泊松分布?」、「泊松分布的物理意義是什麼?」這樣的「哲學」問題。
  • 原創 | 一文讀懂泊松分布,指數分布和伽馬分布
    本文以簡單直白的方式讓大家能夠理解泊松分布,指數分布和伽馬分布的實際含義和作用,並且由此推導其概率密度函數。
  • 為什麼電話呼叫次數服從泊松分布?
    這裡,我們來討論一下泊松分布在電話呼叫中心資源配置中的應用。Poisson分布(法語:loi de Poisson,英語:Poisson distribution,譯名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一種統計與概率學裡常見到的離散機率分布(discrete probability distribution),由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838
  • 簡述泊松分布假設條件
    基礎準備泊松分布概率公式推導自二項分布,因為換一種角度來看待它,它就是二項分布;回顧泊松分布公式推導過程及應用案例請點擊下方連結:
  • 從零開始學統計(五)——泊松分布
    。嗯,泊松分布既然是從二項分布推導出來的,那麼泊松分布的應用前提與二項分布一樣(回想一下!),外加一條:n很大且π很小,屬於稀有發生事件。泊松分布具有以下特性:1)總體的均數與方差相等,均為;2)具備「可加性」卻不具備「可乘性」;3)當
  • 10分鐘讓你理解泊松分布、指數分布
    我舉一個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。我可以在10分鐘內,讓你毫不費力地理解這兩個概念。日常生活中,大量事件是有固定頻率的。上面就是泊松分布的公式。泊松分布的圖形大概是下面的樣子。
  • 六西格瑪管理基礎-常用離散分布之-泊松分布
    ,取這些值的概率為:此時,稱X服從泊松分布。「入」是泊松分布的重要參數,它給出了產品的平均不合格項數。泊松分布的數學期望-均值、方差、標準差由下面的公式給出。泊松分布的圖形表示如下當二項分布的n很大而p很小時,泊松分布可作為二項分布的近似,其中λ為np。通常當n≧20,p≦0.05時,就可以用泊松公式近似計算。
  • 什麼是松泊分布?泊松回歸可以用來做什麼?
    除了上述提及的,事實上還有很多回歸分析方法,它們適用於不同類型的數據以及不同應用場景,正是這些分析方法組成了我們熟知的回歸分析大軍。接下來,本文將要介紹的這個回歸模型是專門針對計數數據的泊松回歸模型。泊松分布說到泊松回歸,首先要了解,什麼是泊松分布?試想一下,你現在就站在一個人流密集的馬路旁,打算收集闖紅燈的人群情況(?)。首先,利用秒表和計數器,一分鐘過去了,有5個人闖紅燈;第二分鐘有4個人;而下一分鐘有4個人。
  • 【陸勤筆記】《深入淺出統計學》7幾何分布、二項分布、泊松分布:堅持離散
  • 圖解泊松分布與二項分布之差別
    泊松分布刻畫了稀有事件在一段時間內發生次數這一隨機變量的分布,如電話交換臺單位時間內接到的呼喚次數等。
  • 如何理解泊松分布?
    這樣的概率通過二項分布來計算就是:上面就是泊松分布的概率密度函數,也就是說,在 這就是教科書中的泊松分布的概率密度函數。老闆依然蹙眉,不知道 老闆算出一腦門的汗,「那就這麼定了!」鑑於二項分布與泊松分布的關係,可以很自然的得到一個推論,當二項分布
  • 比特幣論文中泊松分布期望公式問題|火星技術帖
    小編:記得關注哦來源:CSDN在比特幣創始論文的第11章中存在這樣一個問題,就是為什麼這個分布的期望為lamda=z*(q/p)?11. 計算設想如下場景:一個攻擊者試圖比誠實節點產生鏈條更快地製造替代性區塊鏈。
  • 2021考研概率論與數理統計衝刺:隨機變量及其分布考試要求
    隨機變量及其分布考試要求1.理解隨機變量的概念,理解分布函數的概念及性質,會計算與隨機變量相聯繫的事件的概率。2.理解離散型隨機變量及其概率分布的概念,掌握0-1分布、二項分布、幾何分布、超幾何分布、泊松(Poisson)分布及其應用。
  • Excel的統計方法:泊松分布的計算過程圖文
    一、 目標: 本節主要通過體例講解泊松分布的計算過程。 二、定義: Poisson分布,是一種統計與概率學裡常見到的離散概率分布,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。 二項分布中,當n趨於無窮大時,p趨於0,此時事件發生的概率是服從泊松分布的。
  • 收米小技巧:泊松分布 下篇如何計算比分波膽概率
    泊松分布大小球分析法 可以給出我們準確的參考信息。 繼我們上篇學習的 泊松分布大小球分析法,這篇文章我們將要學習 球隊預計進球數 以及 比分波膽。在上篇已經講過泊松分布的歷史由來以及函數公式,所以在一篇我們不在闡述,直接進入正題。當然你們也可以完全放心,這篇文章不會涉及燒腦的數學公式,因為我們的初衷是化繁為簡,讓彩民們都能看的懂,用的上。
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • 從泊松方程的解法,聊到泊松圖像融合
    很多朋友比較熟悉概率論裡面的泊松分布。泊松方程,也是同一個數學家泊松發明的。但卻和泊松分布沒有什麼關係,是泊松物理學領域提出的一個偏微分方程。這裡表示的是拉普拉斯算子,和 (在泊松方程中是已知量)可以是實數或複數值方程,特殊情況當時被稱為拉普拉斯方程。當處於歐幾裡得空間時,拉普拉斯算子通常表示為。