泊松分布和指數分布:10分鐘教程

2021-02-20 程序猿

來自:阮一峰的網絡日誌

連結:http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html

大學時,我一直覺得統計學很難,還差點掛科。

工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實容易理解多了。


我舉一個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。

我可以在10分鐘內,讓你毫不費力地理解這兩個概念。

一、泊松分布

日常生活中,大量事件是有固定頻率的。

●某醫院平均每小時出生3個嬰兒

●某公司平均每10分鐘接到1個電話

●某超市平均每天銷售4包xx牌奶粉

●某網站平均每分鐘有2次訪問、前端

它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?


有可能一下子出生6個,也有可能一個都不出生。這是我們沒法知道的。

泊松分布就是描述某段時間內,事件具體的發生概率。


上面就是泊松分布的公式。等號的左邊,P 表示概率,N表示某種函數關係,t 表示時間,n 表示數量,1小時內出生3個嬰兒的概率,就表示為 P(N(1) = 3) 。等號的右邊,λ 表示事件的頻率。

接下來兩個小時,一個嬰兒都不出生的概率是0.25%,基本不可能發生。


接下來一個小時,至少出生兩個嬰兒的概率是80%。



泊松分布的圖形大概是下面的樣子。


可以看到,在頻率附近,事件的發生概率最高,然後向兩邊對稱下降,即變得越大和越小都不太可能。每小時出生3個嬰兒,這是最可能的結果,出生得越多或越少,就越不可能。

二、指數分布

指數分布是事件的時間間隔的概率。下面這些都屬於指數分布。

●嬰兒出生的時間間隔

●來電的時間間隔

●奶粉銷售的時間間隔

●網站訪問的時間間隔

指數分布的公式可以從泊松分布推斷出來。如果下一個嬰兒要間隔時間 t ,就等同於 t 之內沒有任何嬰兒出生。



反過來,事件在時間 t 之內發生的概率,就是1減去上面的值。



接下來15分鐘,會有嬰兒出生的概率是52.76%。



接下來的15分鐘到30分鐘,會有嬰兒出生的概率是24.92%。



指數分布的圖形大概是下面的樣子。


可以看到,隨著間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生3個嬰兒,上面已經算過了,下一個嬰兒間隔2小時才出生的概率是0.25%,那麼間隔3小時、間隔4小時的概率,是不是更接近於0?

三、總結


一句話總結:泊松分布是單位時間內獨立事件發生次數的概率分布,指數分布是獨立事件的時間間隔的概率分布。

請注意是"獨立事件",泊松分布和指數分布的前提是,事件之間不能有關聯,否則就不能運用上面的公式。

[說明] 本文受到 nbviewer 文檔的啟發。

來自:阮一峰的網絡日誌

連結:http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html

推薦幾個不錯的公眾號


IT創業網 (chuangyetech

網際網路創業的時代,創業更具人文氣息。聚最經典的IT創業技巧,最頂尖的商界精英交流平臺!


IT電商網 (itdianshang

報導熱點電商資訊,分享有價值的電商營銷案例!


最精彩iPhone (iPhoneMost

iPhone技巧精選!


長按指紋→識別圖中二維碼添加關注

●本文編號938,以後想閱讀這篇文章直接輸入938即可。

●本文分類「數學」、「算法」,搜索分類名可以獲得相關文章。

●輸入m可以獲取到全部文章目錄

●輸入r可以獲取到熱門文章推薦

●輸入f可以獲取到全部分類名稱

相關焦點

  • 10分鐘讓你理解泊松分布、指數分布
    我舉一個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。我可以在10分鐘內,讓你毫不費力地理解這兩個概念。日常生活中,大量事件是有固定頻率的。●某醫院平均每小時出生3個嬰兒●某公司平均每10分鐘接到1個電話●某超市平均每天銷售4包xx牌奶粉●某網站平均每分鐘有2次訪問、前端它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?
  • 泊松分布、指數分布、gamma分布
    本文主要包含以下內容:1 泊松分布2 泊松分布近似二項分布3 指數分布4 gamma分布1 泊松分布泊松分布(poisson distribution),以Simeon在連續時間的隨機過程的研究中,通常用指數分布來模擬(預測)過程中發生某件事(成功、失敗等)之前的等待時間並採用部分積分法計算指數分布的均值和方差:證明式10和式11:均值:
  • 原創 | 一文讀懂泊松分布,指數分布和伽馬分布
    本文以簡單直白的方式讓大家能夠理解泊松分布,指數分布和伽馬分布的實際含義和作用,並且由此推導其概率密度函數。
  • 如何深刻理解泊松分布?
    老師們花費數小時來研究導數,方程式和定理,當您最終達到最佳效果時(將概念應用於實際數字),就會出現一些無關緊要,沒有想像力的示例,例如:擲骰子。遺憾的是,如果您跳過推導(您可能永遠不需要),而專注於使用這些想法來解決有趣的問題,那麼統計數據就很有趣。在本文中,我們將介紹兩個重要的概率概念:泊松過程和泊松分布。
  • 泊松分布與二項分布
    」,大部分的教科書上也都會給出這個收斂過程的數學推導,但是看懂它和真正理解還有很大距離。如果我們要向一個石器時代的人解釋什麼是電話,我們一定會說:「電話是一種機器,兩個距離很遠的人可以通過它進行交談」,而不會說:「電話在1876年由貝爾發明,一臺電話由幾個部分構成……」(泊松分布在1876年由泊松提出,泊松分布的公式是……)所以我們問的第一個問題應該是「泊松分布能拿來幹嘛?」泊松分布最常見的一個應用就是在排隊論中。什麼是排隊論?
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • 幾何分布、二項分布及泊松分布:堅持離散
    缺點:但是面對試驗次數不固定,發生事件概率的情況下,顯然幾何分布與二項分布都不能解決,這裡也體現出泊松分布的優勢4、實例某地某一時期內出生35名嬰兒,其中女性19名(定Sex=0),男性16名(定Sex=1)。問這個地方出生嬰兒的性別比例與通常的 男女性比例(總體概率約為0.5)是否不同?數據如表10-2所示。35名嬰兒的性別的二項式檢驗?
  • 廣義線性模型GLM(泊松分布)
    ——摘自麥好CSDN博客【2】GLM允許響應變量遵從指數家族 exponential family的任意一種分布正態分布Normal、泊松分布Poisson、二項分布Binomial和伽馬分布Gamma. 指數族能夠幫助我們對連續性、離散型、分數型、計數型和二進位數據建模。
  • 概率每天一問:如何確定問題中應該選用泊松分布幾何分布和指數分布
    概率每天一問:如何確定問題中應該選用泊松分布幾何分布和指數分布 http://kaoyan.eol.cn      2005-11-23  大 中 小   臨考概率統計30問(每天一問)――源於清華版的「2006
  • 指數族分布
    ,包括高斯分布、伯努利分布、泊松分布等2.指數族分布主要包含三個參數:指數族分布(exponential family)是指一類分布,包括高斯分布、伯努利分布、二項分布、泊松分布、伽馬分布、貝塔分布等。
  • Excel的統計方法:泊松分布的計算過程圖文
    一、 目標: 本節主要通過體例講解泊松分布的計算過程。 二、定義: Poisson分布,是一種統計與概率學裡常見到的離散概率分布,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。 二項分布中,當n趨於無窮大時,p趨於0,此時事件發生的概率是服從泊松分布的。
  • 指數分布及其實際應用場景
    基礎準備前面介紹介紹了常用的幾種離散型概率分布及其實際應用場景以及連續型概率分布--貝塔分布的內容,大家可以點擊下方文章連結回顧:指數分布介紹完常用的離散型概率分布以後,接下來將介紹常用的連續型概率分布,指數分布是第一個要介紹的連續型概率分布。
  • R統計學(05): 泊松分布
    它由法國數學家西莫恩·德尼·泊松 (1781–1840) 於1837年發表,在實際生活中有著非常廣泛的應用。1. 定義和現實應用泊松概率分布描述的是在某段時間或某個空間內發生隨機事件次數的概率,簡而言之就是:根據過去某個隨機事件在某段時間或某個空間內發生的平均次數,預測該隨機事件在未來同樣長的時間或同樣大的空間內發生k次的概率。
  • 泊松分布及其實際應用場景
    基礎準備前面為大家介紹了第一種常見的離散型概率分布:二項分布及其實際生活運用,大家可以點擊下方文章連結及進行回顧:今天要給大家介紹的是第二種常見的離散型概率分布:泊松分布。泊松分布是以18~19 世紀的法國數學家西莫恩·德尼·泊松的名字命名的,它作為一種常見的離散型變量的分布,在實際生活中有著非常廣泛的應用。
  • 從零開始學統計(五)——泊松分布
    。嗯,泊松分布既然是從二項分布推導出來的,那麼泊松分布的應用前提與二項分布一樣(回想一下!),外加一條:n很大且π很小,屬於稀有發生事件。泊松分布具有以下特性:1)總體的均數與方差相等,均為;2)具備「可加性」卻不具備「可乘性」;3)當
  • 什麼是松泊分布?泊松回歸可以用來做什麼?
    接下來,本文將要介紹的這個回歸模型是專門針對計數數據的泊松回歸模型。泊松分布說到泊松回歸,首先要了解,什麼是泊松分布?首先,利用秒表和計數器,一分鐘過去了,有5個人闖紅燈;第二分鐘有4個人;而下一分鐘有4個人。持續記錄下去,你就可以得到一個模型,這便是「泊松分布」的原型。
  • 永遠」年輕」的指數分布
    在概率論和統計學中,指數分布(Exponential distribution)是一種連續型概率分布。
  • 可靠性工程師必備:指數分布基礎知識
    指數分布是連續型隨機變量的另一種概率分布,它主要應用在隨機事件之間發生的時間間隔的概率問題。
  • 比特幣論文中泊松分布期望公式問題|火星技術帖
    那麼我們可以計算他填補上虧空的概率,也就是該攻擊者趕上誠實鏈條,如下所示[8] :假定p>q,那麼攻擊成功的概率就因為區塊數的增長而呈現指數化下降。由於概率是攻擊者的敵人,如果他不能幸運且快速地獲得成功,那麼他獲得成功的機會隨著時間的流逝就變得愈發渺茫。那麼我們考慮一個收款人需要等待多長時間,才能足夠確信付款人已經難以更改交易了。
  • 終於搞清楚正態分布、指數分布到底是啥了!
    指數分布是描述泊松過程中的事件之間的時間的概率分布,即事件以恆定平均速率連續且獨立地發生的過程。如旅客進機場的時間間隔,還有許多電子產品的壽命分布一般服從指數分布。這表示如果一個隨機變量呈指數分布,當s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。