10分鐘讓你理解泊松分布、指數分布

2021-02-15 深度學習這件小事

大學時,我一直覺得統計學很難,還差點掛科。

工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實容易理解多了。

我舉一個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。

我可以在10分鐘內,讓你毫不費力地理解這兩個概念。

日常生活中,大量事件是有固定頻率的。

●某醫院平均每小時出生3個嬰兒

●某公司平均每10分鐘接到1個電話

●某超市平均每天銷售4包xx牌奶粉

●某網站平均每分鐘有2次訪問、前端

它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?

有可能一下子出生6個,也有可能一個都不出生。這是我們沒法知道的。

泊松分布就是描述某段時間內,事件具體的發生概率。

上面就是泊松分布的公式。等號的左邊,P 表示概率,N表示某種函數關係,t 表示時間,n 表示數量,1小時內出生3個嬰兒的概率,就表示為 P(N(1) = 3) 。等號的右邊,λ 表示事件的頻率。

接下來兩個小時,一個嬰兒都不出生的概率是0.25%,基本不可能發生。

接下來一個小時,至少出生兩個嬰兒的概率是80%。



泊松分布的圖形大概是下面的樣子。

可以看到,在頻率附近,事件的發生概率最高,然後向兩邊對稱下降,即變得越大和越小都不太可能。每小時出生3個嬰兒,這是最可能的結果,出生得越多或越少,就越不可能。

指數分布是事件的時間間隔的概率。下面這些都屬於指數分布。

●嬰兒出生的時間間隔

●來電的時間間隔

●奶粉銷售的時間間隔

●網站訪問的時間間隔

指數分布的公式可以從泊松分布推斷出來。如果下一個嬰兒要間隔時間 t ,就等同於 t 之內沒有任何嬰兒出生。



反過來,事件在時間 t 之內發生的概率,就是1減去上面的值。



接下來15分鐘,會有嬰兒出生的概率是52.76%。



接下來的15分鐘到30分鐘,會有嬰兒出生的概率是24.92%。

指數分布的圖形大概是下面的樣子。

可以看到,隨著間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生3個嬰兒,上面已經算過了,下一個嬰兒間隔2小時才出生的概率是0.25%,那麼間隔3小時、間隔4小時的概率,是不是更接近於0?

一句話總結:泊松分布是單位時間內獨立事件發生次數的概率分布,指數分布是獨立事件的時間間隔的概率分布。

請注意是"獨立事件",泊松分布和指數分布的前提是,事件之間不能有關聯,否則就不能運用上面的公式。

[說明] 本文受到 nbviewer 文檔的啟發。

來源:阮一峰的網絡日誌

http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html

為您推薦

帶你縱覽深度學習在智能對話系統中應用

深度學習並非萬能:你需要避免這三個坑

一步步教你構建 NLP 流水線

從一個騙局談生活中的基礎算法

相關焦點

  • 機器學習:泊松分布與指數分布
    打開APP 機器學習:泊松分布與指數分布 阮一峰 發表於 2017-11-29 03:44:03 我舉一個例子,什麼是泊松分布和指數分布
  • 原創 | 一文讀懂泊松分布,指數分布和伽馬分布
    本文以簡單直白的方式讓大家能夠理解泊松分布,指數分布和伽馬分布的實際含義和作用,並且由此推導其概率密度函數。
  • 泊松分布
    在這篇文章中,我們將討論用於模擬上述情況的泊松分布背後的理論,如何理解和使用它的公式,以及如何使用Python代碼來模擬它。離散型概率分布這篇文章假設你對概率有一個基本的了解。在我們開始真正的文章之前,我們將建立一些對離散概率分布的理解。
  • 泊松分布與二項分布
    」,大部分的教科書上也都會給出這個收斂過程的數學推導,但是看懂它和真正理解還有很大距離。如果我們學習的意義是為了通過考試,那麼我們大可停留在「只會做題」的階段,因為試卷上不會出現「請發表一下你對泊松公式的看法」這樣的題目,因為那樣一來卷子就變得不容易批改。所以現在的大部分考試都會出一些客觀題。而如果我們學習的目的是為了理解一樣東西,那麼我們就有必要停下來去思考一下諸如「為什麼要有泊松分布?」、「泊松分布的物理意義是什麼?」這樣的「哲學」問題。
  • 如何理解泊松分布?
    的時間不夠賣:上面就是泊松分布的概率密度函數,也就是說,在 這就是教科書中的泊松分布的概率密度函數。老闆依然蹙眉,不知道 老闆算出一腦門的汗,「那就這麼定了!」鑑於二項分布與泊松分布的關係,可以很自然的得到一個推論,當二項分布
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • Excel的統計方法:泊松分布的計算過程圖文
    二、定義: Poisson分布,是一種統計與概率學裡常見到的離散概率分布,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。 二項分布中,當n趨於無窮大時,p趨於0,此時事件發生的概率是服從泊松分布的。
  • 圖解泊松分布與二項分布之差別
    泊松分布刻畫了稀有事件在一段時間內發生次數這一隨機變量的分布,如電話交換臺單位時間內接到的呼喚次數等。
  • 從零開始學統計(五)——泊松分布
    式中,為泊松分布的總體均數;X為稀有事件發生的次數,樣本空間為[0,1,…,n];e為自然對數的底,為常數2.71828.泊松定理當然可以證明,如果你還記得極限,又有時間有興趣,可以根據二項分布公式自行證明。
  • 概率每天一問:如何確定問題中應該選用泊松分布幾何分布和指數分布
    概率每天一問:如何確定問題中應該選用泊松分布幾何分布和指數分布 http://kaoyan.eol.cn      2005-11-23  大 中 小   臨考概率統計30問(每天一問)――源於清華版的「2006
  • 簡述泊松分布假設條件
    基礎準備泊松分布概率公式推導自二項分布,因為換一種角度來看待它,它就是二項分布;回顧泊松分布公式推導過程及應用案例請點擊下方連結:
  • 【陸勤筆記】《深入淺出統計學》7幾何分布、二項分布、泊松分布:堅持離散
    但是,我們可以掌握一些特殊而有用的概率分布,比方說幾何分布、二項分布和泊松分布,利用這些特殊的概率分布,可以快速地計算概率、期望和方差。 幾何分布幾何分布有以下特點:進行一系列相互獨立的試驗。每一次試驗都既有成功的可能,也有失敗的可能,且單次試驗的成功概率相同。
  • 什麼是松泊分布?泊松回歸可以用來做什麼?
    接下來,本文將要介紹的這個回歸模型是專門針對計數數據的泊松回歸模型。泊松分布說到泊松回歸,首先要了解,什麼是泊松分布?試想一下,你現在就站在一個人流密集的馬路旁,打算收集闖紅燈的人群情況(?)。首先,利用秒表和計數器,一分鐘過去了,有5個人闖紅燈;第二分鐘有4個人;而下一分鐘有4個人。持續記錄下去,你就可以得到一個模型,這便是「泊松分布」的原型。
  • 六西格瑪管理基礎-常用離散分布之-泊松分布
    ,取這些值的概率為:此時,稱X服從泊松分布。「入」是泊松分布的重要參數,它給出了產品的平均不合格項數。泊松分布的數學期望-均值、方差、標準差由下面的公式給出。泊松分布的圖形表示如下當二項分布的n很大而p很小時,泊松分布可作為二項分布的近似,其中λ為np。通常當n≧20,p≦0.05時,就可以用泊松公式近似計算。
  • 泊松分布及其實際應用場景
    基礎準備前面為大家介紹了第一種常見的離散型概率分布:二項分布及其實際生活運用,大家可以點擊下方文章連結及進行回顧:今天要給大家介紹的是第二種常見的離散型概率分布:泊松分布。泊松分布是以18~19 世紀的法國數學家西莫恩·德尼·泊松的名字命名的,它作為一種常見的離散型變量的分布,在實際生活中有著非常廣泛的應用。
  • 為什麼電話呼叫次數服從泊松分布?
    這裡,我們來討論一下泊松分布在電話呼叫中心資源配置中的應用。Poisson分布(法語:loi de Poisson,英語:Poisson distribution,譯名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一種統計與概率學裡常見到的離散機率分布(discrete probability distribution),由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838
  • 泊松分布在足球博彩中的實際應用
    今天我來和大家分享一下泊松分布(Poisson Distribution)在足球賠率中的實際應用。我相信大家在玩球的時候在某些網站或者APP中都能看到已經幫我們算好的泊松分布概率圖。那這個究竟是怎麼算出來的呢?大致原理又是什麼呢?
  • 比特幣論文中泊松分布期望公式問題|火星技術帖
    小編:記得關注哦來源:CSDN在比特幣創始論文的第11章中存在這樣一個問題,就是為什麼這個分布的期望為lamda=z*(q/p)?11. 計算設想如下場景:一個攻擊者試圖比誠實節點產生鏈條更快地製造替代性區塊鏈。
  • 通過實例理解如何選擇正確的概率分布
    例如,使用:· 二項分布,計算在每次試驗中只有兩種可能結果之一的過程的概率,例如擲硬幣。· 超幾何分布,以找出在n次不替換的抽取中k次成功的概率。· 泊松分布,測量給定時間內發生給定事件數的概率,例如每小時圖書館借書的計數。· 幾何分布,確定在第一次成功之前一定數量的試驗發生的概率。
  • 2014考研數學:泊松分布幾何分布的選用
    2014考研數學:泊松分布幾何分布的選用 http://kaoyan.eol.cn      2013-05-28  大 中 小