10分鐘讓你理解泊松分布、指數分布

2021-03-02 深度學習這件小事

大學時,我一直覺得統計學很難,還差點掛科。

工作以後才發現,難的不是統計學,而是我們的教材寫得不好。比起高等數學,統計概念其實容易理解多了。

我舉一個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。

我可以在10分鐘內,讓你毫不費力地理解這兩個概念。

日常生活中,大量事件是有固定頻率的。

●某醫院平均每小時出生3個嬰兒

●某公司平均每10分鐘接到1個電話

●某超市平均每天銷售4包xx牌奶粉

●某網站平均每分鐘有2次訪問、前端

它們的特點就是,我們可以預估這些事件的總數,但是沒法知道具體的發生時間。已知平均每小時出生3個嬰兒,請問下一個小時,會出生幾個?

有可能一下子出生6個,也有可能一個都不出生。這是我們沒法知道的。

泊松分布就是描述某段時間內,事件具體的發生概率。

上面就是泊松分布的公式。等號的左邊,P 表示概率,N表示某種函數關係,t 表示時間,n 表示數量,1小時內出生3個嬰兒的概率,就表示為 P(N(1) = 3) 。等號的右邊,λ 表示事件的頻率。

接下來兩個小時,一個嬰兒都不出生的概率是0.25%,基本不可能發生。

接下來一個小時,至少出生兩個嬰兒的概率是80%。



泊松分布的圖形大概是下面的樣子。

可以看到,在頻率附近,事件的發生概率最高,然後向兩邊對稱下降,即變得越大和越小都不太可能。每小時出生3個嬰兒,這是最可能的結果,出生得越多或越少,就越不可能。

指數分布是事件的時間間隔的概率。下面這些都屬於指數分布。

●嬰兒出生的時間間隔

●來電的時間間隔

●奶粉銷售的時間間隔

●網站訪問的時間間隔

指數分布的公式可以從泊松分布推斷出來。如果下一個嬰兒要間隔時間 t ,就等同於 t 之內沒有任何嬰兒出生。



反過來,事件在時間 t 之內發生的概率,就是1減去上面的值。



接下來15分鐘,會有嬰兒出生的概率是52.76%。



接下來的15分鐘到30分鐘,會有嬰兒出生的概率是24.92%。

指數分布的圖形大概是下面的樣子。

可以看到,隨著間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生3個嬰兒,上面已經算過了,下一個嬰兒間隔2小時才出生的概率是0.25%,那麼間隔3小時、間隔4小時的概率,是不是更接近於0?

一句話總結:泊松分布是單位時間內獨立事件發生次數的概率分布,指數分布是獨立事件的時間間隔的概率分布。

請注意是"獨立事件",泊松分布和指數分布的前提是,事件之間不能有關聯,否則就不能運用上面的公式。

[說明] 本文受到 nbviewer 文檔的啟發。

來源:阮一峰的網絡日誌

http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html

為您推薦

帶你縱覽深度學習在智能對話系統中應用

深度學習並非萬能:你需要避免這三個坑

一步步教你構建 NLP 流水線

從一個騙局談生活中的基礎算法

相關焦點

  • 泊松分布和指數分布:10分鐘教程
    比起高等數學,統計概念其實容易理解多了。我舉一個例子,什麼是泊松分布和指數分布?恐怕大多數人都說不清楚。我可以在10分鐘內,讓你毫不費力地理解這兩個概念。一、泊松分布日常生活中,大量事件是有固定頻率的。
  • 泊松分布、指數分布、gamma分布
    本文主要包含以下內容:1 泊松分布2 泊松分布近似二項分布3 指數分布4 gamma分布1 泊松分布泊松分布(poisson distribution),以Simeon方差:指數分布為什麼是式9的形式?指數分布的定義是泊松過程中事件之間時間的概率分布。試想一下,直到事件發生的時間量意味著在等待期間,沒有一個事件發生。
  • 原創 | 一文讀懂泊松分布,指數分布和伽馬分布
    本文以簡單直白的方式讓大家能夠理解泊松分布,指數分布和伽馬分布的實際含義和作用,並且由此推導其概率密度函數。
  • 如何深刻理解泊松分布?
    理解實驗Rate參數速率參數λ是定義泊松分布所需的唯一數字。但是,由於它是兩個部分(事件/間隔*間隔長度)的乘積,因此有兩種更改方法:我們可以增加或減少事件/間隔,也可以增加或減少間隔長度。首先,讓我們通過增加或減少每小時流星的數量來更改速率參數,以查看分布如何受到影響。對於此圖,我們將時間段保持恆定為60分鐘(1小時)。
  • 泊松分布與二項分布
    」,大部分的教科書上也都會給出這個收斂過程的數學推導,但是看懂它和真正理解還有很大距離。如果我們學習的意義是為了通過考試,那麼我們大可停留在「只會做題」的階段,因為試卷上不會出現「請發表一下你對泊松公式的看法」這樣的題目,因為那樣一來卷子就變得不容易批改。所以現在的大部分考試都會出一些客觀題。而如果我們學習的目的是為了理解一樣東西,那麼我們就有必要停下來去思考一下諸如「為什麼要有泊松分布?」、「泊松分布的物理意義是什麼?」這樣的「哲學」問題。
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • 幾何分布、二項分布及泊松分布:堅持離散
    缺點:但是面對試驗次數不固定,發生事件概率的情況下,顯然幾何分布與二項分布都不能解決,這裡也體現出泊松分布的優勢4、實例某地某一時期內出生35名嬰兒,其中女性19名(定Sex=0),男性16名(定Sex=1)。問這個地方出生嬰兒的性別比例與通常的 男女性比例(總體概率約為0.5)是否不同?數據如表10-2所示。35名嬰兒的性別的二項式檢驗?
  • 廣義線性模型GLM(泊松分布)
    ——摘自百度百科《泊松分布》【1】泊松分布表達式為:泊松分布的期望與方差相等,均為λ.對於簡單的一元模型,我們可以直接用泊松模型建模,但是如果要引入多個自變量,我們還是需要線性模型。但是線性模型有以下問題:(1)count data值為非負,單純的線性模型無法滿足這一點。
  • Excel的統計方法:泊松分布的計算過程圖文
    二、定義: Poisson分布,是一種統計與概率學裡常見到的離散概率分布,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。 二項分布中,當n趨於無窮大時,p趨於0,此時事件發生的概率是服從泊松分布的。
  • 指數族分布
    ,包括高斯分布、伯努利分布、泊松分布等2.指數族分布主要包含三個參數:指數族分布(exponential family)是指一類分布,包括高斯分布、伯努利分布、二項分布、泊松分布、伽馬分布、貝塔分布等。
  • 指數分布及其實際應用場景
    基礎準備前面介紹介紹了常用的幾種離散型概率分布及其實際應用場景以及連續型概率分布--貝塔分布的內容,大家可以點擊下方文章連結回顧:指數分布介紹完常用的離散型概率分布以後,接下來將介紹常用的連續型概率分布,指數分布是第一個要介紹的連續型概率分布。
  • 從零開始學統計(五)——泊松分布
    式中,為泊松分布的總體均數;X為稀有事件發生的次數,樣本空間為[0,1,…,n];e為自然對數的底,為常數2.71828.泊松定理當然可以證明,如果你還記得極限,又有時間有興趣,可以根據二項分布公式自行證明。
  • 概率每天一問:如何確定問題中應該選用泊松分布幾何分布和指數分布
    概率每天一問:如何確定問題中應該選用泊松分布幾何分布和指數分布 http://kaoyan.eol.cn      2005-11-23  大 中 小   臨考概率統計30問(每天一問)――源於清華版的「2006
  • R統計學(05): 泊松分布
    泊松分布的推導泊松分布的概率質量函數可以由二項分布的概率質量函數推導而來,下面是推導過程。二項分布的概率質量函數為:由上可知,在二項分布的伯努利試驗中,如果試驗次數n很大,成功概率p很小,且乘積λ= np比較適中,則事件出現的次數的概率可以用泊松分布來逼近。事實上,二項分布可以看作泊松分布在離散時間上的對應物。3.
  • 泊松分布及其實際應用場景
    基礎準備前面為大家介紹了第一種常見的離散型概率分布:二項分布及其實際生活運用,大家可以點擊下方文章連結及進行回顧:今天要給大家介紹的是第二種常見的離散型概率分布:泊松分布。泊松分布是以18~19 世紀的法國數學家西莫恩·德尼·泊松的名字命名的,它作為一種常見的離散型變量的分布,在實際生活中有著非常廣泛的應用。
  • 永遠」年輕」的指數分布
    可以看出,當X取值增大時,落在X附近的概率呈指數式衰減.指數分布通常描述泊松過程中的事件之間的間隔時間的概率分布,比如旅客進機場的時間間隔、中文維基百科新條目出現的時間間隔等等。有人戲稱服從指數分布的隨機變量是「永遠年輕的」,一個60歲的老人與一個剛出生的嬰兒,他們能夠再活十年的概率是相等的,你相信嗎?——如果人的壽命確實是服從指數分布的話,回答是肯定的。再說一個例子,以做難題為例。如果你在做一個難題,苦思冥想了一個小時,結果紙上還是沒有任何思路,這一個小時就白費了。你再想一個小時和一個小時以前,你覺得一個小時能做出來的可能性是一樣的。
  • 什麼是松泊分布?泊松回歸可以用來做什麼?
    接下來,本文將要介紹的這個回歸模型是專門針對計數數據的泊松回歸模型。泊松分布說到泊松回歸,首先要了解,什麼是泊松分布?試想一下,你現在就站在一個人流密集的馬路旁,打算收集闖紅燈的人群情況(?)。首先,利用秒表和計數器,一分鐘過去了,有5個人闖紅燈;第二分鐘有4個人;而下一分鐘有4個人。持續記錄下去,你就可以得到一個模型,這便是「泊松分布」的原型。
  • 可靠性工程師必備:指數分布基礎知識
    指數分布是連續型隨機變量的另一種概率分布,它主要應用在隨機事件之間發生的時間間隔的概率問題。
  • 比特幣論文中泊松分布期望公式問題|火星技術帖
    小編:記得關注哦來源:CSDN在比特幣創始論文的第11章中存在這樣一個問題,就是為什麼這個分布的期望為lamda=z*(q/p)?11. 計算設想如下場景:一個攻擊者試圖比誠實節點產生鏈條更快地製造替代性區塊鏈。
  • 11種概率分布,你了解幾個?
    6 泊松分布假設已知事件在單位時間(或者單位面積)內發生的平均次數為 λ,則泊松分布描述了:事件在單位時間(或者單位面積)內發生的具體次數為 k 的概率。7 指數分布若事件服從泊松分布,則該事件前後兩次發生的時間間隔服從指數分布。由於時間間隔是個浮點數,因此指數分布是連續分布。