幾何分布、二項分布及泊松分布:堅持離散

2021-02-19 黑龍江大學自然語言處理實驗室

本文來自:http://www.cnblogs.com/baiboy/p/tjx6.html

閱讀目錄

1回顧引題

2幾何分布

3二項分布

4泊松分布

5本章小結

6內容擴展

1.回顧題引1 問題?

小明滑雪: 每次(獨立事件)試滑成功的概率0.2,不成功的概率0.8.則

1、試滑兩次成功的概率?
2、試滑一次或兩次猜中的概率?
3、試滑10000次,首次成功的概率?
4、試滑第10000次以上成功的概率?

2 概率樹:

3 解答:1、概率樹求概率

設X最終試滑成功次數,則:
P(X=1)=P(第1次試滑成功)=0.2:試滑一次成功的概率】

P(X=2)=P(第1次試滑失敗AND第2試滑成功)=0.2 * 0.8=0.16【:試滑兩次成功的概率】

P(X<=2)=P(X=1)+P(X=2)=0.36:試滑一次或兩次猜中的概率】


2、試滑10000次,首次成功的概率?

P(x=10000)=q^{10000-1}p=0.8^{9999}*0.2

3、試滑第10000次以上成功的概率?

P(x>10000)=q^{10000}p=0.8^{10000}


2.幾何分布

1、概念

什麼是幾何分布?

【百度百科】幾何分布是離散型概率分布。在n次伯努利試驗中,試驗k次才得到第一次成功的機率。詳細的說,是:前k-1次皆失敗,第k次成功的概率。
【課本】如果p代表成功概率,則1-p即q代表失敗概率使用以下:

公式叫做概率的幾何分布。

2、條件、眾數、公式、方差、期望

幾何分布條件
1、進行一系列相互獨立的實驗。
2、每一次實驗既有成功,又有失敗的可能,且單次實驗成功概率相等。
3、為了取得第一次成功需要進行多少次實驗。

眾數
任何幾何分布的眾數都是1,因為r=1時,P(X=1)最大


表達式(X符合幾何分布,其中成功概率p):
X ~ G (p) 或者 X ~ Geo (p)

X表示隨機發生的次數,p表示成功的概率。(補)

計算公式:(成功概率為p,失敗概率為q,試驗次數為r)
1、第r次試驗第一次成功: P(X=r)=pq^{r-1}
2、需要試驗r次以上才第一次成功: P(X>r)=q^r
3、試驗r次或者不到r次才第一次成功:P(X<=r)=1-q^r

計算方差和期望:

期望:E(X)=1/p
期望特點隨著x變大,累計總數和越來越接近一個特定值。
方差:Var(X)=q/p^2
方差特點隨著x變大,方差越來越接近特定值

3、優缺點4、實例

應用科學:數學以及相關領域

適用領域範圍:自然數學,應用數學,高等數學,概率論

射擊比賽等

3.二項分布1、概念

什麼是二項分布?
【百度百科】二項分布即重複n次獨立的伯努利試驗。在每次試驗中只有兩種可能的結果,而且兩種結果發生與否互相對立,並且相互獨立,與其它各次試驗結果無關,事件發生與否的概率在每一次獨立試驗中都保持不變。

【課本】在相互獨立事件中,每道題答對概率為p,答錯概率為q。在n個問題中答對r個問題的概率為:

這類問題稱之為二項分布。
【統計學定義二項分布】 在概率論和統計學中,二項分布是n個獨立的是/非試驗中成功的次數的離散概率分布,其中每次試驗的成功概率為p。這樣的單次成功/失敗試驗又稱為伯努利試驗。實際上,當n = 1時,二項分布就是伯努利分布,二項分布是顯著性差異的二項試驗的基礎。

2、條件、表達式、兩點分布、公式、方差、期望

條件
1.正在進行一系列獨立試驗;
2.每次試驗都存在失敗和成功的可能,每一次試驗的成功概率相同;
3.試驗次數有限。

表達式(試驗次數n,成功概率p):
ξ~B(n,p)

ξ表示n次隨機變量ξ次成功數,p表示成功的概率(補)

兩點分布

當n=1時,記住 X ~ B (1,p) 即兩點分布。

二項分布形狀特點:
P<0.5時圖形向右偏移;當p>0.5時,圖形向左偏移。

計算概率公式:
其中

期望:E(X)=np

方差: Var(X)=npq(其中q=1-p)

如:4(n)個隨機事件成功2(r)次,成功概率是0.4(p),不成功概率0.6(q).則成功選擇一次是(0.4^2)*(0.6^(4-2)),隨機組合C_r_n(補)

3、優缺點

優點:在試驗次數一定,求成功次數時,幾何分布顯示不適合的情況下,給予這類問題二項分布能更好的解決。
缺點:但是面對試驗次數不固定,發生事件概率的情況下,顯然幾何分布與二項分布都不能解決,這裡也體現出泊松分布的優勢

4、實例

某地某一時期內出生35名嬰兒,其中女性19名(定Sex=0),男性16名(定Sex=1)。問這個地方出生嬰兒的性別比例與通常的 男女性比例(總體概率約為0.5)是否不同?數據如表10-2所示。35名嬰兒的性別的二項式檢驗?(參見SPSS演示)

n次試驗在相同條件下進行,各個觀察單位的結果獨立,且只能具有相互對立的一種結果,二項分布常用於醫學領域。

4.泊松分布1、概念

【課本】單獨事件在給定區間隨機獨立發生,已知事件平均發生數且有限次數,通過以下計算:

這樣的一類事件叫做泊松分布。

特點
1、不需要一系列試驗,描述事件特定區間發生次數。
2、兩個獨立的泊松分布相加也符合泊松分布。(即n>50且p<0.1時或np近似等於npq時)
3、特定條件下可以用來近似代替二項分布。

2、條件、表達式、特點、公式、眾數、方差、期望

條件
1、單獨事件在給定區間內隨機獨立的發生,給定區別可以是時間或者空間。(一周、一英裡)
2、已知該區間內的事件平均發生次數(發生率),且為有限數值。該事件平均發生次數用λ表示。


表達式(區間內平均發生次數為λ):

泊松分布形狀特點:λ小時,分布向右偏斜;當λ大時,分布逐漸對稱。

計算概率(e常數2.718,平均發生次數為λ,區間內r次事件):


眾數:λ是一個整數,則有兩個眾數λ和λ-1,如不是整數,眾數λ。

期望: E(X)=λ

方差: Var(X)=λ

獨立隨機變量進行組合:

泊松分布與二項分布有何關係?
當二項分布X~B(n,p)的n很大而p很小時,泊松分布可作為二項分布的近似,其中λ為np。通常當n≧10,p≦0.1,np<=5時,就可以用泊松公式近似得計算,X可以近似表示X~Po(np)。

問題:為什麼n要足夠大,p要足夠小?

因為在分時間窗口的時候有個假設:每個時間窗口最多只有一個乘客到達。(時間區間乘客問題)

3、優缺點

不需要一系列試驗,描述事件特定區間發生次數,特別適用。另外一定條件下替換二項分布帶來簡便的運算。

4、實例

應用學科:概率論

某一服務設施在一定時間內到達人數,電話交換機接到呼叫的次數,汽車站臺的侯客人數,機器出現的故障次數,自然災害發生次數,一塊產品的缺陷,顯微鏡下單位分區內的細菌分布數等。

在交通工程的應用、非典流行與傳播服從泊松分布

自然現象普遍存在泊松分布現象,主要指大量重複實驗中稀有事件發生的次數。

5.本章小結1 幾何分布

應用條件:
進行一系列獨立試驗,每次試驗成功或失敗且每次成功概率相同。目的:取第一次成功需要進行多少次試驗。
表達式(X符合幾何分布,其中成功概率p):
X ~ Geo (p)
幾何分布概率算式成立:
1、第r次試驗第一次成功: P(X=r)=pq^{r-1}
2、需要試驗r次以上才第一次成功: P(X>r)=q^r
3、試驗r次或者不到r次才第一次成功:P(X<=r)=1-q^r
期望方差:
E(X)=1/p 和 Var(X)=q/p^2

2 二項分布

應用條件:
進行一系列次數有限的獨立試驗,每次試驗成功或失敗且每次成功概率相同。目的:第N次試驗中成功多少次。
表達式(X符合二項分布,n是試驗次數,其中成功概率p):
X ~ B (n,p)
兩點分布:
當n=1時,記住 X ~ B (1,p) 即兩點分布。
二項分布概率算式成立:
其中
期望方差:
E(X)=np 和 Var(X)=npq

3 泊松分布

應用條件:
單事件在給定區間內隨機、獨立的發生,已知給定區間事件平均發生次數且有限。目的:給定區間內事件發生次數。
表達式(X符合泊松分布,其中成功概率p):
X ~ Po(λ)
泊松分布概率算式成立:

期望方差:E(X)=λ 和 Var(X)=λ 如果X~Po(λx),Y~Po(λy)且X和Y是獨立的,則X+Y~Po(λ_x+λ_y) 如果X~B(n,p)的n很大而p很小時,X可以近似表示X~Po(np)。

4 泊松分布與二項分布、正態分布的關係

泊松分布代替二項分布
當n很大且p很小時,可以用X~Po(np)近似代替X~B(n,p).(n>50且p<0.1)或者(q近似1且n很大,np近似等於npq)

正態分布代替泊松分布
如果X~Po(λ)且λ>15,則可用X~N(λλ)進行近似

正態分布代替二項分布
二項分布X~B(n,p),當np>5且nq>5時,正態分布代替二項分布.(必須進行連續性修訂)
修訂
小於等於:P(X<=a)連續標度a+0.5即P(X<a+0.5)
大於等於:P(X>=b)連續標度a-0.5即P(X>b-0.5)
介於:P(a<=X<=b)連續標度即P(a-0.5<=X<=b+0.5)

總結:小加大減

6.內容擴展

伯努利試驗

進行一系列的重複獨立試驗,每個試驗的結果只有二個,一個結果出現的概率總是p,另一個結果總是q,稱為貝努利試驗。

n重伯努利試驗

伯努利試驗在相同條件下獨立重複進行n次。

兩點分布

隨機變量X只可能是0或1,其中0<p<1,則稱X服從參數為p的兩點分布記住X~B(1,p)。

分布分類
連續型隨機分布:正態分布、均勻分布、指數分布、對數正態分布、柯西分布、Gamma分布、瑞利分布、韋伯分布
離散型隨機分布:二項分布、幾何分布、超幾何分布、泊松分布
三大抽樣分布:卡方分布、F分布、t分布


相關焦點

  • 幾何分布和二項分布有什麼區別?
    ,二項分布和幾何分布經常同時出現,在前面講泊松分布的時候也簡單提到了二項分布。那麼,幾何分布是什麼分布?和二項分布有什麼區別?講泊松分布的時候提到,二項分布的概率公式如下: 大家知道,拋硬幣實驗是最經典的二項分布實驗,一般是求n次拋硬幣實驗中有k(k ≤ n)次正面朝上的概率。而幾何分布和二項分布很像,所適用的條件和二項分布也一樣,不過其計算更為簡單。
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • 泊松分布與二項分布
    很多人在上概率論這門課的時候就沒搞明白過泊松分布到底是怎麼回事,雖然那個時候大家都會背「當試驗的次數趨於無窮大,而乘積np固定時,二項分布收斂於泊松分布
  • 泊松分布、指數分布、gamma分布
    本文主要包含以下內容:1 泊松分布2 泊松分布近似二項分布3 指數分布4 gamma分布1 泊松分布泊松分布(poisson distribution),以Simeon泊松分布是一種離散分布。它描述了在一個單位時間或空間內很少發生的隨機事件。它與二項分布的不同之處在於後者計算成功或失敗的次數,而前者計算單位時間或空間內成功或失敗的平均次數。
  • 原創 | 一文讀懂泊松分布,指數分布和伽馬分布
    這種分布就是二項分布。劉姥姥每天賣五個時辰,也就是600分鐘,如果每分鐘最多只能賣出一份調料,且在這一分鐘賣出調料的概率是P,那麼這一天賣出10份調料的概率可以通過二項分布計算:從上面的例子可以看出,泊松分布可以近似模擬一個離散事件在連續時間內發生的次數的概率分布。
  • R統計學(05): 泊松分布
    今天要給大家介紹另一個常見的離散型概率分布:泊松分布(Poisson distribution)。泊松分布的推導泊松分布的概率質量函數可以由二項分布的概率質量函數推導而來,下面是推導過程。二項分布的概率質量函數為:
  • 泊松分布及其實際應用場景
    基礎準備前面為大家介紹了第一種常見的離散型概率分布:二項分布及其實際生活運用,大家可以點擊下方文章連結及進行回顧:今天要給大家介紹的是第二種常見的離散型概率分布:泊松分布。泊松分布是以18~19 世紀的法國數學家西莫恩·德尼·泊松的名字命名的,它作為一種常見的離散型變量的分布,在實際生活中有著非常廣泛的應用。
  • 重回數學:統計與分布之伯努利分布與二項分布
    >重回數學:計數原理伯努利分布伯努利分布(Bernoulli Distribution),是一種離散分布,又稱為 "0-1 分布" 或 "兩點分布"。Binomial Distribution)也是一種離散型概率分布,又稱為「n 重伯努利分布」。
  • 如何深刻理解泊松分布?
    在本文中,我們將介紹兩個重要的概率概念:泊松過程和泊松分布。在僅強調相關理論之後,我們將通過一個真實的示例進行展示,將方程式和圖形的思想置於上下文中.泊松過程泊松過程是一系列離散事件的模型,其中:平均時間:事件之間的間隔時間是已知的,但是事件的確切時間是隨機的。事件的到達與之前的事件無關(事件之間的等待時間是無記憶的)。
  • 談談「二項分布與超幾何分布的異同」
    二項分布與超幾何分布是兩個非常重要的、應用廣泛的概率模型,實際中的許多問題都可以利用這兩個概率模型來解決.在實際應用中,理解並區分兩個概率模型是至關重要的.下面結合概念並舉例進行對比辨析.超幾何分布和二項分布都是離散型分布.超幾何分布和二項分布的區別:超幾何分布需要知道總體的容量,而二項分布不需要;超幾何分布是不放回抽取,而二項分布是放回抽取(獨立重複)當總體的容量非常大時,超幾何分布近似於二項分布...
  • 【Alex生信基礎課】——離散概率分布
    拓展應用:Poisson分布常用來描述RNA-seq的read count數的分布。更準確的可以用Gamma-Poisson分布(負二項分布在實數集上的擴充)來描述。粗略的理解是這樣的:首先,不考慮RNA-seq,假設從基因組上隨機選一個位置來產生一個read,這是一個泊松過程,如果畫出基因組各位置的產生reads的深度,這會是一個泊松分布。當然實際的過程不是完全的Poisson分布,因為基因組的構成的不均一性的原因。在RNA-seq中是類似的,只不過你是從所有的轉錄組中選取read而不是從基因組。
  • 二代測序數據統計分析中為什麼是負二項分布?
    泊松分布 or 負二項分布?從統計學的角度出發,進行差異分析肯定會需要假設檢驗,通常對於分布已知的數據,運用參數檢驗結果的假陽性率會更低。轉錄組數據中,raw count值符合什麼樣的分布呢?count值本質是reads的數目,是一個非零整數,而且是離散的,其分布肯定也是離散型分布。
  • 廣義線性模型GLM(泊松分布)
    (heavily right skewed)的,使用泊松分布來進行建模效果不錯。——摘自百度百科《泊松分布》【1】泊松分布表達式為:泊松分布的期望與方差相等,均為λ.對於簡單的一元模型,我們可以直接用泊松模型建模,但是如果要引入多個自變量,我們還是需要線性模型。但是線性模型有以下問題:(1)count data值為非負,單純的線性模型無法滿足這一點。
  • Excel的統計方法:泊松分布的計算過程圖文
    一、 目標: 本節主要通過體例講解泊松分布的計算過程。 二、定義: Poisson分布,是一種統計與概率學裡常見到的離散概率分布,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。 二項分布中,當n趨於無窮大時,p趨於0,此時事件發生的概率是服從泊松分布的。
  • 概念辨析「二項分布與超幾何分布」的聯繫與區別
    本文來源於公眾號:品數學(ID:pinmaths)中學數學教與學(ID:zxsxjyx)選編(轉載請註明出處)經常有學生問二項分布與超幾何分布到底怎麼區分,是利用二項分布的公式去解決這道概率題目,本質區別:(1) 超幾何分布描述的是不放回抽樣問題,而二項分布描述的是放回抽樣問題.(2) 超幾何分布中的概率計算實質上是古典概型問題;二項分布中的概率計算實質上是相互獨立事件的概率問題.
  • 概率質量函數與累積分布函數(離散) - 圖解概率 03
    概率質量函數與累積分布函數-離散隨機變量隨機變量其實就是函數, 將各種事件映射成對應的數字.
  • 負二項分布在差異分析中的應用
    無論是DESeq還是edgeR, 在文章中都會提到是基於負二項分布進行差異分析的。為什麼要要基於負二項分布呢?從統計學的角度出發,進行差異分析肯定會需要假設檢驗,通常對於分布已知的數據,運用參數檢驗結果的假陽性率會更低。轉錄組數據中,raw count值符合什麼樣的分布呢?
  • 概念辨析丨二項分布與超幾何分布的聯繫與區別
    經常有學生問二項分布與超幾何分布到底怎麼區分,是利用二項分布的公式去解決這道概率題目,還是利用超幾何分布公式解決呢
  • 常見數據分布-機器學習與數據分析常用術語(三)
    BernoulliDistribution/Binomial(貝努利分布/二項分布)在概率論和統計學中,二項分布是n個獨立的是/非試驗中成功的次數的離散概率分布,其中每次試驗的成功概率為p。實際上,當時,二項分布就是伯努利分布,二項分布是顯著性差異的二項試驗的基礎2.Negative BinomialDistribution(負二項分布)負二項分布是統計學上一種離散概率分布。
  • 從零開始學統計(五)——泊松分布
    上一篇我們介紹了二項分布,本篇泊松分布是二項分布的一種特例,我們可以看作,在B(n,π)中,當n很大,π很小時,令,此時,根據泊松定理,P(X)