重回數學:統計與分布之伯努利分布與二項分布

2021-03-01 雲物互聯
前文列表

重回數學:統計分布之泊松分布

重回數學:統計與分布之高斯分布

重回數學:排列與組合

重回數學:計數原理

伯努利分布

伯努利分布(Bernoulli Distribution),是一種離散分布,又稱為 "0-1 分布" 或 "兩點分布"。例如拋硬幣的正面或反面,物品有缺陷或沒缺陷,病人康復或未康復,此類滿足「只有兩種可能,試驗結果相互獨立且對立」的隨機變量通常稱為伯努利隨機變量。

對於伯努利隨機變量 X,如果使用 1 表示成功,其概率為 p(0<p<1);使用 0 表示失敗,其概率為 q=1-p。則可以稱伯努利隨機變量 X 服從參數為 p 的伯努利分布,其分布律為:

對於伯努利分布來說,其離散型隨機變量期望為:

E(x) = ∑x∗p(x) = 1∗p+0∗(1−p) = p

方差為:

D(x) = E(x^2)−(E^2)(x) = 12∗p−p2 = p(1−p)

二項分布

二項分布(Binomial Distribution)也是一種離散型概率分布,又稱為「n 重伯努利分布」。

首先看「n 重伯努利試驗」的定義:如果隨機變量序列 Xn(n=1, 2, …) 中的隨機變量均服從與參數為 p 的伯努利分布,那麼隨機變量序列 Xn 就形成了參數為 p 的 n 重伯努利試驗。例如,假定重複拋擲一枚均勻硬幣 n 次,如果在第 i 次拋擲中出現正面,令 Xi=1;如果出現反面,則令 Xi=0。那麼,隨機變量 Xn(n=1, 2, …) 就形成了參數為 1/2 的 n 重伯努利試驗。

可見,n 重伯努利試驗需滿足下列條件:

n 重伯努利試驗的結果就是 n 重伯努利分布,即二項分布。反之,當 Xn(n=1) 時,二項分布的結果服從於伯努利分布。因為二項分布實際上是進行了 n 次的伯努利分布,所以二項分布的離散型隨機變量期望為 E(x)=np,方差為 D(x)=np(1-p) 。

需要注意的是,滿足二項分布的樣本空間有一個非常重要的性質,假設進行 n 次獨立試驗,滿足二項分布(每次試驗成功的概率為 p,失敗的概率為 1−p),那麼成功的次數 X 就是一個參數為 n 和 p 的二項隨機變量,即滿足下述公式

P(X=k) = C(n, k) * p^k * (1-p)^(n-k)

例如,小明參加雅思考試,每次考試的通過率 1/3,不通過率為 q=2/3。如果小明連續參加考試 4 次,那麼恰好有兩次通過的概率是多少?

因為每次考試只有兩種結果,通過或不通過,符合條件 (1);每次考試結果互相獨立,且概率不變,符合條件 (2)。滿足二項分布樣本,代入公式求解得概率為 C(4, 2)*(1/2)^2*(2/3)^(4-2) ≈ 8/27 。

二項分布概率直方圖

圖形特性:

當 p=q 時,圖形是對稱的

當 p≠q 時,圖形呈偏態,p<q 與 p>q 的偏斜方向相反

當 (n+1)p 不為整數時,二項概率 P(X=k) 在 k=(n+1)*p 時達到最大值

當 (n+1)p 為整數時,二項概率 P(X=k) 在 k=(n+1)*p 和 k=(n+1)*p-1 時達到最大值

當 n 很大時,即使 p≠q,二項分布概率直方圖的偏態也會逐漸降低,最終成為正態分布。

也就是說,二項分布的極限情形即為正態分布,故當 n 很大時,二項分布的概率可用正態分布的概率作為近似值。

那麼 n 需要多大才可謂之大呢?一般規定,當 p<q 且 np≥5,或 p>q 且 nq≥5 時,這時的 n 就足夠大了,可以用正態分布的概率作為近似值。則正態分布參數 μ=np,σ^2=np(1-p)

相關焦點

  • 伯努利分布、二項分布與負二項分布
    相比於正態分布,伯努利分布、二項分布與負二項分布均屬於離散型概率分布。用來表徵,隨機變量取值的概率分布規律。
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • 【概念認識】伯努利分布、二項分布以及多項分布
    而分布,就是衡量一個概率有多大。」伯努利分布假設一個事件只有發生或者不發生兩種可能,並且這兩種可能是固定不變的。那麼,如果假設它發生的概率是p,那麼它不發生的概率就是1-p。這就是伯努利分布。伯努利實驗就是做一次服從伯努利概率分布的事件,它發生的可能性是p,不發生的可能性是1-p。
  • 數理統計基礎-幾何分布與二項分布
    伯努利試驗(Bernoulli experiment)是在同樣的條件下重複地、相互獨立地進行的一種隨機試驗, 它有兩種可能的結果: 成功,其概率為p;失敗,其概率為q=1-p. 討論多個伯努利試驗時, 規定試驗是相互獨立的, 且每個試驗都有相同的成功概率p. 幾何分布與二項分布都是從伯努利試驗中得出的.
  • CFA知識點——伯努利概型和二項分布
    金伯努利概型要說二項分布,先要介紹伯努利概型。伯努利概型是瑞士數學家雅各布·伯努利提出的。它是指只有兩種可能結果的隨機試驗。比如對於扔硬幣,我們就可以記作:P(x=正面朝上) = 0.5P(x=背面朝上) = 0.5二項分布和伯努利概型的關係二項分布實際上就是做n次獨立的伯努利試驗。
  • 常用概率分布——二項分布分布
    廢話不多說,除了最為常見的正態分布,今天我們來講講二項分布!
  • 泊松分布與二項分布
    」,大部分的教科書上也都會給出這個收斂過程的數學推導,但是看懂它和真正理解還有很大距離。——我們知道泊松分布是二項分布滿足某種條件的一個特殊形式,因此可以先從簡單的二項分布入手,尋找兩者之間的聯繫。二項分布很容易理解,比如一個牛仔一槍打中靶子的概率是p,如果我們讓他開10槍,如果每擊中一次目標就得一分,問他一共能得幾分?
  • 圖解泊松分布與二項分布之差別
    泊松分布刻畫了稀有事件在一段時間內發生次數這一隨機變量的分布,如電話交換臺單位時間內接到的呼喚次數等。
  • 高中數學離散型分布列問題
    ,但人們可以研究取值的統計規律性,對一個隨機變量的統計規律性的完整描述被稱為隨機變量的分布。一.高中階段常見的離散型分布列1.兩點分布2.二項分布關於上述兩種分布先了解什麼是伯努利試驗,如下:伯努利試驗(Bernoulli
  • 談談「二項分布與超幾何分布的異同」
    二項分布與超幾何分布是兩個非常重要的、應用廣泛的概率模型,實際中的許多問題都可以利用這兩個概率模型來解決.在實際應用中,理解並區分兩個概率模型是至關重要的.下面結合概念並舉例進行對比辨析.超幾何分布和二項分布都是離散型分布.超幾何分布和二項分布的區別:超幾何分布需要知道總體的容量,而二項分布不需要;超幾何分布是不放回抽取,而二項分布是放回抽取(獨立重複)當總體的容量非常大時,超幾何分布近似於二項分布...
  • AP統計沒煩惱:解析最經典的三種概率分布|統計概率
    今天我們來科普一下在概率論當中非常典型的三種概率分布:分別叫做伯努利分布、二項分布以及正態分布。通過這三種分布的關係來跟大家分析一下考試好壞到底何天賦有何關係。這三種分布同樣也會出現在AP統計的考試當中,但是作為科普文,今天只重點討論三種分布之間的關係,而不會涉及到過多的計算和證明。(此文章可放心食用)伯努利分布我們先來從伯努利實驗談起。
  • 幾何分布和二項分布有什麼區別?
    ,二項分布和幾何分布經常同時出現,在前面講泊松分布的時候也簡單提到了二項分布。那麼,幾何分布是什麼分布?和二項分布有什麼區別?講泊松分布的時候提到,二項分布的概率公式如下: 大家知道,拋硬幣實驗是最經典的二項分布實驗,一般是求n次拋硬幣實驗中有k(k ≤ n)次正面朝上的概率。而幾何分布和二項分布很像,所適用的條件和二項分布也一樣,不過其計算更為簡單。
  • 2016考研數學:概率論之常見隨機變量分布總結
    原標題:2016考研數學:概率論之常見隨機變量分布總結 提到考研數學,很多同學都能想到高數和線代。其實概率論與數理統計也是數學一和數學三中的考查重點,而且往往是難點。同學們在學習概率的時候覺得有難度。
  • 從貝葉斯定理到概率分布:綜述概率論基本定義
    那麼某隨機事件出現的次數即概率服從於二項分布,也稱為多重伯努利分布。任何一次試驗都是互相獨立的,前一次試驗不會影響當前試驗的結果。兩個結果概率相同的試驗重複 n 次的試驗稱為多次伯努利試驗。二項分布的參數為 n 和 p,n 是試驗的總次數,p 是每一次試驗的成功概率。根據以上所述,一個二項分布的性質為:1. 每一次試驗都是獨立的;2.
  • 神奇的正態分布
    在統計學中有各種各樣的分布,稱為統計分布,例如有離散型的伯努利分布、二項分布、超幾何分布、幾何分布、負二項分布
  • scipy 常見統計檢驗與概率分布
    常用函數cdf:隨機變量的累積分布函數,是概率密度函數的積分,即概率值pfit:對一組隨機取樣進行擬合,找出最適合取樣數據的概率密度函數的係數二項分布伯努利試驗(Bernoulli experiment)是在同樣的條件下重複地、相互獨立地進行的一種隨機試驗,其特點是該隨機試驗只有兩種可能結果:發生或者不發生。
  • [EXCEL] 5 Excel的統計方法-二項式分布概率的計算過程
    一、 目標: 本節主要通過樣例講解二項式分布概率的計算過程。 二、定義: 二項分布是由伯努利提出的概念,指的是重複n次獨立的伯努利試驗。
  • 【陸勤筆記】《深入淺出統計學》7幾何分布、二項分布、泊松分布:堅持離散
    幾何分布的描述。你正在進行一系列獨立試驗每一次試驗都存在成功與失敗的可能,每一次試驗成功的概率相同試驗的次數有限前面兩個條件和幾何分布一樣,差別在與第三個條件,二項分布是你感興趣的是獲得成功的次數。說明:根據n與p的不同數值,二項分布的形狀發生變化。p越接近0.5,圖形越對稱。一般情況下,當p小於0.5,圖形向右偏斜;當p大於0.5,圖形向左偏斜。
  • Distribution is all you need:這裡有12種做ML不可不知的分布
    選自github作者:graykode機器之心編譯參與:思機器學習開發者需要了解的 12 種概率分布,這些你都了解嗎?機器學習有其獨特的數學基礎,我們用微積分來處理變化無限小的函數,並計算它們的變化;我們使用線性代數來處理計算過程;我們還用概率論與統計學建模不確定性。
  • 必考知識點,CFA一級數量分析-常見概率分布-上
    常見離散概率分布這裡要說的離散概率分布一共有3個:離散的均勻分布(uniform distribution)、伯努利分布(Bernoulli distribution)和二項分布(binomial distribution)。