關於正態分布和貝塔分布的案例介紹

2020-12-11 電子發燒友

關於正態分布和貝塔分布的案例介紹

賈恩東 發表於 2020-10-12 11:25:57

本文通過案例介紹了正態分布和貝塔分布的概念。

正態分布

正態分布,是一種非常常見的連續概率分布,其也叫做常態分布(normal distribution),或者根據其前期的研究貢獻者之一高斯的名字來稱呼,高斯分布(Gaussian distribution)。正態分布是自然科學與行為科學中的定量現象的一個方便模型。

各種各樣的心理學測試結果和物理現象的觀測值,比如光子計數等都被發現近似地服從正態分布。甚至生活中很多現象的表徵結果也符合正態分布的分布規律。儘管這些現象的根本原因經常是未知的,甚至被採樣的樣本的原始群體分布並不服從正態分布,但這個變量的採樣分布均值仍會近似服從正態分布。

正態分布的概率密度函數呈左右對稱的鐘形,其具體表達式為:

因為正態分布是如此的常見而這個式子是如此的奇怪,我們打算重溫高斯當年的推導過程,但部分細節不會那麼嚴謹的證明,只是帶領大家看看高斯當年的思路是如何的。

首先,高斯事先假定了如下條件,才得到了正態分布的連續密度函數。

即: 誤差分布導出的極大似然估計 = 算術平均值

這裡我們把全部過程用直白的語言複述一遍。

貝塔分布

貝塔分布,beta分布,簡單來說,就是一個事件出現的概率的概率密度分布。

舉個例子,籃球比賽的三分命中率是衡量籃球後衛運動員很重要的一個指標。通過過去的歷史經驗,我們知道運動員的三分命中率很難超過40%。假如老張是一個優秀老練的籃球後衛,其過去歷史的三分命中率是35%,總投數為10000次,命中次為3500次。請問他在新賽季剛開始的時候,得到了一次三分投球機會,請問他這次投中的概率服從什麼分布呢?

我們必須清楚,這個概率一定不是確定的,而是服從某種分布。這個概率密度分布函數應該在0.35處最大,沿兩邊逐漸遞減。

這個概率就服從beta分布。確切的說,是服從

還有個運動員小張,而小張很年輕也很優秀,他的歷史三分命中率也是35%,但是總投數為1000次,命中次數為350次。請問他在新賽季首投三分,命中概率的分布和老張一樣嗎?

明顯不一樣!雖然他們的歷史投球命中率都是35%,但是我們直覺認為老張比小張更靠譜,老張首投命中的概率密度分布應該在0.35附近高於小張的。事實上,我們可以迅速藉助python的scipy庫中內置的beta統計方法。

我們來看一下圖像。

的確如此。那麼beta分布的具體表達式是什麼呢?

關於伽馬函數和貝塔函數,這裡我們不做贅述。

需要指出的是,看起來beta分布的概率密度函數和高斯分布的曲線很像,實則不然。

再舉個例子,假如老張的孫子也想做做運動員,老張煞有介事的統計了小小張的歷史三分投數,為5投1中。問他下一次投球,也就是第六次投球,命中的概率的分布是怎樣的?如果過去是5投2中,5投3中,和5投4中呢?

可以看到,beta分布的PDF和高斯分布的曲線形狀差別可大了。
編輯:hfy

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 概率|無處不在的高斯分布(1)——標準正態分布
    導致我拖延的有兩個原因:一方面我對自己中文表達能力不夠自信,一方面對「系統性介紹統計學知識」的追求使我不知該從何下筆。為了阻止自己一拖再拖,我決定愉快地敲起小鍵盤,想到哪裡,寫到哪裡,不求完美,只求碼字。萬事開頭難,今天的第一講,我們來談一談無處不在的「高斯分布」(又叫「正態分布」,Normal Distribution)。
  • 正態分布的應用——基於描述性統計與分布的推論
    本期給大家介紹的是數據分析基礎系列,包括分布的基本類型,集中趨勢與分布的關係,離散趨勢與分布的關係,再結合國民收入案例探討分布與描述性統計分析在實際生活的應用。文章內容適合數據分析小白,內容深入淺出,案例貼合實際。下期給大家介紹偏度係數,歡迎大家關注。
  • 【教育統計答疑】如何理解正態分布、均值分布、χ^2分布、t分布和F分布
    正態分布的特徵表明被測事物處於穩定的狀態下,測量數據的波動是由於偶然因素引起的,所以在實踐中有廣泛的應用。在穩定的系統環境(如自然、人類社會等),許多事物和現象都會服從正態分布,例如人的身高、體重和智商;各種商品的尺寸和質量;自然環境的溫度、溼度和降雨量;考試的成績等。
  • 正態分布
    狄莫弗(De Moivre Abraham,1667—1754)中心極限定理就是從數學上證明了這一現象。到了1780年,拉普拉斯(P. S.Laplace,1749-1827)給出了中心極限定理更一般地形式。中心極限定理的出現給予了正態分布一種極限分布的感覺。後來人們不斷發現,在現實世界中,很多東西都符合正態分布,後世的一些學者如魁特奈特、高爾登、埃其渥斯諸君更是以正態主義者自居。但是真正使正態分布登上王座的的卻不是因為這個,而是因為誤差!
  • 「正態分布」碎思
    1.正態分布原本是一個概率統計的概念,用以描述連續隨機變量的分布情況。最簡單的描述就是「中間大,兩頭小」。正態分布大致長這樣:標準正態分布的平均數為0,標準差為1。自然界以及人類社會中許多現象在分布上都體現了正態分布的形態,但不同現象的具體分布形態會因隨機變量的平均數、標準差的大小與單位不同而有所不同。
  • 如何使用標準正態分布表?
    正態分布這個概念在統計學中很常見,在做與正態分布有關計算的時候經常會用到標準正態分布表。
  • 正態分布的常用數據 - CSDN
    #尋找真知派#如上一篇文章所述,樣本所屬總體服從正態分布是數據分析和數據挖掘等數據處理的重要前提。如果我們採集的樣本並不能確認其總體是否服從正態分布,那麼數據處理的結果就是不可靠的。因此,對樣本數據進行正態分布檢驗十分必要。
  • 正態分布圖形的編輯
    這個時候,你可以選擇分布密度的整個系列,插入一個堆積面積圖,則會得到:然後我們需要在這個面積圖的基礎之上,再給它一個面積堆積,達到自由切換的效果,而上圖藍色的部分則是基於我們的基本數據給出來的底層正態模型,自己切換或者變化的面積也必須要在這個藍色的面積範圍以內.
  • 正態分布及其應用
    圖 2並且,如果進一步增加釘子的層數和小球個數,球槽中小球分布形成的曲線就會越來越光滑,最終趨向於圖3「中間高,兩邊低」的「鍾型」曲線,我們將這條曲線稱為正態分布密度曲線,簡稱正態曲線圖 4圖5中兩條正態曲線的平均值相同,但是形狀不同,實線的正態曲線更加「矮胖」,而虛線的正態曲線更加「高瘦」,我們用另一個希臘字母σ(σ>0)來刻畫這種「矮胖」或「高瘦」的程度。
  • 偏度與峰度的正態性分布判斷
  • 終於搞清楚正態分布、指數分布到底是啥了!
    標準正態分布正態分布是一個鐘形曲線,曲線對稱,中央部分的概率密度最大,越往兩邊,概率密度越小。如何求正態分布的概率?正態分布的概率密度函數滿足:連續型隨機變量的理想模型就是正態分布,求正態分布的概率同樣是求概率密度曲線下的面積,曲線的面積如何求?
  • 思維模型17 - Normal distribution | 正態分布
    正態分布正態分布又稱高斯分布,是一個常見的連續概率分布,它的樣子類似於寺廟裡的大鐘,因此人們又經常稱之為鐘形曲線。正態分布曲線的樣子就像下圖,說名字可能不清楚,但很多同學一看到圖就恍然大悟,原來這就是正態分布啊。
  • 為什么正態分布如此常見?
    正態分布的英文名為:Normal Distribution,臺灣翻譯為常態分布,可見一斑。可是為什麼這麼常見呢?每個人都相信它(正態分布):實驗工作者認為它是一個數學定理,數學研究者認為他是一個經驗公式。
  • 測量值不服從正態分布該怎麼辦?
    在統計過程控制中,為什麼數值不服從正態分布,如果不服從正態分析,我們又該怎麼處理?問:在統計過程控制的活動中,計量型特徵值不服從正態分布是怎麼回事?答:正態分布是我們基於樣本信息,對其背後虛構的總體中數值的分布情況進行描述用的,當樣本數據證明背後的總體不服從正態分布時,我們應該先考慮數據的來源。1、在統計過程控制中,為什麼特徵值不服從正態分布?
  • 相關知識考點:標準正態分布
    1概率密度函數  當μ=0,σ=1時,稱X服從標準正態分布,記作X~N(0,1)。  服從標準正態分布的隨機變量記為U,它的概率密度函數記為。  若X~N(μ,σ2),則~N(0,1)。  實際中很少有一個質量特性(隨機變量)的均值恰好為0,方差與標準差恰好為1.一些質量特性的不合格品率均要通過標準正態分布才能算得,這一點將在後面敘述。  2標準正態分布表  標準正態分布函數表,它可用來計算形如「」的隨機事件發生的概率,記為。  正態分布N(0,1)的分位數。
  • 神說,要有正態分布,於是高斯就創造了正態分布 - 徐曉亞然
    一般正態分布正態分布的密度函數N(0,σ2)就是上述的表現形式。那麼前面說的最小二乘法跟正態分布又有啥關係呢?正態分布和最小二乘法的深刻關係這裡我們很明顯就看出來,如果使得這個概率最大,那麼要讓所有的誤差項e2 最小,這剛好不就是最小二乘法的定義嘛。
  • python 生成正態分布數據,並繪圖和解析
    這篇文章主要介紹了python 生成正態分布數據,並繪圖和解析,幫助大家更好的利用python進行數據分析,感興趣的朋友可以了解下
  • 標準正態分布函數數值表怎麼查?
    最近在整理數據時,忽然想到數理統計的其中一種分布,相信作為質量人一定不陌生,我們常常提到數據的分布是否服從正態分布,這是對一組連續數據分布一種描述
  • 第三節 正態分布和醫學正常值範圍的估計
    第三節 正態分布和醫學正常值範圍的估計   一、正態分布   (一)正態分布的圖形   將表18-1的110名20歲健康男大學生身高頻數分布繪成圖18-1中的(1),可見高峰位於中部,左右兩側大致對稱。
  • 正態分布密度函數 - 描繪自然的常態
    ——比如智力、考試成績、工資收入、股價變動等等都服從正態分布,微小粒子的無規則運動也不例外。正態分布在統計學的許多方面有著重大的影響力,因而在數據分析界佔據著非常重要的地位。正態分布又被稱為高斯分布。在那個年代,正態分布還不是叫「正態分布」。