作為機器學習從業者,你需要知道概率分布相關的知識。這裡有一份最常見的基本概率分布教程,大多數和使用 python 庫進行深度學習有關。
概率分布概述
共軛意味著它有共軛分布的關係。在貝葉斯概率論中,如果後驗分布 p(θx)與先驗概率分布 p(θ)在同一概率分布族中,則先驗和後驗稱為共軛分布,先驗稱為似然函數的共軛先驗。共軛先驗維基百科在這裡。
多分類表示隨機方差大於 2。n 次意味著我們也考慮了先驗概率 p(x)。為了進一步了解概率,我建議閱讀 [pattern recognition and machine learning,Bishop 2006]。分布概率與特徵
1.均勻分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py
均勻分布在 [a,b] 上具有相同的概率值,是簡單概率分布。
2.伯努利分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py
先驗概率 p(x)不考慮伯努利分布。因此,如果我們對最大似然進行優化,那麼我們很容易被過度擬合。利用二元交叉熵對二項分類進行分類。它的形式與伯努利分布的負對數相同。
3.二項分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py
參數為 n 和 p 的二項分布是一系列 n 個獨立實驗中成功次數的離散概率分布。二項式分布是指通過指定要提前挑選的數量而考慮先驗概率的分布。
4.多伯努利分布,分類分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py
多伯努利稱為分類分布。交叉熵和採取負對數的多伯努利分布具有相同的形式。
5.多項式分布(離散)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py
多項式分布與分類分布的關係與伯努爾分布與二項分布的關係相同。
6.β分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py
β分布與二項分布和伯努利分布共軛。利用共軛,利用已知的先驗分布可以更容易地得到後驗分布。當β分布滿足特殊情況(α=1,β=1)時,均勻分布是相同的。
7.Dirichlet 分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py
dirichlet 分布與多項式分布是共軛的。如果 k=2,則為β分布。
8.伽馬分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py
如果 gamma(a,1)/gamma(a,1)+gamma(b,1)與 beta(a,b)相同,則 gamma 分布為β分布。指數分布和卡方分布是伽馬分布的特例。
9.指數分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py
指數分布是 α 為 1 時 γ 分布的特例。
10.高斯分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py
高斯分布是一種非常常見的連續概率分布。
11.正態分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py
正態分布為標準高斯分布,平均值為 0,標準差為 1。
12.卡方分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py
k 自由度的卡方分布是 k 個獨立標準正態隨機變量的平方和的分布。卡方分布是 β 分布的特例
13.t 分布(連續)
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py
t 分布是對稱的鐘形分布,與正態分布類似,但尾部較重,這意味著它更容易產生遠低於平均值的值。
via:https://github.com/graykode/distribution-is-all-you-need
雷鋒網雷鋒網雷鋒網