歡迎關注ScalersTalk。IT人,搞技術,聊英語,玩口譯,話學術,談生活。學習成長,筆耕不輟。回復m查看文章列表,或者訪問S君小站ScalersTalk.com
你現在看到的是技術系列文章,目前已經發表的文章如下,回復括號數字可閱讀。
海量數據處理系列的前兩篇:
[213]籤名:集合的歸納描述
[207]海量數據相似性檢測:文檔的抽塊處理(Shingling)
其他系列:
[152]清高與小我:談技術人員的優越感(4)
[150]清高與小我:談技術人員的優越感(3)
[149]清高與小我:談技術人員的優越感(2)
[148]清高與小我:談技術人員的優越感(1)
[112]扯點密碼學:可證明安全隨筆
[250]機器學習成長筆記(1)
[251]機器學習三要素:機器學習成長筆記(2)
[253]為什麼需要機器學習:機器學習筆記(3)
[254]有監督學習和無監督學習:機器學習筆記(4)
公式採用Latex編輯,可以在原文連結裡看到轉化後的版本。
先驗概率
Prior probability
在貝葉斯統計中,先驗概率分布,即關於某個變量$$p$$的概率分布,是在獲得某些信息或者依據前,對$$p$$的不確定性進行猜測。例如,$$p$$可以是搶火車票開始時,搶到某一車次的概率。這是對不確定性(而不是隨機性)賦予一個量化的數值的表徵,這個量化數值可以是一個參數,或者是一個潛在的變量。
先驗概率僅僅依賴於主觀上的經驗估計,也就是事先根據已有的知識的推斷,
在應用貝葉斯理論時,通常將先驗概率乘以似然函數(likelihoodfunction)再歸一化後,得到後驗概率分布,後驗概率分布即在已知給定的數據後,對不確定性的條件分布。
似然函數
似然函數(likelihood function),也稱作似然,是一個關於統計模型參數的函數。也就是這個函數中自變量是統計模型的參數。對於結果$$x$$,在參數集合$$\theta$$上的似然,就是在給定這些參數值的基礎上,觀察到的結果的概率$$\mathcal{L}(\theta|x) = P(x | \theta)$$。也就是說,似然是關於參數的函數,在參數給定的條件下,對於觀察到的$$x$$的值的條件分布。
似然函數在統計推測中發揮重要的作用,因為它是關於統計參數的函數,所以可以用來評估一組統計的參數,也就是說在一組統計方案的參數中,可以用似然函數做篩選。在非正式的語境下,「似然」會和「概率」混著用;但是嚴格區分的話,在統計上,二者是有不同。
不同就在於,觀察值$$x$$與參數$$\theta$$的不同的角色。概率是用於描述一個函數,這個函數是在給定參數值的情況下的關於觀察值的函數。例如,已知一個硬幣是均勻的(在拋落中,正反面的概率相等),那連續10次正面朝上的概率是多少?這是個概率。
而似然是用於在給定一個觀察值時,關於用於描述參數的情況。例如,如果一個硬幣在10次拋落中正面均朝上,那硬幣是均勻的(在拋落中,正反面的概率相等)概率是多少?這裡用了概率這個詞,但是實質上是「可能性」,也就是似然了。
後驗概率
Posterior probability
後驗概率是關於隨機事件或者不確定性斷言的條件概率,是在相關證據或者背景給定並納入考慮之後的條件概率。後驗概率分布就是未知量作為隨機變量的概率分布,並且是在基於實驗或者調查所獲得的信息上的條件分布。「後驗」在這裡意思是,考慮相關事件已經被檢視並且能夠得到一些信息。
後驗概率是關於參數$$\theta$$在給定的證據信息$$X$$下的概率:$$p(\theta|x)$$。
若對比後驗概率和似然函數,似然函數是在給定參數下的證據信息$$X$$的概率分布:$$p(x|\theta)$$。
二者有如下關係:
我們用$$p(\theta)$$表示概率分布函數,用$$p(x|\theta)$$表示觀測值$$x$$的似然函數。後驗概率定義如下:
\[ p(\theta|x) = \frac{p(x|\theta)p(\theta)}{p(x)}\]
鑑於分母不變,可以表達成如下正比關係:
\[\text{Posteriorprobability} \propto \text{Likelihood} \times \text{Prior probability}\]。
公式採用Latex編輯,可以在原文連結裡看到轉化後的版本。回復「100小時」查看口譯100小時訓練計劃;回復「十萬字」查看十萬字視譯計劃。
S君的口譯100小時、十萬字視譯訓練交流QQ群,歡迎加入(群號為231441722)
S君個人微信號,ScalersTalker歡迎添加。
如果你覺得S君的文章對你有用,讓你有所思有所想有所行動,不用感謝,打賞請S君喝杯咖啡就行:P 。支付寶帳號是
scalerstalk [at] gmail [dot] com
想看更多相關文章,關注 ScalersTalk 回復任意小於標題括號中的三位數字查看。或者去我的站點 ScalersTalk.com 查看歷史文章。