在上篇文章中,我總結了概率論學習當中一些基礎概念,這一篇主要關注隨機變量。
1
隨機變量
現實生活中我們往往關心的不是一個隨機試驗的結果,比如說扔色子不是關注一個結果,往往是兩個色子點數的和,這是由很多組合構成的。
除此之外,儘管我們可以在邏輯中理解那些概率的算法,但那不是數學語言。在數學世界裡,你不能說硬幣是正面還是反面,這個需要一個轉換,而轉換則用到了函數。
函數本身就是數學世界和真實世界的轉換器。
一個隨機試驗的樣本空間是S,實驗結果是E,定義一個函數X(E),那麼它的定義域則是S,值域則是整個實數,也就是將現實世界的事件和數字聯繫在一起。
函數X(E)本身叫做隨機變量。
2
離散型隨機變量
有些隨機變量,它全部可能取到的不相同的值是有限個或可列無限多個,也可以說概率1以一定的規律分布在各個可能值上。這種隨機變量稱為"離散型隨機變量"。
對於一個離散型的隨機變量X,我們定義X的概率分布列(簡稱分布列,probability mass function) P(a):
P(a)=P{X=a}
P(a)是在有限個a上取正值,所以有以下性質:
P(a)≥0所有的P(a)的和為1
上圖就是一個隨機變量的函數分布列。
典型的離散型隨機變量有以下幾個:
伯努利分布:每次結果為兩個的單次實驗二項分布:每次結果有兩個的n次實驗多項分布:每次結果多於兩個的n次實驗泊松分布:單位時間內隨機事件的個數(後續會有詳細解讀,本文暫不涉及)
3
期望
離散型隨機變量的期望如下圖所示:
簡單來講,離散型隨機變量的期望就是X的加權平均。
從定義可以看出期望有以下基本性質:
如果每一個結果值大於等於0,則最後的期望一定也是大於等於0。如果目標值在一定範圍內,則期望一定也在這個範圍內。如果數值是不變的,期望等於1.現在理解期望可以認為期望是很多次的情況下的每一次可能的結果,從某種意義上也是一種平均值,但是這種平均值是虛擬的,很可能現實的值沒有對應的。
思考1:如何計算隨機變量函數的期望?
方法一:隨機變量的函數仍然還是隨機變量,並且有自己的概率分布列,根據函數變化後新的x和新的P(X)可以算出期望值。
方法二:當X=x時,函數g(X)=g(x),因此很直觀的可以認為E(g(x))就是在算g(x)的加權平均,權重還是之前的概率分布列。如下圖:
上面的公式除了直觀理解外還可以用數學進行證明,過程如下:
上面的推導基於合併相同的g(x)值的思想。
思考2:隨機變量線性變化後的期望值?
求E[aX+b]的期望值?證明如下:
4
小結
本文主要初步總結了隨機變量以及離散型隨機變量的特徵,下一篇將繼續離散型隨機變量的學習。