基礎準備
學習了推斷統計學的以下內容以後,下一步就是用樣本參數來估計總體參數。
推斷性統計學:抽樣設計;
通俗解釋「大數據」及推斷性統計學:抽樣分布
均值的抽樣分布;
抽樣分布:詳述均值的抽樣分布及中心極限定理;
抽樣分布:t分布;
切比雪夫(Chebyshev)定理;
參數估計
參數估計:就是根據樣本統計量的數值對總體參數進行估計的過程。根據參數估計的性質不同,可以分成兩種類型:點估計和區間估計。
點估計
點估計就是用樣本統計量的某一具體數值直接推斷未知的總體參數。例如,在進行有關小學生身高的研究中,隨機抽取1000名小學生並計算出他們的平均身高為1.45米。如果直接用這個1.45米代表所有小學生的平均身高,那麼這種估計方法就是點估計。
對總體參數進行點估計常用的方法有兩種:矩估計法和最大似然估計法。按這兩種方法對總體參數進行點估計,能夠得到相對準確的結果。如用樣本均值X估計總體均值µ,或者用樣本標準差S估計總體標準差σ。
但是,點估計有一個不足之處,即這種估計方法不能提供估計參數的估計誤差大小。對於一個總體來說,它的總體參數是一個常數值,而它的樣本統計量卻是隨機變量。當用隨機變量去估計常數值時,誤差是不可避免的,只用一個樣本數值去估計總體參數是要冒很大風險的。因為這種誤差風險的存在,並且風險的大小還未知,所以,點估計主要為許多定性研究提供一定的參考數據,或在對總體參數要求不精確時使用,而在需要用精確總體參數的數據進行決策時則很少使用。
區間估計
區間估計就是在推斷總體參數時,還要根據統計量的抽樣分布特徵,估計出總體參數的一個區間,而不是一個數值,並同時給出總體參數落在這一區間的可能性大小,概率的保證。還是舉小學生身高的例子,如果用區間估計的方法推斷小學生身高,則會給出以下的表達:根據樣本數據,估計小學生的平均身高在1.4~1.5米之間,置信程度為95%,這種估計就屬於區間估計。
生活統計學,分享不知道的身邊事,並為你答疑解惑!
分享各自行業的數據研究項目及其成果,這是你我共同成長的平臺。
生活統計學QQ群:134373751,內有各種資料分享;
微信群:請掃描下方二維碼,2016.8.4之前有效: