CDA數據分析師 出品
置信區間的概念是由原籍波蘭的美國統計學家耶日·奈曼提出的。
簡單理解,比如從北京到張家界旅遊5天,你恐怕不能準確說出要花多少錢,但你可以給出一個範圍,比如10000—13000,你會覺得比較可信。如果給的範圍太大,比如10000—30000,雖然可信度更高一些,但這麼大的範圍參考意義不大;如果給的範圍很小,如10000—10500,雖然準確性提高了,但可信度就似乎不會很高。而找到一個合適的估值範圍,這是置信區間要解決的問題。
說到置信區間我們就要說到點估計和區間估計。
那麼什麼是點估計?什麼是區間估計呢?
之前看到過這樣一個例子,簡直可以很完美的解釋這個問題~
以前很流行一種刮刮卡:
遊戲規則是(假設只有一個大獎):
· 大獎事先就固定好了,一定印在某一張刮刮卡上
· 買了刮刮卡之後,刮開就知道自己是否中獎
那麼我們起碼有兩種策略來刮獎:
· 點估計:買一張,這就相當於你猜測這一張會中獎(直接用樣本統計量來估計總體參數值)
· 區間估計:買一盒,這就相當於你猜測這一盒裡面會有某一張中獎(根據樣本統計量,按一定的概率大小確定包含總體參數值)
很顯然區間估計的命中率會更高(當然費用會更高,因為風險降低了)。
實際上:
點估計量是用於估計總體參數的樣本統計量。但我們不可能期望點估計量能給出總體參數的精確值,所以經常在點估計上加減估計誤差來計算區間估計。
即區間估計的一般形式為:點估計±邊際誤差。
有一個零部件的長度θ未知,我們通過點估計推測θ為9 cm,這還不足夠。如果我們能知道θ有95%的概率在(8.7cm,9.2cm),那麼就理想多了。
那麼由此我們就引出了其他兩個關鍵詞:
置信區間和置信水平
其中(8.7cm,9.2cm)我們就可以理解成置信區間,那麼95%就是置信水平。
由樣本統計量所構造的總體參數的估計區間為置信區間。由於統計學家在某種程度上確定這個區間會包含真正的總體參數,所以取名置信區間。在統計中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體參數的區間估計。置信區間展現的是這個參數的真實值有一定概率落在測量結果的周圍的程度。置信區間給出的被測量參數的測量值的可信程度,即前面所要求的"一定概率"。這個概率被稱為置信水平。
簡單理解,我們抽取100個樣本,當你不斷改變樣本的時候,由100個樣本構造的總體參數的100個置信區間中,有95%的區間包含了總體參數的真正值,5%沒包含,這個95%稱為置信水平,即1-α。
下面給大家總結一下常用置信水平
那麼怎麼建立置信區間?
置信區間的建立就與中心極限定理和抽樣分布有關,在給定置信度的條件下,置信區間的寬度決定於抽樣分布,會隨著樣本量的增大而減小,在樣本量給定時,置信區間的寬度隨著置信係數的增大而增大。
例如:想了解全國成年男性平均身高,可用抽樣的方法,用樣本信息估計總體信息。從全國男性中抽取一個樣本,這個樣本平均值及對總體平均值的一個點估計,當有多個樣本,即有多個點估計,但不知道哪個樣本對總體的估計最正確,所以用區間估計來解決這個問題。假設全國成年男性平均身高在165-175cm之間,這個區間叫置信區間,及[165,175],這個區間的可信程度是有置信水平來表現,置信水平指置信區間包含總體平均值的概率多大,如置信水平為95%。
當然在不同情況下求不同類型的區間估計時,所用的分布也不同,這裡我們做簡單了解,
1.個總體樣本參數時:
2.兩個總體樣本參數時:
我們以一個總體均值的區間估計為例來理解一下:
【 例 】一家食品生產企業以生產袋裝食品為主,為對食品質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10g。試估計該批產品平均重量的置信區間,置信水平為95%。
該食品平均重量的置信區間為101.44g~109.28g
下面讓我們通過一道練習題鞏再固一下:
從一批產品中隨機抽取100盒進行質量檢驗,檢驗結果有72盒合格,試在95%的把握程度之下對該批產品的合格率進行區間估計,並指出樣本的抽樣平均誤差和極限誤差。
及格率的區間估計:
根據題目可知:n=100 p=72% 1-α=0.95
因為p±Zα/2·{p(1-p)/n}(總體比率置信區間)
α=0.05 查表得Zα/2=1.96
得p±Zα/2·{p(1-p)/n}
=0.72±1.96×{0.72(1-0.72)/100}
=0.72±1.96×(0.448/10)
=0.72±0.088
即區間為【0.632,0.808】