通俗易懂告訴你:何為95%置信區間?

2020-12-05 CDA數據分析師

CDA數據分析師 出品

置信區間的概念是由原籍波蘭的美國統計學家耶日·奈曼提出的。

簡單理解,比如從北京到張家界旅遊5天,你恐怕不能準確說出要花多少錢,但你可以給出一個範圍,比如10000—13000,你會覺得比較可信。如果給的範圍太大,比如10000—30000,雖然可信度更高一些,但這麼大的範圍參考意義不大;如果給的範圍很小,如10000—10500,雖然準確性提高了,但可信度就似乎不會很高。而找到一個合適的估值範圍,這是置信區間要解決的問題。

說到置信區間我們就要說到點估計和區間估計。

那麼什麼是點估計?什麼是區間估計呢?

之前看到過這樣一個例子,簡直可以很完美的解釋這個問題~

以前很流行一種刮刮卡:

遊戲規則是(假設只有一個大獎):

· 大獎事先就固定好了,一定印在某一張刮刮卡上

· 買了刮刮卡之後,刮開就知道自己是否中獎

那麼我們起碼有兩種策略來刮獎:

· 點估計:買一張,這就相當於你猜測這一張會中獎(直接用樣本統計量來估計總體參數值)

· 區間估計:買一盒,這就相當於你猜測這一盒裡面會有某一張中獎(根據樣本統計量,按一定的概率大小確定包含總體參數值)

很顯然區間估計的命中率會更高(當然費用會更高,因為風險降低了)。

實際上:

點估計量是用於估計總體參數的樣本統計量。但我們不可能期望點估計量能給出總體參數的精確值,所以經常在點估計上加減估計誤差來計算區間估計。

即區間估計的一般形式為:點估計±邊際誤差。

有一個零部件的長度θ未知,我們通過點估計推測θ為9 cm,這還不足夠。如果我們能知道θ有95%的概率在(8.7cm,9.2cm),那麼就理想多了。

那麼由此我們就引出了其他兩個關鍵詞:

置信區間和置信水平

其中(8.7cm,9.2cm)我們就可以理解成置信區間,那麼95%就是置信水平。

由樣本統計量所構造的總體參數的估計區間為置信區間。由於統計學家在某種程度上確定這個區間會包含真正的總體參數,所以取名置信區間。在統計中,一個概率樣本的置信區間(Confidence interval)是對這個樣本的某個總體參數的區間估計。置信區間展現的是這個參數的真實值有一定概率落在測量結果的周圍的程度。置信區間給出的被測量參數的測量值的可信程度,即前面所要求的"一定概率"。這個概率被稱為置信水平。

簡單理解,我們抽取100個樣本,當你不斷改變樣本的時候,由100個樣本構造的總體參數的100個置信區間中,有95%的區間包含了總體參數的真正值,5%沒包含,這個95%稱為置信水平,即1-α。

下面給大家總結一下常用置信水平

那麼怎麼建立置信區間?

置信區間的建立就與中心極限定理和抽樣分布有關,在給定置信度的條件下,置信區間的寬度決定於抽樣分布,會隨著樣本量的增大而減小,在樣本量給定時,置信區間的寬度隨著置信係數的增大而增大。

例如:想了解全國成年男性平均身高,可用抽樣的方法,用樣本信息估計總體信息。從全國男性中抽取一個樣本,這個樣本平均值及對總體平均值的一個點估計,當有多個樣本,即有多個點估計,但不知道哪個樣本對總體的估計最正確,所以用區間估計來解決這個問題。假設全國成年男性平均身高在165-175cm之間,這個區間叫置信區間,及[165,175],這個區間的可信程度是有置信水平來表現,置信水平指置信區間包含總體平均值的概率多大,如置信水平為95%。

當然在不同情況下求不同類型的區間估計時,所用的分布也不同,這裡我們做簡單了解,

1.個總體樣本參數時:

2.兩個總體樣本參數時:

我們以一個總體均值的區間估計為例來理解一下:

【 例 】一家食品生產企業以生產袋裝食品為主,為對食品質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10g。試估計該批產品平均重量的置信區間,置信水平為95%。

該食品平均重量的置信區間為101.44g~109.28g

下面讓我們通過一道練習題鞏再固一下:

從一批產品中隨機抽取100盒進行質量檢驗,檢驗結果有72盒合格,試在95%的把握程度之下對該批產品的合格率進行區間估計,並指出樣本的抽樣平均誤差和極限誤差。

及格率的區間估計:

根據題目可知:n=100 p=72% 1-α=0.95

因為p±Zα/2·{p(1-p)/n}(總體比率置信區間)

α=0.05 查表得Zα/2=1.96

得p±Zα/2·{p(1-p)/n}

=0.72±1.96×{0.72(1-0.72)/100}

=0.72±1.96×(0.448/10)

=0.72±0.088

即區間為【0.632,0.808】

相關焦點

  • 【乾貨】你明白臨床試驗中的P值和置信區間的含義嗎?
    那麼P值和置信區間代表什麼意思呢?為什麼我們要做計算P值或置信區間來做統計推斷呢?在講P值和置信區間之前,我們先講講樣本與總體。在《醫學統計學》中,根據研究目的而確定的同質觀察單位的全體成為總體。觀察單位,又稱個體,是統計研究中的基本單位,他可以是一個人、一個器官、一個細胞。
  • 區間估計、置信區間
    點估計與區間估計刮獎猜測點估計就是單猜某一張彩票是大獎,區間估計就是將點估計的範圍擴大,可以一盒一盒、一個區域、一座城市,說白了就是設置一個半徑。下面採用置信區間構造區間估計但是這個區間多大會影響到所有估計中包含真值的比例,比如由樣本均值的抽樣分布可知,在重複抽樣或者無限總體抽樣的情況下,樣本均值的期望等於總體均值。無數個樣本均值最終可以構造成下面的圖形,但是實際中只能有有限個數據。均值與單個值的距離是相對的,如果某個值在均值的半徑範圍內,則均值也在這個值的對應半徑範圍內。
  • 置信區間與串行數據鏈路如何關聯
    ziZednc表1針對幾個不同的數值np給出了置信區間的計算結果。數值np可以被想像為無誤碼觀察時間,歸一化為UI/ ,其中UI是單位間隔。因此,我們為BER估計的置信區間選擇了一個有用的範圍:70%到99%。ziZednc如果置信區間涉及的BER估計範圍更小,就需要將特定的觀察定義得更「精確」。我們一般會說:「我們不信任低於70%的置信區間,也不在意置信區間比99%高多少,只要夠高就行。」ziZednc圖1顯示了在不同的觀察時間下,置信區間是如何隨BER估計變化的。
  • 置信區間t分布
    1.陳述t分布的形狀和正態分布之間的差異2.說明t分布的形狀與正態分布之間的差異如何受自由度的影響3.在表格中使用以查找在置信區間中使用的t的值4.使用t計算器查找置信區間中使用的t的值在正態分布的介紹中顯示,95%的正態分布面積在平均值的1.96個標準偏差內。
  • 我們常聽說的置信區間與置信度到底是什麼?
    這裡就涉及到統計學裡面的置信區間與置信度,本文簡要介紹了置信區間這一核心概念,它有助於我們從直觀上理解評價估計優劣的度量方法。本文討論了統計學中的一個基本術語 :置信區間。我們僅以一種非常友好的方式討論一般概念,沒有太多花哨的統計術語,同時還會使用 Python 完成簡單的實現!
  • Logistic回歸分析得出某因素的p值<0.05,但OR值的95%可信區間包括1.0 ,如何解釋?
    在Logistic回歸分析時,偶爾會遇到這樣的情況:P值與OR的95%置信區間(CI)結果矛盾的情況,即P<0.05,但OR的95%置信區間卻包括
  • 推論統計 | 抽樣分布,中心極限定理和置信區間
    它將產生間隔(間隔不一定總是與我們的樣本比例相同),其中包括真實比例,即在95%的時間內人口比例為「 p」。如果我們想縮短間隔,即我們必須降低誤差幅度,即由於標準誤差與n成反比,則必須增加n(樣本大小)。因此,我們用置信區間回答的問題是:對於任何給定的估計(樣本),我們對樣本周圍的一定範圍實際上包含真實人口比例的信心如何?
  • 線性回歸分析詳解9:顯著性水平、置信度、置信區間及其計算方法
    置信區間是回歸分析的一個重要概念,但是,將回歸分析應用到需求預測時,並不強求引入置信區間,也就是說,用回歸分析做需求預測時,可以不進行置信區間的計算,而直接進行後續的預測步驟。所以,從這一點來說,大家可以跳過本章,直接進入專欄的第10章,用線性回歸分析進行預測。
  • [理論+SPSS實戰] 點估計與區間估計詳細解析+把論文寫在抗擊疫情的第一線
    任意給你一袋食品,是100%在這個區間內,還是95%的可能在這個區間內,還是90%的可能在這個區間內?這個可能性(n%)就是常說的置信水平,也稱為置信度或者置信係數。舉個例子:從10萬袋上述食品中抽取1000袋食品,其中有900袋的重量在[97.5g---102.5g]之間,有100袋未在此區間,那麼可以估計這批食品重量有90%的可能在[97.5g---102.5g]之間,即在置信度90%條件下,這批食品重量的置信區間為[97.5g---102.5g]。
  • Pytorch貝葉斯庫BLiTZ實現使用LSTM預測時序數據和繪製置信區間
    在本文中,我們將解釋貝葉斯長期短期記憶模型(LSTM)是如何工作的,然後通過一個Kaggle數據集進行股票置信區間的預測。貝葉斯LSTM層眾所周知,LSTM結構旨在解決使用標準的循環神經網絡(RNN)處理長序列數據時發生的信息消失問題。
  • 如何理解統計學中的「估計」,用Excel來幫助你學習
    到這個時候,你可能會問這樣一個問題:怎麼計算與點估計相關的誤差。在全國性的調查和涉及政治議題的民間調查中,通常會表述出那些的誤差範圍,但它們不可能得到適當的解釋為了理解它們,我們需要引入置信區間的概念。置信區間置信區間估計,提供了一種評估點估計準確度的方法。
  • 定目的、觀數據、斷樣本、選公式、縮誤差,五步估算你的樣本有多準
    如果100次中實際應該有95次都包含真實比例,Wald區間的值要小得多,通常會低至50%~60%;換句話說,當你根據Wald公式報告95%的置信區間的時候,它實際上只有70%。應為這個只發生在小樣本或者比例大於0.5的情況下。
  • SD 和SE的意義和用法到底有何不同?
    今天我們就和大家討論下這兩個概念到底在意義和使用上有何不同。首先,想必大家都知道,SD和SE存在數量上的關係,對於一組樣本量為n的數據來說,則但如果二者僅僅是數值上有差別,且可以方便的彼此轉換,那麼我們構造一個指標不就可以了麼?何必要構造兩個指標呢?
  • 單維測驗合成信度三種區間估計的比較
    有三種方法或途徑可以計算單維測驗合成信度的置信區間, 包括 Bootstrap 法、Delta 法和直接用統計軟體(如 LISREL)輸出的標準誤進行計算。本文通過模擬研究進行比較, 發現 Delta 法與 Bootstrap 法得到的置信區間相當接近, 但用 LISREL輸出的標準誤計算的與 Bootstrap 法得到的結果相差很大。
  • 自助法(Bootstrap法)生成1000個C統計量(C index)並計算95%可信區間
    本文基於R語言的boot包,使用自助法(bootstrap法)生成1000個C統計量,並計算95%可信區間(95%CI)。6、使用mean命令計算1000個C指數的均值,使用boot.ci命令計算95%可信區間,使用write.csv命令把1000個C指數保存到工作文件夾。本文全部代碼在公眾號後臺,回復關鍵詞:R代碼,領取
  • 主流幣行情波動較大,OKEx教你如何風控
    它可以計算一個特定時間窗口和指定置信區間內的最大預期損失。交易者可以很方便地使用VaR來判斷交易組合的風險等級或潛在損失從而採取相應的手段來控制風險。  下面OKEx研究員將示例如何使用VaR計算風險。
  • 第四十講 R-線性回歸:預測模型及可信區間
    例如,與速度19相關的95%置信區間為(51.83,62.44),平均預測值為57.1。根據我們的模型,一輛時速為19 mph的汽車的平均制動距離為51.83到62.44ft,即平均值落在51.83到62.44到概率為95%。
  • 檢驗項目的參考值和參考區間
    實驗室應為檢驗項目提供可靠的參考區間(Reference Interval),才能使臨床對健康普查者的檢驗結果作出判斷,對病人檢驗結果有大致的了解,發揮檢驗報告的作用。因此獲得檢驗項目的可靠的參考區間是實驗室的重要任務。