抽樣分布:如何進行參數的點估計和區間估計?

2021-02-23 量化研究方法

為了更準確地估計總體的參數,人們提出了很多方法,如勒讓德的最小二乘法、貝葉斯的貝葉斯估計法、卡爾·皮爾遜的矩估計法、費歇爾的極大似然估計等等。本文不試圖介紹這些方法,而是給出直接給出結論,對推導過程感興趣可以參考相關教材。

點估計

總體分布的參數在很多情況下是未知的,如均值μ、方差σ2、泊松分布的λ、二項分布的比例π,其它分布還會有更多的未知參數,需要通過樣本進行相應的估計,這種估計值就是點估計。

點估計通常用參數上方畫一個「^」表示該參數的估計量。運用上面提到的幾種估計方法,常見的幾種參數的點估計量是:

對於總體均值μ,;

對於總體方差σ2,

對於總體比率π,,x是樣本量為n的隨機樣本中特定事件發生的次數;

對於泊松總體的λ,,其中n為總樣本量,xi為隨機變量X的取值,ni為每個取值出現的次數,

點估計的評價

無偏性:如果參數估計值的數學期望等於被估計的參數值,則稱此估計量為無偏估計。與此相反則稱為有偏估計。

需要注意的是,雖然S2是σ2的無偏估計,但S不是σ的無偏估計,其值要略小一些,尤其是小樣本時,差距會非常明顯。為解決這個問題,需要加以修正,要將S除以c4得到σ的無偏估計,這個值在樣本量增大時逐漸趨向1。

類似的,另一種估計σ的方法是用樣本的極差R,如果樣本被分成若干子組,對於每組都可以先求組內極差R,對於多組R可以求出其平均值,然後將除以d2。例如,如果每子組只含2個樣品時,d2=1.128,這樣也是σ的無偏估計,但是也只考慮了組內的波動。用極差來估計標準差的方法在控制圖、測量系統分析、過程能力分析等工具中廣泛運用。(這兩段內容來自馬逢時《六西格瑪管理統計指南》p.96)

有效性:當一個參數有多個無偏估計時,估計方差越小則越有效。

相合性(一致性):如果隨著樣本量增大,參數的估計量趨於被估計的參數值。

這三性統計學家們已經幫我們證明好了,不必去糾結如何證明了。

區間估計

對於未知參數,點估計值只是一個近似值,會存在或大或小誤差,這時給一個範圍可能是更合適,也是更可信的。比如從北京到張家界旅遊5天,你恐怕不能準確說出要花多少錢,但你可以給出一個範圍,比如10000—13000,你會覺得比較可信。如果給的範圍太大,比如10000—30000,雖然可信度更高一些,但這麼大的範圍參考意義不大;如果給的範圍很小,如10000——10500,則準確性提高了,但可信度就似乎不會很高。找到一個合適的估值範圍,這是置信區間要解決的問題。

置信區間概念是由原籍波蘭的美國統計學家耶日·奈曼提出的。在《女士品茶》中,作者介紹了這個概念提出時的情景。

1934 年,耶日·奈曼在皇家統計學會做了一個演講,題目是《論代表性方法的兩個不同方面》(On the Two DifferentAspects of the Representative Method)。他的論文是關於抽樣調查分析的。但全文最重要的部分卻在附錄裡,奈曼在這個附錄中提出了一個很直接的方法,用來創建區間估計,並確定所得的區間估計值有多準確。奈曼稱這個新的方法為「置信區間」(confidence intervals),而把置信區間的兩端稱為「置信界限」(confidence bounds)。

G·M·鮑利(G. M. Bowley)教授是大會的主席,對此表示出疑惑。費歇爾也在批判者之中,自始至終都難以接受。可見當時這個概念的提出給人帶來了什麼樣的震撼。(感興趣者可以參閱《女士品茶》中的描述)

置信區間涉及兩個問題,一個是置信水平,另一個是如何建立置信區間。

所謂置信水平就是本節開頭提到的給出一個區間的信心,這個信心以概率來表示,絕大多數情況下取0.95,表示你對所估計的總體參數有95%的信心落在你所給的區間內。通常置信水平以1-α表示,α稱為顯著性水平,在後面假設檢驗中會重點介紹。

置信區間的建立就與中心極限定理和抽樣分布有關了,在給定置信度的條件下,置信區間的寬度決定於抽樣分布。下面介紹分別介紹單總體均值、方差和單總體比例的置信區間。更複雜的如雙總體均值差、雙總體比率差等置信區間的建立請參與相關教科書。

建立置信區間的意思是在設定的置信水平(如取0.95)下,總體參數落在這個區間的概率為0.95,大致的理解是如果抽100次樣,建立100個置信區間,大約95個區間包含總體參數,約5個區間不包含總體參數(注意不是一定有5個,可能會多,也可能會少)。

單總體均值的置信區間

1.總體方差已知時,正態總體均值服從正態分布,前面《抽樣分布總結》已經介紹過

取概率,即在置信度為(1-α)時,求出z1和z2兩個值,通常選擇置信區間左右對稱,將α分成相等的兩部分。這樣z1和z2就分別等於zα/2和z1-α/2。如果α取0.05,則兩個值分別為-1.96和1.96。將Z帶入,則可以算出

由此得出:

所以總體方差已知時,正態總體均值的置信區間為

2.總體方差未知,用樣本標準差S來代替α,這時正態總體的置信區間要用t-分布來計算,結論直接給出

通常來說,總體方差已知是很罕見的,因此大部分情況下我們都是用t-分布來計算置信區間。

 3.在大樣本情況下,依據中心極限定理,即使不是正態分布,其均值近似服從正態分布,通常樣本量超過30就可以很好地近似。在這種情況下,可以得出大樣本情況下均值的置信區間為

單總體方差和標準差的置信區間

我們已經知道,樣本方差與總體方差之比服從χ2-分布。因為χ2-分布是偏態分布,所以樣本方差構成的總體方差置信區間是不對稱的。這裡直接給出結論

由此可得出,正態總體標準差的置信區間為

單總體比例的置信區間

1.小樣本情況下,不能用正態分布來近似,這時需要採用二項分布查表法來建立比率的置信區間。

記總體的比率為π,樣本的比率為p,樣本量為n,我們知道總體服從二項分布B(x, n, π),我們用p來估計π。下面我們用一個例子來說明。

例:某醫院用某藥治療腦動脈硬化症25例,其中顯效者20例。問該藥總顯效率的95%置信區間為多少?

解:先計算p,p=20/25=0.8

在置信水平為95%的條件下,我們需要查表找出n=25,p=0.8時概率為0.025和0.975的X值,查表分別為15、16之間和23、24之間,取15和24,則總體比率π的置信區間為(15/25,24/25)=(0.6,0.96)。

2.大樣本條件下的正態近似。當np和n(1-p)都大於5,且p取值適中(在0.1與0.9之間),則可以用正態分布來近似,即有

由此構建的總體比率π的置信區間為:

置信區間的一些特點

1.在樣本量相同的情況下,置信水平越高,置信區間越寬,同樣的樣本取置信水平0.9、0.95、0.99,則置信區間的寬度有這樣的關係,CI(0.9)<CI(0.95)<CI(0.99),CI為Confidence Interval簡寫。這很好理解,你希望估計的信心越大,你就要把區間取得越寬。

2.在置信水平相同的條件下,樣本量越大,置信區間越窄。這也很好理解,以均值的置信區間為例,決定置信區間寬度的是方差,而決定樣本均值的方差與樣本量成反比,即樣本量越大,樣本均值的方差越小。

文章來源:知乎專欄(如涉及版權問題,請及時轉告)

作者:張老師漫談六西格瑪

相關焦點

  • 抽樣分布篇之十:再談參數的點估計和區間估計
    首先要說明一下,在通常的概率論與數理統計課本中,會將概率理論(含概率論基礎和隨機變量分布)、抽樣理論(含抽樣方法、中心極限定理和抽樣分布)、估計理論(含點估計和區間估計)、假設檢驗這四部分內容當作數理統計學的基礎,其後的統計方法都是基於這些基礎由不同的統計學家從不同的角度發展演化而來的。
  • 推斷統計基礎:點估計與區間估計
    推斷性統計學:抽樣設計;通俗解釋「大數據」及推斷性統計學:抽樣分布均值的抽樣分布;抽樣分布:詳述均值的抽樣分布及中心極限定理;抽樣分布:t分布;切比雪夫(Chebyshev)定理;參數估計參數估計:就是根據樣本統計量的數值對總體參數進行估計的過程。
  • 參數估計之點估計和區間估計
    即根據樣本數據如何選擇統計量去推斷總體的分布或數字特徵等。統計推斷是數理統計研究的核心問題。所謂統計推斷是指根據樣本對總體分布或分布的數字特徵等作出合理的推斷。它是統計推斷的一種基本形式,分為點估計和區間估計兩部分。一、點估計點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。
  • 區間估計、置信區間
    點估計與區間估計刮獎猜測點估計就是單猜某一張彩票是大獎,區間估計就是將點估計的範圍擴大,可以一盒一盒、一個區域、一座城市,說白了就是設置一個半徑。下面採用置信區間構造區間估計但是這個區間多大會影響到所有估計中包含真值的比例,比如由樣本均值的抽樣分布可知,在重複抽樣或者無限總體抽樣的情況下,樣本均值的期望等於總體均值。
  • 如何通過抽樣分布估計你的模型的不確定性
    在這篇文章中,我將演示如何評估模型性能的不確定性,以及數據集的大小如何影響它。性能不確定性的出現是因為你在測試集上評估模型,而測試集通常是從初始數據集中隨機抽取的樣本。由於測試集是我們整個數據集的隨機樣本(它扮演統計總體的角色),我們從它計算的所有統計數據都是隨機變量,它們具有一些潛在的分布。
  • 參數估計(一):點估計
    所謂點估計,就是用一個參數點θhat來估計另外一個未知參數θ。它區別於區間估計。它主要有矩估計法、極大似然估計法和貝葉斯法。A. 矩估計法(K·皮爾遜)這個方法的思想非常簡單,在任意一本概率論與數理統計課本中都能找到其表述。思想是用樣本矩(sample moments)來估計總體矩。
  • 如何理解統計學中的「估計」,用Excel來幫助你學習
    點估計是以抽樣得到的樣本指標作為總體指標的估計量,並以樣本指標的實際值直接作為母體未知參數的估計值的一種推斷方法。無偏估計量我們似乎可以十分直觀地認為,樣本平均值應當為母體平均值提供了很好的點估計。統計學家提出了許多類型的估計量,而且從理論以及實踐的角度看,它們「真正地估計」了它們應當估計的母體參數。假設我們進行一個試驗,在試驗中,我們反覆從母體中抽樣,並且計算了針對母體參數的點估計。每個單獨的點估計將不同於母體參數,不過,我們應當可以預期,所有可能的點估計的長期平均值(期望值)將與母體參數相等。
  • [理論+SPSS實戰] 點估計與區間估計詳細解析+把論文寫在抗擊疫情的第一線
    經過本次推文你不僅明白了,還會學會如何手動以及利用SPSS如何計算了!!!最新論文:最近鬧得「很熱」的一篇國際頂級期刊《新英格蘭醫學雜誌》上發表的題為「新型冠狀病毒感染性肺炎在武漢的早期傳播動態」的文章。
  • 你真的了解參數估計和假設檢驗嗎?
    「推斷統計」就是利用樣本統計量,去推斷總體參數的一種方法。  1)參數估計、點估計和區間統計的概念參數估計:用樣本統計量去估計總體的參數。比如,用樣本均值去估計總體均值,用樣本方差去估計總體方差。點估計:用樣本統計量的某個取值,直接作為總體參數的估計值。區間估計:在點估計的基礎之上,給出總體參數估計值的一個區間範圍,該區間通常由樣本統計量加減估計誤差得到。
  • 參數估計-矩估計
    在數學和統計學中,矩(moment)是對變量分布和形態特點的一組度量。在統計學中,總體特徵數除了平均數、方差等,還有就是原點矩與中心距,稱其為總體中心距與總體原點矩。在樣本特徵數中也有原點矩與中心距,稱其為樣本原點矩與樣本中心距。
  • 必考知識點,CFA一級數量分析-抽樣與估計
    下一篇文章,我們將會進行假設檢驗的講解。這篇文章主要的內容為抽樣和估計,通過從總體中抽取樣本獲得樣本統計量進行分析,從而反推總體的參數,對其進行估計。引言現實生活中,特別是在金融領域,我們每分每秒都在形成大量的交易數據。我們如何通過這麼多的數據來評判整個全球市場的運行情況呢?近期頻上熱門的「熔斷」想必大家都聽說過吧。
  • 基於DMFT的LFM信號參數估計
    在離散匹配傅立葉變換的基礎上對算法進行改進,並利用改進後的算法分別對單分量和多分量線性調頻信號進行仿真,仿真結果表明離散匹配傅立葉變換能夠在低信噪比情況下比較準確地估計出線性調頻信號的參數,不存在交叉項問題。離散匹配傅立葉變換是一種針對線性調頻信號有效的參數估計方法。
  • 通俗易懂告訴你:何為95%置信區間?
    而找到一個合適的估值範圍,這是置信區間要解決的問題。說到置信區間我們就要說到點估計和區間估計。那麼什麼是點估計?什麼是區間估計呢?實際上:點估計量是用於估計總體參數的樣本統計量。但我們不可能期望點估計量能給出總體參數的精確值,所以經常在點估計上加減估計誤差來計算區間估計。即區間估計的一般形式為:點估計±邊際誤差。
  • 科研實務 | 護理研究:「總體參數估計」樣本量選擇(1)
    小編上兩期幫大家匯總了預實驗以及正式實驗的樣本量計算公式,可是公式裡各種代碼、字母太多,很容易計算錯誤,今後這段時間,小編針對每個公式進行講解。今天先來講第一個。1.總體均數區間估計樣本量總體參數估計是指根據樣本的特徵,去估計總體的特徵。總體均數區間估計樣本量是指對計量資料進行樣本量估計。
  • 最大似然法估計正態分布參數
    最大似然估計定義最大似然估計(maximum likelihood)就是利用已知的樣本結果,反推最具有可能(最大概率)導致這些樣本結果出現的模型參數值。換句話說,極大似然估計提供了一種給定觀察數據來評估模型參數的方法,即「模型已定,參數未知」。
  • 什麼是極大似然估計?
    ,或者最大似然估計,它是一種參數估計方法。在機器學習中,邏輯回歸就是基於極大似然估計來計算的損失函數。那麼,如何直觀理解極大似然估計?極大似然估計(maximum likelihood estimation,MLE),顧名思義,「極大」意為「最有可能的」,「似然」意為「看起來像的」,「估計」的意思則可以理解為「就是這樣的」。
  • 如何估計球體體積和任意函數的平均值?
    計算球體體積的方法很多,本篇我們用一種特殊的方法來計算,這種方法不但可以計算球體體積,拋物體體積,還可以計算任意函數的平均值,它就是:函數值乘以區間長度的和估計我們要求的的量,首先來了解球的體積球的體積:
  • 2021考研概率論與數理統計衝刺:參數估計考試要求_北京中公教育
    參數估計考試要求1.理解參數的點估計、估計量與估計值的概念。2.掌握矩估計法(一階矩、二階矩)和最大似然估計法。3.了解估計量的無偏性、有效性(最小方差性)和一致性(相合性)的概念,並會驗證估計量的無偏性。4、理解區間估計的概念,會求單個正態總體的均值和方差的置信區間,會求兩個正態總體的均值差和方差比的置信區間。
  • 一文讀懂矩估計、極大似然估計和貝葉斯估計
    數理統計最常見的問題包括參數估計,假設檢驗和回歸分析。所謂參數估計,就是已知隨機變量服從某個分布規律,但是概率分布函數的有些參數未知,那麼可以通過隨機變量的採樣樣本來估計相應參數。參數估計最主要的方法包括矩估計法,極大似然估計法,以及貝葉斯估計法。機器學習中常常使用的是極大似然估計法和貝葉斯估計法。
  • reg2logit:用OLS估計Logit模型參數
    LDM 模型來源於 LPM 和 logit 模型的轉換。首先,LDM 可以轉換為一個 logit 模型,其次,線性概率模型 (LPM) 的參數估計能夠轉換為「第一步轉換後的 Logit 模型」參數的極大似然估計。