《抽樣進階2》結尾描述了抽樣分布和總體分布的關係(三大規律):
抽樣分布的形狀與總體分布無關,總是正態分布(樣本量n≥30);
抽樣分布的均值等於總體均值μ;
抽樣分布的標準差等於總體標準差σ的1/√n倍。
抽樣誤差
從總體(全國7億成年男性的身高)中隨機抽取一個樣本(300名成年男性的身高),這個樣本的均值(300名成年男性的平均身高)很難恰好等於總體的均值(全國成年男性的平均身高)。如果我們用這個樣本均值來估計總體均值μ,就會產生估計誤差(Error)。因為這個誤差是由抽樣的隨機性造成的(如果再抽樣一次,就可能是另外300人入選,樣本的平均身高就變了),所以命名為「抽樣誤差」(Sampling Error)。
標準誤差
我們非常希望知(ji)道(suan)抽樣誤差(-μ)的大小,但它是個隨機變量(取值總在變化)。因此我們想到了之前的抽樣分布,它的標準差 (σ/√n)刻畫了樣本均值 (一個隨機變量)圍繞總體均值μ(一個常數)波動的幅度,可以從「平均意義上」代表抽樣誤差。這就是標準誤差。如果你願意,也可以叫「平均」抽樣誤差。
註:
「標準誤差」有時簡稱為「標準誤」,
「標準差」其實是「標準離差」的簡稱。
標準誤差的公式寫成字母更簡單:
這個公式告訴我們:
n=2500?
弄明白標準誤差,我們就可以完成《抽樣進階1》中的川普任務了。
假如我們準備調查n名美國公民對川普的態度(一次隨機抽樣),每個人可以自由選擇:
「喜歡」,(翻譯成小學數學是x=1)
「討厭」,(翻譯成小學數學是x=0)
那麼x是個隨機變量,這n名美國人(樣本)對於川普的支持率,恰好就是樣本均值(把所有人的1或0加起來,除以n)。
總體標準差σ專門用來刻畫全體美國人民對川普的態度差異,有三種極端情況:
當全體美國選民都選擇「喜歡」時,大家態度完全一致,完全沒有差異,因此σ達到最小,σmin=0;
當全體美國選民都選擇「討厭」時,大家態度也完全一致,完全沒有差異,所以σ也達到最小,σmin=0;
當「喜歡」和「討厭」川普的人數一樣多的時候,因為沒有了「大多數」,兩派勢均力敵,所以意見最不一致,態度差異最大(完全對立),這時σ最大,σmax=0.5。具體計算,請先回憶一下標準差的計算公式,再代入此時總體均值μ=0.5,N是美國選民總數:
根據抽樣分布的三大規律,對於無數次抽樣,會有95.4%的樣本均值(抽樣觀察到的支持率)出現在總體均值μ(全國的支持率)兩側各2個標準誤差的範圍內。如下圖:
因為總體標準差σ最大為0.5,所以在95%把握下,估計誤差最大值為:
因為白宮要求估計誤差在正負2%以內,所以:
口算就可以知道,n=2500!也就是說,我們調查2500人就夠了。
(,千萬別大聲!)
記住這個公式,你會馬上知道:
當n=100時,估計誤差最大是正負10%;
當n=400時,估計誤差最大是正負5%;
當n=10000時,估計誤差最大是正負1%;
……
這個在95%的把握下,用樣本均值估計總體均值所產生的的誤差最大值,被稱作「保守邊際誤差」,有點「最大」抽樣誤差的意思,簡稱CME。有些專業報告裡面會出現,它是反映抽樣誤差的另一個常用指標。