也就是說,當樣本越大(n越大),平均數抽樣分配的變異數或標準差越小,變異數(又稱變異誤)與樣本數大小成反比,或是說標準差(又稱標準誤)與樣本數大小的平方根成反比。最後,不論原始母體的形狀是否為常態分配,當樣本人數夠大時,抽樣分配會趨近於一個常態分配。正因為抽樣分配為常態分配這個基本假設的存在,樣本統計量的機率分配可以利用常態分配來表述,並據此來進行假設考驗。
基於上述幾個特徵,樣本統計量可以根據抽樣分配的機率原理來推估母數,並估計抽樣誤差的大小,稱為中央極限定理(Central Limit Theorem)。完整定義為:對於任何一個母體(μ,σ²),樣本大小為n的樣本平均數所形成的分配,當樣本大小n趨近無限大時,亦趨近於常態分配(μ,σ²/n)。
1920年,G.Polya以這個定理在統計學中的核心與重要性,取central一詞來命名。國內的中文翻譯成中央極限,亦有抽樣分配的平均數逼近母體平均數的意義,也十分傳神。
由於樣本來自母體,因此抽樣分配的分布特徵受到母體分配的影響。抽樣分配與母體分配的關係有兩個特性,第一,抽樣分配的標準差最小是0(當樣本人數等於母體人數時),最大等於母體標準差σ(當樣本人數為1時),在一般情形下,抽樣分配的標準差會小於母體標準差,而以母體標準差σ為極大值。
第二,抽樣分配的常態性受到母體常態性的影響。如果母體為常態分配,無論樣本人數多少,抽樣分配則必定是常態分配,但是如果母體不是常態分配,則抽樣分配隨著樣本數越大,越接近常態分配,明顯受限於母體分配特徵,抽樣分配有可能不是常態分配,而需以樣本數增加的方法來確保抽樣分配的常態性。
母體的偏誤與抽樣分配的關係可以用圖1表示,圖1(a)顯示母體是一個呈現正偏態(例如臺灣大學生中具有一些高IQ者),平均數為125(μ=125)。圖1(b)為一個樣本數為200的樣本分配,其形狀也呈現正偏態,平均數為127.5。這兩個分配都是IQ隨機變數的原始次數分配,也就說,分配中的每一個數值是IQ觀察值(以Xi表示),而非樣本統計量。而樣本的分配的形狀,反映了母體分配的形狀。
圖1(c)與(d)則為抽樣分配的圖示。其中圖1(c)為100個n=200的樣本的平均數所形成的抽樣分配,平均數為126.4,圖中每一個黑色小方實體表示一個n=200的樣本,總共有100個方塊。由於個別樣本的人數為200,已經遠大於30這一個統計分配是否常態的判斷指標,其形狀趨近於常態分配。
圖1(d)為無限個n=200樣本的平均數所形成的抽樣分配,也就是理論上的抽樣分配,此時分配的平均數即等於母體平均數的125,其形狀為一標準常態分配,圖1(a)與(d)為樣本統計量的次數分配,也就是抽樣分配,X軸上為樣本統計量(X的平均數),其標準差遠遠小於母體標準差。
由四個圖形的關係可以看出,理論抽樣分配的平均數才能反映母體平均數,即是母體本身沒有呈現常態,只要樣本數夠大,抽樣分配也會趨近於常態分配,此時套用常態分配的機率分布符合理論統計理論。