平均數抽樣分配
抽樣分配(sampling distribution)是樣本統計量的機率分配,例如從母體分配(μ,σ2)中重複抽取無數次的樣本,計算某一個樣本統計量(例如平均數),則無限多個平均數會形成一個常態分配,以
表示,稱為樣本平均數的抽樣分配(sampling distribution of means)。
對於全山東省大學生的智力分數這個母體(圖1(a)),如果從中隨機抽取一個人數為n的樣本,可得到一個X的平均數,如果重複抽取,可重複得到平均數Xi-,此時樣本統計量(平均數)本身為一隨機變數,所形成的次數分配即為平均數抽樣分配,統計上的定義為:對於一個樣本大小為n的樣本平均數,所有可能出現的數值所形成的機率分配,其平均數為ux﹣變異數為σ2/x ,如圖1(b)所示。
在推論統計,母數通常是未知而需要加以估計,此時,抽樣分配扮演重要角色。更具體來說,抽樣分配是一個基於機率理論所建立的統計分配,其最主要的功能是在推估母體參數。在以平均數為基礎的抽樣分配中,平均數抽樣分配的平均數即等於母體平均數μ。由上一期公式,可以推知:
當上述公式滿足時,我們即可宣稱樣本平均數是母體平均數的不偏估計數。也就是說,雖然我們無法針對母數μ進行測量,但是我們可以透過樣本統計量來正確推估母數,如果抽樣是隨機進行的,那麼樣本統計量的隨機分配的期望值(平均數),即是母數平均數μ所在位置,這就是著名的中央極限定理概念。
抽樣標準誤
在介紹中央極限定理的概念之前,還有一個重要的名詞需要說明,也就是抽樣誤差的概念。我們可以很輕易的理解,對於某一個母體進行無限次取樣所得到的樣本平均數,不會每一次都是同一個數值。例如第一個樣本IQ平均數是132,第二次取樣的IQ平均數可能是122,如果母體平均數為125(全國大學生的平均IQ),樣本樣本平均數會以125為中心呈現波動狀態。此時,樣本的平均數之所以會呈現隨機波動的現象,是因為抽樣誤差(sampling error)的存在,來自樣本是母體的部分集合所致。因此,抽樣分配的平均數表示母數所在的位置,而其標準差,反映了抽樣誤差的大小,稱為標準誤(standard error of the sample mean),以ux﹣表示,其變異數稱為變異誤(squared standard error of the sample mean),以σ2/x 表示
根據上述公式,變異誤反映了每一個樣本平均數與總平均數之間離散情形的期望值。由於每一個樣本具有相同的機率函數,每一個樣本的離散情形的期望值即等於母體變異數σ²,公式如下:
當標準誤或變異誤越大,表示抽樣的誤差越大,標準誤或變異誤越小,表示抽樣的誤差越小。標準誤是基於機率理論所建立的一個反映抽樣誤差的統計量,其統計原理與標準差相同,但意義上更有高度的應用價值,在推論統計上,標準誤具有相當重要的地位。