分層抽樣,也叫類型抽樣。就是將總體單位按其屬性特徵分成若干類型或層,然後在類型或層中隨機抽取樣本單位。
通過劃類分層,增大了各類型中個體間的共同性,容易抽出具有代表性的調查樣本。該方法適用於總體情況複雜,各層/類之間差異較大,個體較多的情況。
分層定比:各層樣本數與該層總體數的比值相等。
例如:一所學校的男女比例是3:7,那麼對該校男女生進行分層抽樣的樣本數比值也應該是3:7。
非比例分配法:當某個層次包含的個案數在總體中所佔比例太小時,為使該層的特徵在樣本中得到足夠的反映,可人為地適當增加該層樣本數在總體樣本中的比例,但這樣做會增加推論的複雜性。
註:本文參考資料均來源於課程《妙趣橫生的統計學》
總體中賴以進行分層的變量為分層變量,理想的分層變量是調查中要加以測量的變量或與其高度相關的變量。
分層的原則是增加層內的同質性和層間的異質性。常見的分層變量有性別、年齡、教育、職業等。
分層隨機抽樣在實際抽樣調查中廣泛使用,在相同樣本容量的情況下,它比純隨機抽樣的精度高,此外管理方便,費用少,效度高。
1、分層抽樣要求各層/類之間的差異很大,個體較多,層/類內個體差異小的情況;
2、整群抽樣要求各群具有較好的代表性,即群內各單位的差異要大,群間差異要小的情況;
3、一般認為有序系統抽樣比等比例分層抽樣能使樣本更均勻地分布在總體中,抽樣誤差也更小。
某研究單位有科研人員168人,其中具有高級以上職稱的24人,中級職稱48人,其餘96人均為初級以下職稱的人。
現要採用分層抽樣的抽取方法,從不同職稱中抽取一個容量為35的樣本,調查該單位科研人員的心理資本及職業倦怠傾向。下面是樣本抽樣的過程:
由總體可知對高級職稱、中級職稱和初級職稱這三個層級的抽取比例應該是1:2:4;因此,在這三個層級中分別隨機抽取樣本量為5、10和20的樣本數,最終得到容量為35的樣本。
最近,我們連續介紹了
統計抽樣最常用的五種抽樣方法,
對它們的特點和使用場景進行了說明。
下一篇推文,我將對這些抽樣方法進行總結,
敬請期待。
如果想要更系統地學習統計學知識,
可點擊文末閱讀原文,
學習《妙趣橫生的統計學》課程!