統計基礎:【11】分層抽樣

2021-02-20 spss統計分析

分層抽樣,也叫類型抽樣。就是將總體單位按其屬性特徵分成若干類型或層,然後在類型或層中隨機抽取樣本單位。

通過劃類分層,增大了各類型中個體間的共同性,容易抽出具有代表性的調查樣本。該方法適用於總體情況複雜,各層/類之間差異較大,個體較多的情況。

分層定比:各層樣本數與該層總體數的比值相等。

例如:一所學校的男女比例是3:7,那麼對該校男女生進行分層抽樣的樣本數比值也應該是3:7。

非比例分配法:當某個層次包含的個案數在總體中所佔比例太小時,為使該層的特徵在樣本中得到足夠的反映,可人為地適當增加該層樣本數在總體樣本中的比例,但這樣做會增加推論的複雜性。

註:本文參考資料均來源於課程《妙趣橫生的統計學》

總體中賴以進行分層的變量為分層變量,理想的分層變量是調查中要加以測量的變量或與其高度相關的變量。

分層的原則是增加層內的同質性和層間的異質性。常見的分層變量有性別、年齡、教育、職業等。

分層隨機抽樣在實際抽樣調查中廣泛使用,在相同樣本容量的情況下,它比純隨機抽樣的精度高,此外管理方便,費用少,效度高。 

1、分層抽樣要求各層/類之間的差異很大,個體較多,層/類內個體差異小的情況;

2、整群抽樣要求各群具有較好的代表性,即群內各單位的差異要大,群間差異要小的情況;

3、一般認為有序系統抽樣比等比例分層抽樣能使樣本更均勻地分布在總體中,抽樣誤差也更小。

 

某研究單位有科研人員168人,其中具有高級以上職稱的24人,中級職稱48人,其餘96人均為初級以下職稱的人。

現要採用分層抽樣的抽取方法,從不同職稱中抽取一個容量為35的樣本,調查該單位科研人員的心理資本及職業倦怠傾向。下面是樣本抽樣的過程: 

由總體可知對高級職稱、中級職稱和初級職稱這三個層級的抽取比例應該是1:2:4;因此,在這三個層級中分別隨機抽取樣本量為5、10和20的樣本數,最終得到容量為35的樣本。

最近,我們連續介紹了

統計抽樣最常用的五種抽樣方法,

對它們的特點和使用場景進行了說明。

下一篇推文,我將對這些抽樣方法進行總結,

敬請期待。

如果想要更系統地學習統計學知識,

可點擊文末閱讀原文

學習《妙趣橫生的統計學》課程!

相關焦點

  • 推斷性統計學:抽樣設計
    基礎準備統計學分類:統計學的理論框架推斷性統計學大多數研究的目的是取得有關總體的一般真實情況。
  • 2011年統計從業考試《統計基礎知識》第五章至第八章 考試大綱
    發表時間:2011/3/15 15:27:06 來源:網際網路點擊關注微信:《統計基礎知識》第五至第八章  考試大綱第五章  時間數列學習目的與要求:學習並掌握時間數列的概念、作用、種類、特徵和編制原則;計算平均發展水平(序時平均數)
  • 高二數學複習方法:數學統計簡單隨機抽樣
    (2)簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨  機地抽取調查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關聯性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數目較少時,才採用這種方法。
  • 隨機分組和隨機抽樣的區別
    不信你試試,你能清楚得知道隨機分組和隨機抽樣的區別嗎?懵了吧?別著急,小編慢慢給你娓娓道來。隨機分組(Randomization)是指總體的每一個觀察單位都有同等的機會被選入樣本中來,並有同等的機會進行分組。隨機分組的目的是通過隨機,均衡幹擾因素的影響,使試驗組和對照組具有可比性,避免主觀安排帶來的偏性。
  • 機器學習數學基礎:數理統計與描述性統計
    今天是概率統計基礎的第二篇文章, 基於第一篇隨機變量與隨機事件進行整理, 首先理一理這裡面的邏輯,第一篇的內容蘊涵了大部分概率論的知識(除了大數定律和中心極限定理這種理論性的支持, 後期有機會會補上)。而今天的這篇內容是在概率論的基礎上往前一步, 屬於數理統計的內容。
  • 數據分析必備——統計學入門基礎知識
    ——數據說·夢想季 導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。
  • 調查失業率統計方法科學規範
    從指標定義、調查內容、抽樣設計、調查方法等方面看,我國調查失業率統計方法科學規範,符合國際慣例,我國調查失業率數據可以全面、準確、及時地反映我國勞動力市場運行狀況,也具有國際可比性。   三、抽樣設計科學合理   我國勞動力調查在抽樣設計過程中與國際勞工組織以及國內外相關機構、科研院所充分溝通交流,抽樣方式、樣本量確定、加權調整、抽樣誤差計算幾個方面均科學合理
  • 數據分析必備——統計學入門基礎知識 - 人人都是產品經理
    編輯導語:不論在什麼崗位,都要懂得本崗位的基礎知識,打牢基礎後面才能穩步發展;數據分析也是如此,數據分析必須要掌握統計學的基礎知識;本文是作者分享的關於統計學入門基礎的知識,我們一起來學習一下吧。要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!
  • 全國2011年4月自學考試教育統計與測量真題
    1.下列哪些學科與數理統計相交叉結合產生教育統計學(      )A.教育學、生理學  B.教育學、心理學C.社會學、教育學  D.生理學、心理學2.下列關於教育統計與教育測量的關係,敘述正確的是(      )A.教育統計與教育測量相互獨立B.教育統計是教育測量的基礎C.教育統計在教育測量提供的數據的基礎上進行
  • 2003年1月全國高等教育自學考試國民經濟統計概論試題
    1.分析對外貿易總量平衡的指標是( )    A.進出口比價指數B.進出口物量指數    C.進出口貿易差額D.進出口盈虧率    2.具有將分組法和貫徹隨機原則相結合特點的抽樣組織形式是( )    A.簡單隨機抽樣B.分層抽樣    C.等距抽樣D.整群抽樣    3.下列社會產品中
  • 實行「陽光抽樣」,黑龍江省七臺河市市場監管局提升食品抽樣工作的...
    七臺河市市場監管局黨組書記、局長高翔要求各部門務必高度重視,切實提高對抽樣工作的認識,加強組織領導,對此次專項抽樣工作任務,指定專人負責配合,在規定時限內具體實施。同時,各部門要結合抽樣工作實際,進一步優化工作流程,密切部門協作,提高工作效率,保障抽樣工作順利有效開展。
  • 統計知識不容忽視:數據科學家必須了解的統計學
    這些統計學概念有助於我們更好地理解不同模塊和各種技術,它們是數據科學、機器學習和人工智慧領域很多概念的基礎。1.集中趨勢度量集中趨勢的一個度量是找到一組數據中間位置的數值,用它來描述這一組數值。總體與樣本的簡介圖4.中心極限定理中心極限定理是概率論的關鍵概念,因為它指出正態分布適用於其他分布問題的概率和統計方法
  • 奮進中的中國統計:城市統計工作成績斐然
    改革開放以來,城市統計調查工作的領域不斷拓寬,統計制度方法不斷改進完善,統計調查數據質量穩步提高,服務水平全面提升,為滿足國家宏觀調控和社會公眾的需要,發揮了不可替代的重要作用。目前,在相關部門的配合下,國家統計局正探索建立城鎮低收入居民基本生活費用價格指數統計制度,為國家制定有關政策提供基礎數據,以緩解物價上漲對低收入群眾生活的影響,完善價格變動在利益分配、利益補償方面的調節作用。
  • 山東財經大學考研——21年應用統計考前最後衝刺複習建議
    ,它是在對樣本數據進行統計描述的基礎上,對統計總體未知數量特徵做出的概率形式的推斷。抽樣誤差:由於抽樣的隨機性引起的,樣本數據與總體真值之間的誤差。第二章:2.2統計分組,統計分組原則; 組距數列編制,開口組組距(隱含在計算題中);2.3各種統計圖表示什麼類型的數據?它們各有哪些功能?
  • 2020年考研數學複習之概率論與數理統計的基礎基本概念
    一般來講,數理統計是歷屆考生的薄弱點,很多考生感到公式多不好記,其實只要熟記單總體的樣本均值,樣本方差,樣本矩,以及樣本均值和樣本方差的期望和方差。另外,三大分布的典型模式和參數是我們重點要掌握的。再就是,正態總體抽樣分布的一些性質也是重點掌握的內容。接下來我們對以上內容分別進行討論。
  • 全國2002年4月自學考試教育統計與測量真題
    1.學生的英語測驗成績屬於( )A.名義量尺B.順序量尺C.等距量尺D.比率量尺2.常用於描述離散性隨機變量統計事項的統計圖是( )A.條形圖B.次數直方圖C.次數多邊圖D.散點圖3.下列統計量中對數據變化靈敏性最差的是( )A.方差
  • R語言——通過bootstrap自抽樣量化統計估計量的不確定性
    之後,我們對樣本進行重複抽樣,容量仍為10,因為是重複抽樣,這10個結果中有的結果可能被抽出來兩次甚至多次。下圖是我的統計學老師的筆記中解釋bootstrap流程的圖:回到線性回歸分析,假如我們想要獲得回歸係數的bootstrap standard error,那麼我們只需對樣本進行重複抽樣,每次對重複抽樣獲得的樣本進行一次回歸,就可計算出一個回歸係數估計值,而後不斷進行重複抽樣,假如進行1000次,我們就會獲得1000個回歸係數的估計值,使用standard
  • 《數據中臺實戰》:數據中臺的分層建模體系
    DWS層數據是數據倉庫的第三層數據,是以DWD層的數據為基礎進行匯總計算的數據。DWS層都是各個維度的匯總數據,比如某日某產品線的訪問用戶數、收藏用戶數、加購用戶數、下單用戶數、支付用戶數等。第四層是ADS層。ADS層數據是數據倉庫的最後一層數據,以DWS層數據為基礎進行數據處理。
  • Stata 15 統計數據分析軟體
    Stata 是一套提供其使用者數據分析、數據管理以及繪製專業圖表的完整及整合性統計軟體。它提供許許多多功能,包含線性混合模型、均衡重複反覆及多項式普羅比模式,用Stata繪製的統計圖形相當精美。該程序適用於處理時間序列、面板和橫斷面數據。