我們一般會在文獻的統計方法部分看到這樣的描述:
對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,兩組比較採用t檢驗,三組及三組以上組間組間比較採用方差分析;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
大家對於非參數檢驗可能會比較陌生,一般遇到數據不符合正態分布時,手足無措。
今天,我們一起來看看。
1
基礎知識
非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。
當數據符合正態分布時,三組及三組以上組間組間比較採用方差分析,否則採用非參數檢驗。
與單因素方差分析對應的非參數檢驗方法叫做Kruskal-Wallis H檢驗,即克魯斯卡爾-沃利斯檢驗(也叫做對秩次的單因素方差分析)。
用於檢驗多組間連續或有序變量是否存在差異,當然兩組間差異也可以用。
2
軟體操作
問題:我們想比較三組人群的BMI(體質指數)水平是否有差異?
1、查看數據集
Group 組別,分類變量, 1、2、3各代表1組;
Age 年齡,數值變量;bmi 體質指數, 數值變量。
2、 Kruskal-Wallis H檢驗
點擊Analyze→Nonparametric Tests→Independent Samples,在彈出的對話框中選擇SCAN DATA,然後出現Nonparametric Tests: Two or More Independent Samples對話框,默認選擇Automatically compare distributions across groups。
點擊Fields,選擇Use custom field assignments,將變量bmi選入Test Fields框中,將變量group選入Groups框中。
點擊Settings,選擇Customize tests,在Compare Median Difference to Hypothesized區域選擇Kruskal-Wallis 1-way ANOVA (k samples),Multiple comparisons選擇All pairwise。
3
結果解釋
雙擊Hypothesis Test Summary,啟動Model Viewer窗口。
1、總體檢驗結果可以表述為:
經Kruskal-Wallis H檢驗結果顯示,H=7.873,p=0.020,三組人群BMI差異具有統計學意義。
但至於是哪兩組人群間BMI存在差異,還需要進一步看看兩兩比較的結果。
較低版本的SPSS軟體無法直接獲取相關結果,但在SPSS 22.0版本以上,能夠通過軟體直接得出兩兩比較的結果了。
點擊Model Viewer右下方的View,選擇「Pairwise Comparisons」,Pairwise Comparisons右側視圖會出現兩兩比較的結果。
2、兩兩比較的結果可表述為:
採用Bonferroni法校正顯著性水平的事後兩兩比較結果顯示,BMI水平在組1和組3(調整後P=0.023)的差異具有統計學意義,其它組之間的差異無統計學意義。
習慣用R軟體的朋友,也可以參考我之前的文章《
多組獨立樣本非參數檢驗及兩兩比較
》。
學會統計分析的好處:
分析自己的數據
幫助別人分析數據,結交朋友
幫助別人分析數據,增加收入,一般一套統計分析收費在500-1000元
結識大佬:某主治醫生,會統計分析,許多科室大佬見了都親切打招呼