SPSS操作:多個獨立樣本的非參數檢驗及兩兩比較

2021-02-08 醫咖會

某研究者想探討不同體力活動的人,應對職場壓力的能力是否不同。因此,研究招募了31名研究對象,測量了他們每周進行體力活動的時間(分鐘),以及應對職場壓力的能力。


根據體力活動的時間長短,研究對象被分為4組:久坐組、低、中、高體力活動組(變量名為group)。利用Likert量表調查的總得分(CWWS得分)來評估應對職場壓力的能力,分數越高,表明應對職場壓力的能力越強(變量名為coping_stress)。部分數據如下圖。

 

研究者想知道不同體力活動組之間CWWS得分是否不同,可以使用Kruskal-Wallis H檢驗。Kruskal-Wallis H檢驗(有時也叫做對秩次的單因素方差分析)是基於秩次的非參數檢驗方法,用於檢驗多組間(也可以是兩組)連續或有序變量是否存在差異


使用Kruskal-Wallis H test進行分析時,需要考慮以下3個假設。 


假設1:有一個因變量,且因變量為連續變量或等級變量。


假設2:存在多個分組(≥2個)。


假設3:具有相互獨立的觀測值,如本研究中各位研究對象的信息都是獨立的,不存在相互幹擾作用。

1. Kruskal-Wallis H檢驗


在主界面點擊Analyze→Nonparametric Tests→Independent Samples,出現Nonparametric Tests: Two or More Independent Samples對話框,默認選擇Automatically compare distributions across groups。


 

點擊Fields,在Fields下方選擇Use custom field assignments,將變量coping_stress放入Test Fields框中,將變量group放入Groups框中。


 

點擊Settings→Customize tests,在Compare Median Difference to Hypothesized區域選擇Kruskal-Wallis 1-way ANOVA (k samples),如下圖。本步驟也可不操作,默認即可。因為我們選擇了Automatically compare distributions across groups,且有3個分組, SPSS會默認選擇Kruskal-Wallis 1-way ANOVA (k samples)。


 

點擊Run,輸出結果。


2. 對數據分布的了解


Kruskal-Wallis H 檢驗,其原理是將原始數據排序後分配秩次,再對秩次做假設檢驗。因此,統計描述只能描述各組數據的「平均秩次」,假設檢驗的結果也只能表述為「各組數據分布的差異有/無統計學意義」。然而,「平均秩次」並不能充分反映各組數據的集中趨勢。


我們知道,對於非正態分布數據,描述其集中趨勢的較好指標是中位數(相對應的,對於正態分布數據,描述其集中趨勢的較好指標是均數)。因此,在做Kruskal-Wallis H 檢驗(以及Mann-Whitney U檢驗/Wilcoxon秩和檢驗)前,需要首先對原始數據的分布形態做一個了解。


假設某研究關注不同教育程度(高中及以下、本科、碩士及以上)研究對象的年均收入,則年均收入的分布可能有2種情況(如下圖)。左側的圖表示各組年均收入的分布形狀一致(分布形狀一致代表變異一致),而右側的圖表示各組年均收入的分布形狀不一致。


 

因此,在做Kruskal-Wallis H 檢驗(以及Mann-Whitney U檢驗/Wilcoxon秩和檢驗)前,需要畫直方圖對各組數據的分布形狀做一個了解(本例的模擬數據量較少,因此省去畫直方圖的操作。實際研究中,應當首先做直方圖)。


如果實際研究中,各組因變量的分布形狀基本一致,則需要計算各組因變量的中位數,以便統計描述時匯報。如果各組因變量的分布形狀不一致,則在統計描述時不必匯報。


3. 計算中位數


Kruskal-Wallis H 檢驗並不直接給出中位數的具體數值,因此需要單獨計算中位數。在主界面欄中點擊Analyze→Compare Means,在Means對話框中,將coping_stress選入Dependent List框中,將group選入Independent List框中。



點擊Options,出現Means: Options對話框。將Cell Statistics框中的「Mean」和「Standard Deviation」選回Statistics框中,並將「Median」 從Statistics框中選入Cell Statistics框中。點擊Continue→OK。


1. Kruskal-Wallis H檢驗


Kruskal-Wallis H檢驗的最終結果如下圖。

 


雙擊Hypothesis Test Summary,啟動Model Viewer窗口。Model Viewer窗口右上方的「Independent-Samples Kruskal-Wallis Test」箱式圖反映了各組CWWS評分的中位數和分布情況。


 

Model Viewer窗口右下方Asymptotic Sig. (2-sided test)對應的P值與Hypothesis Test Summary中的P值一樣。如下圖。 



基於以上結果,可以認為各組CWWS評分的分布不全相同,差異具有統計學意義(H = 14.468,P=0.002)。


2. 兩兩比較


雖然得到了各組CWWS評分的分布不全相同的結論,但我們仍然不清楚到底是哪兩組之間不同,因此需要進一步兩兩比較。


點擊Model Viewer右側下方的View處,選擇「Pairwise Comparisons」選項。



點擊後,Pairwise Comparisons的右側視圖出現兩兩比較的結果。



在Pairwise Comparisons of Physical Activity Level圖中,圓點旁邊的數值代表該組的平均秩次。連接線代表兩兩比較的結果,黑色連接線代表兩組間差異無統計學意義,橘黃色連接線代表兩組差異具有統計學意義。


表格給出了更多的信息:比較的組別、統計量、標準誤、標準化的統計量(=統計量/標準誤)、P值和調整後的P值。


由於是事後的兩兩比較(Post hoc test),因此需要調整顯著性水平(調整α水平),作為判斷兩兩比較的顯著性水平。依據Bonferroni法,調整α水平=原α水平÷比較次數。例如本研究共比較了6次,調整α水平=0.05÷6=0.0083。因此,最終得到的P值(上圖中Sig.一列),需要和0.0083比較,小於0.0083則認為差異有統計學意義。


另外,SPSS也提供了調整後P值(上圖中Adj. Sig.一列),其思想還是採用Bonferroni法調整α水平。該列是將原始P值(圖中Sig.一列)乘以比較次數得到,因此可以直接和0.05比較,小於0.05則認為差異有統計學意義。


值得注意的是,中度體力活動和高度體力活動比較時(最後一行),原始P=0.829,而調整後P=1(不等於0.829的6倍)。這是因為,P的最大值為1。


以上結果可以描述為:採用Bonferroni法校正顯著性水平的事後兩兩比較發現,CWWS評分的分布在久坐組和中度體力活動組(調整後P=0.008)、久坐組和高體力活動組(調整後P=0.005)的差異有統計學意義,其它組之間的差異無統計學意義。


3. 描述中位數


假設本研究中,各組CWWS評分的分布形狀基本一致,則報告結果時還應該報告各組CWWS評分的中位數。Report表格給出了中位數及樣本數。


1. 各組CWWS評分的分布形狀基本一致時


比較不同體力活動組中CWWS評分的分布差異,採用Kruskal-Wallis H檢驗。根據直方圖判斷各組中CWWS評分分布的形狀基本一致。各組CWWS評分的分布不全相同,差異具有統計學意義(H= 14.468, P=0.002)。


久坐組CWWS評分中位數為4.12 (n=7),低體力活動組CWWS評分中位數為5.50 (n=9),中度體力活動組CWWS評分中位數為7.10 (n=8),高體力活動組CWWS評分中位數為7.47 (n=7),總的CWWS評分中位數為5.97 (n=31)。


採用Bonferroni法校正顯著性水平的事後兩兩比較發現,CWWS評分的分布在久坐組和中度體力活動組(調整後P=0.008)、久坐組和高體力活動組(調整後P=0.005)的差異有統計學意義,其它組之間的差異無統計學意義。


2. 各組CWWS評分的分布形狀不一致時


比較不同體力活動組中CWWS評分的分布差異,採用Kruskal-Wallis H檢驗。根據直方圖判斷各組中CWWS評分分布的形狀不一致。各組CWWS評分的分布不全相同,差異具有統計學意義(H= 14.468, P=0.002)。


久坐組CWWS評分平均秩次為6.00 (n=7),低體力活動組CWWS評分平均秩次為14.44 (n=9),中度體力活動組CWWS評分平均秩次為21.13 (n=8),高體力活動組CWWS評分平均秩次為22.14 (n=7)。


採用Bonferroni法校正顯著性水平的事後兩兩比較發現,CWWS評分的分布在久坐組和中度體力活動組 (調整後P=0.008)、久坐組和高體力活動組 (調整後P=0.005) 的差異有統計學意義,其它組之間的差異無統計學意義。


關注醫咖會,輕鬆學習統計學~


快加小咖個人微信(xys2016ykf),拉你進統計討論群和眾多熱愛研究的小夥伴們一起交流學習。


點擊左下角「閱讀原文」,看看醫咖會既往推送了哪些統計教程。或者使用電腦打開網址:http://www.mediecogroup.com/,查看60種SPSS教程。

相關焦點

  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。分析--描述統計--探索,將指標全部放進因變量列表裡,將組放進因子列表裡,單擊 圖 ,勾選含檢驗的正態圖--繼續--確定。輸出結果,看正態性檢驗。一般情況下(樣本量比較少)看夏皮諾威爾克檢驗結果。顯著性大於0.05符合正態性。小於0.05不符合正態性。
  • 手把手教你多組獨立樣本的非參數檢驗及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 基於R語言實現多組獨立樣本的非參數檢驗(Kruskal-Wallis秩和檢驗)及兩兩比較
    ,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 如何用非參數檢驗,分析多個相關樣本數據?
    不同的方法有不同的要求和側重,因此才出現這麼多的檢驗方法,分別針對不同的應用場景。下面就介紹幾種側重於檢驗多組相關數據的非參數檢驗方法。①Friedman檢驗Friedman檢驗,是研究多相關樣本差異性的方法,屬於非參數檢驗的一種。
  • 方差分析不能用,那就用多組獨立樣本的非參數檢驗
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,兩組比較採用t檢驗,三組及三組以上組間組間比較採用方差分析;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • 一篇概全:非參數檢驗思路總結
    以下是最常見的非參數檢驗及其對應的參數檢驗對應方法:單樣本Wilcoxon檢驗單樣本Wilcoxon檢驗是單樣本t檢驗的代替方法。該檢驗用於檢驗數據是否與某數字有明顯的區別,如對比調查對象整體態度與滿意程度之間的差異。
  • 兩獨立樣本T檢驗及如何利用SPSS實現其操作
    在年齡與SDS評分的關係中,用T檢驗還是用方差分析,這是與x(年齡)分幾組有關係的:如果是兩組,則用T檢驗;如果是三組,則用方差分析。其實兩組也是可以用方差分析的,因為方差分析的結果與T檢驗的結果是一樣的。如果兩組間比較單因素方差分析和t檢驗的結果是相同的,單因素方差分析可以對兩組以上的分組進行比較,而t檢驗只能兩兩比較。
  • SPSS非參數檢驗--Kruskal-Wallis 單因素ANOVA
    兩組數據的差異比較,我們已經學會採使用t檢驗和 Mann-Whitney U檢驗;對於兩組以上數據間差異的比較我們採用方差分析(ANOVA);當多組數據不滿足正態性和方差齊性時
  • Bonferroni:Step by Step 攻克兩兩比較
    網友們在閱讀SIC或其他文獻時,可能會發現Bonferroni是在研究中涉及多重比較時出現較多的一個高頻詞,文獻中常出現Bonferroni的統計方法有獨立樣本參數檢驗(非參數檢驗)的兩兩比較、率的兩兩比較、隨機區組設計的兩兩比較等。
  • 基於SPSS軟體實現多組比較的卡方檢驗及兩兩比較
    再送兩個介紹多組間比較的統計分析:數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。
  • SPSS分析技術:非參數檢驗之Wilcoxon檢驗;平均值比較不了?那就比較中位數吧!
    基礎準備非參數檢驗是與參數檢驗相對應的另一套分析方法。
  • 醫學科研課堂丨統計說說(八)—基本統計學方法之等級資料的非參數檢驗
    點擊「定義範圍(D)」按鈕,彈出「多個獨立樣本:定義範圍」對話框(圖7)。主要輸出結果及分析(1)例2的多個獨立樣本克魯斯卡爾-沃利斯檢驗的秩基本統計量表(表5)(1)例2的多個獨立樣本克魯斯卡爾-沃利斯假設檢驗摘要(圖10)
  • 非參數檢驗—兩相關樣本資料
    本文3881字〡28圖〡預計閱讀24分鐘   兩個相關樣本資料的統計分析在平時比較常見,今天的學習以配對設計列聯表資料為主,當遇到下面資料時,該考慮使用何種檢驗方法以及在SPSS中如何操作?
  • [理論+spss實戰]假設檢驗——單樣本t檢驗
    參考《[理論+spss實戰]一組數據的描述性統計分析》t統計量值為0.105,就是我們上邊手動計算出的0.1048。然後查t分布表進行比較即可得出結論。自由度為9,樣本量減去1得到,即10-1=9顯著性(雙尾)值為0.919。
  • SPSS卡方檢驗操作步驟、結果解讀
    SPSS中交叉分析主要用來檢驗兩個變量之間是否存在關係,或者說是否獨立,其零假設為兩個變量之間沒有關係。在實際工作中,經常用交叉表來分析比例是否相等。例如分析不同的性別對不同的報紙的選擇有什麼不同。,這個結論和上面的卡方檢驗有出入,所以需要進一步進行兩兩比較。
  • 「spss數據分析系列」t檢驗
    一、t統計量及t檢驗本人介紹spss數據分析中的t檢驗,我們平時分析數據時經常對比均值,其中兩分類的均值對比採用的t檢驗,這裡強調一下的是兩分類的對比,其他還有獨立樣本t檢驗,配對t檢驗,我們在下面spss軟體部分再做說明
  • 數據分析基礎相關性分析,SPSS實操
    在一般情況下,總體相關係數p是未知的,我們往往是用樣本相關係數 r作為總體相關係數p的估計值。但由於存在樣本抽樣的隨機性。樣本相關係數並不能直接反映總體的相關程度。為了判斷r對ρ 的代表性大小,需要對相關係數進行假設檢驗。(1)首先假設總體相關性為零,即H0為兩總體無顯著的線性相關關係。
  • 參數估計與假設檢驗(七)-- 獨立雙樣本均值T檢驗
    、獨立雙樣本、配對樣本均值T檢驗和置信區間的計算。本文對獨立雙樣本均值T檢驗做進一步的介紹。在雙樣本條件下,也可以通過構造t統計量利用T分布理論來比較兩樣本所代表的總體的均值是否有顯著差異,如果兩個樣本是完全獨立的,該檢驗就叫做獨立雙樣本均值T檢驗(如圖10.18所示)。
  • 理論與實務考點:多個樣本均數的兩兩比較
    經由方差剖析若拒絕了磨練假設,只能聲名多個樣本總體劫運不相等或不全相等。若要獲得各組劫運間更具體的信息,應在方差剖析的基本長進行多個樣本劫運的兩兩鬥勁。  1.多個樣本劫運間兩兩鬥勁  多個樣本劫運間兩兩鬥勁常用q磨練的體例,即Newman-kueuls法,其根基軌範為:  成立磨練假設——>樣本劫運排序——>計較q值——>查q界值表判定結不美觀。
  • 科研SPSS統計思維實戰研討會
    47) 完全隨機與隨機區組設計、多個樣本均數的兩兩比較的區別核心?48) 析因設計、重複測量設計、交叉設計的區別使用及核心理念?77) 邊際均數比較與兩兩比較的差別在哪?78) 卡方分布與卡方檢驗及SPSS如何實現?