點擊上方藍字,輕鬆關注我們
以下內容轉載自「醫咖會」微信公眾號(medieco-ykh),作者袁園。
上一期我們討論了Mann-Whitney U檢驗的SPSS操作。本期「科研加油站」欄目,我們討論一下不符合正態分布兩組數據的非參數檢驗。問題與數據
一家藥品公司推出了一款藥物廣告,這家公司想了解男性患者和女性患者對該廣告的接受程度,於是該公司向20名男性患者和20名女性患者播放該廣告,播放結束後要求他們填寫一份調查問卷,從該調查問卷中計算出每個調查對象對這款藥物廣告接受程度的評分。以此判斷在對於藥品廣告的接受程度上是否存在性別差異。
該公司所收集的數據包括:接受程度評分engagement(因變量)和性別分組gender(自變量),部分數據如下圖所示:
對問題的分析
本問題是探討男性患者組和女性患者組之間的接受度評分是否相同,因為此數據不符合正態分布,不能採用獨立樣本t檢驗方法,因此選用Mann-Whitney U檢驗。
Mann-Whitney U檢驗有4條基本假設:
假設1:數據中有一個因變量,且因變量為連續變量或等級變量。
例如:連續變量——智力得分、考試分數、體重;等級變量——滿意程度(包括非常不滿意、不滿意、滿意、非常滿意)。
假設2:數據中有一個自變量,且自變量為二分類的獨立變量。
例如:性別分組——男性組、女性組;生活習慣——吸菸組、非吸菸組。
假設3:觀察值之間相互獨立,即自變量的兩個分組中的研究個體不能相關。
例如:對比兩個班級的學生的考試分數;對比患者與健康者的血生化指標。
如果:研究數據不符合此項條件,例如測量同一組患者治療前與治療後的血生化指標,這樣數據屬於配對樣本數據,應選用Wilcoxon符號秩和檢驗。
假設4:Mann-Whitney U檢驗假設——自變量中兩組樣本的分布一致。
例如:男性組和女性組的接受度評分的分布可能有以下3種情況(圖A與圖B符合假設4,圖C不符合):
(圖A.數據分布完全一致;圖B.數據分布形狀一致,但均值不同)
(圖C.數據分布形狀不一致)
驗證假設
假設1:數據中有一個因變量,且因變量為連續變量或等級變量。
通過數據特點判斷,本例中因變量為對廣告的接受度評分,為連續變量。
假設2:數據中有一個自變量,且自變量為二分類的獨立變量。
通過數據特點判斷,本例中自變量為性別分組,男性組和女性組,為二分類的獨立變量。
假設3:觀察值之間相互獨立,即自變量的兩個分組中的研究個體不能相關。
通過數據特點判斷,本例中自變量為性別,一個研究對象只能在其中的一個分組,不會存在一個研究對象即在男性組又在女性組的情況。
假設4:Mann-Whitney U檢驗假設——自變量中兩組樣本的分布一致。
通過SPSS軟體畫圖判斷。如果Mann-Whitney U檢驗選用舊對話框進行SPSS操作,這裡需要通過Graphs——Chart Builder模塊進行畫圖,具體操作步驟如下:
1. 點擊主菜單上的Graphs——Chart Builder。
2. 在跳出的對話框中選擇「Histogram」模式,雙擊該模式下的「Population Pyramid」圖形。
3. 在顯示的界面中需要設置分布變量「Distribution Variable」及拆分變量「Split Variable」,將性別變量「gender」放入拆分變量「Split Variable」,將接受度評分「engagement」放入分布變量「Distribution Variable」,點擊「OK」按鈕。
4. 圖形解讀,SPSS軟體輸出如下圖形:
如果數據的分布一致,則可以使用Mann-Whitney U檢驗來判斷兩組數據的中位數大小,以此來判斷男性組與女性組的接受度評分是否相同。
在本例中,兩組的數據分布相似,因此可以比較兩組數據的中位數。然而,如果兩組數據的分布不同,仍然可以使用Mann-Whitney U檢驗,此時兩組比較的不是數據的中位數,而是數據的平均秩次。
Mann-Whitney U檢驗的SPSS操作
1. 在SPSS 18及之後版本中,可以點擊Analyze — Nonparametric Tests — Legacy Dialogs(舊對話框) — 2 Independent Samples(如下圖所示),本文按照此操作步驟為例來展示。[版本18之前的軟體點擊Analyze——Nonparametric Tests——2 Independent Samples]
出現如下對話框,勾選檢驗類型「Test Type」中的「Mann-Whitney U」選項:
2. 將因變量「engagement」放入「Test Variable List」,將自變量「gender」放入「Grouping Variable」
註:如果有多個需要分析的因變量,可以一齊放入「Test Variable List」,在報告結果時可以同時顯示多個因變量與性別之間的關係。例如,加入自變量「happiness」 (如下圖所示):
3. 點擊分組變量中的分組定義「Define Groups」,將性別分組中男性組的賦值1填寫至「Group 1」,將女性組的賦值2填寫至「Group 2」,點擊下方的「Continue」。
4. 返回至主對話框後點擊「Option」按鈕,如果在處理的數據中有缺失值,在「Missing Values」中選擇「Exclude cases test-by-test」,在進行Mann-Whitney U檢驗時可以自動排除缺失數據。
註:如果選擇了多個因變量進入此項分析,例如數據中有兩個因變量:
「engagement」與「happiness」,這兩個因變量中均有缺失值,第8名調查者的「engagement」數據缺失,第11名調查者的「happiness」數據缺失,處理缺失數據時選擇「Exclude cases test-by-test」或者「Exclude cases listwise」是有區別的:
① 選擇「Exclude cases test-by-test」
選擇「Exclude cases test-by-test」後,只排除缺失的數據,其餘數據均保留。如分析「engagement」時,只排除第8名調查者的缺失數據,而第11名調查者的數據保留,而分析「happiness」時只排除第11名調查者的缺失數據,而第8名調查者的數據保留。
【選擇「Exclude cases test-by-test」模式,分析幸福值的性別差異時將包括第8名調查者的「happiness」變量值(5.66);選擇「Exclude cases test-by-test」模式,分析接受程度評分的性別差異時將包括第11名調查者的「engagement」變量值(5.83)】
② 選擇「Exclude cases listwise」
選擇「Exclude cases listwise」意味著,任何一個因變量中有數據缺失,那麼該調查者的全部數據都被剔除,例如第8名調查者中「engagement」中數據缺失,第11名調查者「happiness」數據缺失,那麼在在進行Mann-Whitney U檢驗時將第8名與第11名調查者的數據同時剔除。
【選擇「Exclude cases listwise」模式,分析幸福值的性別差異時將不包括第8名調查者的「happiness」變量值(5.66);選擇「Exclude cases listwise」模式,分析接受程度評分的性別差異時將不包括第11名調查者的「engagement」變量值(5.83)】
5. 選擇對話框中Statistics中的Descriptive與Quartiles選項後選擇Continue。
提示:選擇Statistics中的Descriptive與Quartiles選項後,報告出的結果並不一定是有用的,例如我們希望分別得到男性和女性組中廣告接受程度的中位數,而結果只會報告廣告接受程度及性別變量的中位數。因此,下一步我們介紹兩組的中位數如何計算。
6. 最後回到Two-Independent-Sample Tests對話框,點擊OK,得到輸出結果。
計算各分組的中位數
在SPSS軟體中進行Mann-Whitney U檢驗,無法報告各分組的中位數,而中位數是兩組比較時的重要參數。因此,我們可以通過以下6步完成中位數的計算。
(1) 點擊菜單中Analyze>Compare Means>Means…
出現中位數計算的對話框,如下圖所示:
2. 將engagement放入因變量列表中,將gender放入自變量中。
3. 選擇Options按鈕,選擇需要計算的參數:
4. 選擇Median,取消預先選擇的Mean、Number of Cases、Standard Deviation。
5. 點擊Continue,返回Means對話框。
6. 點擊OK,得到結果。
結果解讀
1. Mann-Whitney U檢驗結果
本例中男性組和女性組的數據分布相似,因為我們先解讀數據分布相似時的結果,使用舊對話框得出的結果如下圖所示:
Test Statistics表格中Mann-Whitney U代表檢驗的U統計量值為145;Z代表Z值;Asymp.Sig(2-tailed)代表漸進P值;Exact Sig[2*(1-tailed Sig.)]代表精確P值。
樣本量越大,漸進P值就越接近真實P值。當每個分組的樣本量小於20時,SPSS軟體會自動計算精確P值,此時選擇精確P值來判斷檢驗假設。當樣本量大於20時,漸進P值可以很好地代表真正的P值,因此選擇漸進P值來判斷檢驗假設。
本例中每組的樣本量為20個,結果報告了精確P值為0.142,本例選用精確P值判斷檢驗假設,P值大於界值0.05,因此不能拒絕原假設,即不能認為男性組和女性組的廣告接受程度有統計學差異。
提示:如果在SPSS報告的結果中發現漸進P值與精確P值顯示為「0.000」,這意味著P值小於0.0005,並不是真的為0。
2. 計算中位數輸入結果
在本文的第六步中可以計算出各組的中位數值如下圖:
【Median:中位數;gender:性別;engagement:接受度評分;Male:男性;Female:女性;Total:全部;】
3. 計算結果的表達
① 數據分布相同的結果表達——中位數
中文表述:使用Mann-Whitney U檢驗判斷男性與女性對於此藥品廣告的接受程度是否有差異。通過柱形圖可以判斷兩組接受程度評分的數據分布相似。男性組中接受度評分的中位數為5.58,女性組中接受度評分的中位數為5.38。Mann-Whitney U檢驗結果顯示男性組與女性組的接受度評分差異沒有統計學意義,U=145,Z=-1.488,P=0.142。
英文表述:A Mann-Whitney U test was run to determine if there were differences in engagement score between males and females. Distributions of the engagement scores for males and females were similar, as assessed by visual inspection. Median engagement score for males (5.58) and females (5.38) was not statistically significantly different, U = 145, z = -1.488, p = .142, using an exact sampling distribution for U (Dineen & Blakesley, 1973).
② 數據分布不同的結果表達——平均秩次
如果在實際的數據計算中發現各分組中數據的分布形狀不同,則不能用中位數進行比較,需要對各組的數據進行編秩,算出平均秩次。
中文表述:使用Mann-Whitney U檢驗判斷男性與女性對於此藥品廣告的接受程度是否有差異。通過柱形圖可以判斷兩組接受程度評分的數據分布不同。Mann-Whitney U檢驗結果顯示男性組(平均秩次為23.25)與女性組(平均秩次為17.75)對於此藥品廣告的接受度評分差異沒有統計學意義,U=145,Z=-1.488,P=0.142。
英文表述:A Mann-Whitney U test was run to determine if there were differences in engagement score between males and females. Distributions of the engagement scores for males and females were not similar, as assessed by visual inspection. Engagement scores for males (mean rank = 23.25) and females (mean rank = 17.75) were not statistically significantly different, U = 145, z = -1.488, p = .142, using an exact sampling distribution for U (Dineen & Blakesley, 1973).
覺得好看,請點這裡 ?