在之前的文章中我們介紹了T檢驗的不同方法,如果研究中想要對更多分類數據進行分析,T檢驗顯然並不合適,根據數據的類型應選用χ2檢驗進行統計分析。
01. 概念
卡方檢驗是一種用途廣泛的分析定類數據差異性的方法,主要用於比較定類與定類數據的關係情況,以及分析實際數據的比例與預期比例是否一致。
02. 方法分類
與T檢驗一樣,卡方檢驗可對包括單個樣本、兩獨立樣本、兩配對樣本等進行統計檢驗,具體方法分類如下:
03. 卡方優度檢驗
卡方優度檢驗,是對一列數據進行統計檢驗,分析單個分類變量實際觀測的比例與期望比例是否一致。
案例:
當前收集了100份數據用於研究,其中有48名男性,52位女性。在收集數據前預期男女比例應該是4:6 (40%為男性,60%為女性),現在想分析實際收集到的數據比例與預期的比例有沒有顯著的差異。
操作步驟:
(1)卡方擬合優度檢驗支持兩種數據格式:整理後的加權數據 或 原始數據。處理好數據後,上傳數據到SPSSAU,開始分析。
(2)選擇【實驗/醫學研究】→【卡方優度檢驗】。
如使用原始數據,直接將「性別」項放入分析框即可。如使用加權格式數據,需要把將「性別」項放入分析框,同時在加權項中放入「個數(權重)」
(3)設置期望值:
不勾選【期望值設置】,系統會默認各比例相等,本例中期望比例為4:6,所以需要手動設置。
分析結果:
上表格顯示,男女的實際頻數分別是48和52,預期頻數分別是40和60;經過卡方擬合優度檢驗顯示,實際比例和期望比例並沒有呈現出顯著性差異(X2=2.667,p=0.102>0.05),意味著實際情況與期望情況基本一致,無明顯的差異性。
04. 交叉卡方
卡方優度檢驗是對一個分類變量的檢驗,在實際研究中,研究兩組分類變量的關係更加常見,例如想要了解閱讀習慣與學歷是否有關,此時可使用交叉表卡方分析。
案例:分析不同性別學生對購買理財產品的意願是否有差異
操作步驟:
操作方法與上述操作相似,拖住分析項進入,點擊「開始交叉(卡方)分析」即可。
可以選擇按行統計百分數或者按列統計百分數,區別在於括號內百分數一個按列計算,一個按行計算,案例中選擇「百分數(按列)」
結果分析:
從上表可以看出,不同性別樣本對於是否購買理財產品的意願不會表現出顯著性差異,說明性別和購買理財產品之間沒有聯繫。反之,呈現出顯著性;則說明性別對購買意願會有影響,具體差異需要通過對比百分比得到。
其他指標分析:
如果檢驗得出兩變量之間確實存在聯繫(結果有顯著性差異),想要進一步了解兩者的相關程度,需要結合效應量指標具體分析。SPSSAU提供5種指標;分別是:Phi係數、列聯繫數、、校正列聯繫、Cramer V係數、Lambda指標。
*X或Y中有定序數據,則建議使用Lambda指標
*交叉類型表示交叉表橫向格子數×縱向格子數
05. 配對卡方
除了以上兩種分析場景外,有時還需要分析配對分類數據的差異性。此類數據最常見於實驗研究,用不同的方法檢測同一批人,看兩個方法的效果是否有差異。此時可使用配對卡方檢驗。
案例:
當前有兩種辦法可以診斷癌症,A方法簡易且成本低廉但是準確率稍低;B方法結果可靠但操作麻煩且成本較高。共收集53名待診患者,並且分別進行兩種方法診斷。現希望通過研究判斷兩種診斷方法是否有差異性。此數據為配對數據,且診斷結果為定類數據,因而需要使用配對卡方檢驗。
操作步驟:
使用路徑:SPSSAU→醫學研究→配對卡方
結果分析:
配對卡方有兩種檢驗統計量,分別是McNemar檢驗和Bowker檢驗。二者的區別如下:
本案例中兩種方法均只有陽性和陰性兩種結果時,因此選擇McNemar檢驗,SPSSAU會自動判斷,匹配合適的方法。
06 其他說明
事實上,計算卡方值的方法不止一種,常見包括Pearson卡方,yates校正卡方,fisher卡方,具體要結合期望頻數、R*C交叉類型等選擇採不同的檢驗方法。SPSSAU可自動選擇最優方法,因此不需單獨考慮使用哪種方法。