卡方檢驗多種用途總結

2020-11-29 SPSSAU

在之前的文章中我們介紹了T檢驗的不同方法,如果研究中想要對更多分類數據進行分析,T檢驗顯然並不合適,根據數據的類型應選用χ2檢驗進行統計分析。

01. 概念

卡方檢驗是一種用途廣泛的分析定類數據差異性的方法,主要用於比較定類與定類數據的關係情況,以及分析實際數據的比例與預期比例是否一致。

02. 方法分類

與T檢驗一樣,卡方檢驗可對包括單個樣本、兩獨立樣本、兩配對樣本等進行統計檢驗,具體方法分類如下:

SPSSAU整理

03. 卡方優度檢驗

卡方優度檢驗,是對一列數據進行統計檢驗,分析單個分類變量實際觀測的比例與期望比例是否一致。

案例:

當前收集了100份數據用於研究,其中有48名男性,52位女性。在收集數據前預期男女比例應該是4:6 (40%為男性,60%為女性),現在想分析實際收集到的數據比例與預期的比例有沒有顯著的差異。

操作步驟:

(1)卡方擬合優度檢驗支持兩種數據格式:整理後的加權數據 或 原始數據。處理好數據後,上傳數據到SPSSAU,開始分析。

(2)選擇【實驗/醫學研究】→【卡方優度檢驗】。

如使用原始數據,直接將「性別」項放入分析框即可。如使用加權格式數據,需要把將「性別」項放入分析框,同時在加權項中放入「個數(權重)」

使用路徑:醫學研究→卡方擬合優度檢驗

(3)設置期望值:

不勾選【期望值設置】,系統會默認各比例相等,本例中期望比例為4:6,所以需要手動設置。

期望比例4:6

分析結果:

擬合優度檢驗結果

上表格顯示,男女的實際頻數分別是48和52,預期頻數分別是40和60;經過卡方擬合優度檢驗顯示,實際比例和期望比例並沒有呈現出顯著性差異(X2=2.667,p=0.102>0.05),意味著實際情況與期望情況基本一致,無明顯的差異性。

04. 交叉卡方

卡方優度檢驗是對一個分類變量的檢驗,在實際研究中,研究兩組分類變量的關係更加常見,例如想要了解閱讀習慣與學歷是否有關,此時可使用交叉表卡方分析。

案例:分析不同性別學生對購買理財產品的意願是否有差異

操作步驟:

使用路徑:通用方法→交叉(卡方)

操作方法與上述操作相似,拖住分析項進入,點擊「開始交叉(卡方)分析」即可。

可以選擇按行統計百分數或者按列統計百分數,區別在於括號內百分數一個按列計算,一個按行計算,案例中選擇「百分數(按列)」

結果分析:

交叉(卡方)分析結果

從上表可以看出,不同性別樣本對於是否購買理財產品的意願不會表現出顯著性差異,說明性別和購買理財產品之間沒有聯繫。反之,呈現出顯著性;則說明性別對購買意願會有影響,具體差異需要通過對比百分比得到。

其他指標分析:

如果檢驗得出兩變量之間確實存在聯繫(結果有顯著性差異),想要進一步了解兩者的相關程度,需要結合效應量指標具體分析。SPSSAU提供5種指標;分別是:Phi係數、列聯繫數、、校正列聯繫、Cramer V係數、Lambda指標。

效應量選擇對照表

*X或Y中有定序數據,則建議使用Lambda指標

*交叉類型表示交叉表橫向格子數×縱向格子數

05. 配對卡方

除了以上兩種分析場景外,有時還需要分析配對分類數據的差異性。此類數據最常見於實驗研究,用不同的方法檢測同一批人,看兩個方法的效果是否有差異。此時可使用配對卡方檢驗。

案例:

當前有兩種辦法可以診斷癌症,A方法簡易且成本低廉但是準確率稍低;B方法結果可靠但操作麻煩且成本較高。共收集53名待診患者,並且分別進行兩種方法診斷。現希望通過研究判斷兩種診斷方法是否有差異性。此數據為配對數據,且診斷結果為定類數據,因而需要使用配對卡方檢驗。

操作步驟:

同上

使用路徑:SPSSAU→醫學研究→配對卡方

結果分析:

配對卡方分析結果

配對卡方有兩種檢驗統計量,分別是McNemar檢驗和Bowker檢驗。二者的區別如下:

本案例中兩種方法均只有陽性和陰性兩種結果時,因此選擇McNemar檢驗,SPSSAU會自動判斷,匹配合適的方法。

智能分析結果

06 其他說明

事實上,計算卡方值的方法不止一種,常見包括Pearson卡方,yates校正卡方,fisher卡方,具體要結合期望頻數、R*C交叉類型等選擇採不同的檢驗方法。SPSSAU可自動選擇最優方法,因此不需單獨考慮使用哪種方法。

相關焦點

  • 卡方分布與卡方檢驗
    本文轉載自CSDNsselssbh的卡方分布與卡方檢驗 https://blog.csdn.net/bitcarmanlee
  • 卡方檢驗最全總結
    資料類型詳細步驟 → 【卡方檢驗】核心步驟當n<40 或 T<1 ,則選用Fisher確切概率法此類資料基本原理與2 X 2相同,通過計算卡方值來判斷多個組間是否存在差異,但不能確定哪兩個組間存在差異。
  • 別錯過,卡方檢驗實用總結!
    通常情況下,卡方檢驗是研究分類數據與分類數據之間關係的分析方法,如性別和是否戴隱形眼鏡之間的關係。卡方檢驗通常會涉及卡方值和P值兩個名詞術語。卡方值與P值有對應關係,P值小於0.05則說明有差異存在,即性別與是否戴隱形眼鏡之間有聯繫。
  • 全流程總結卡方檢驗,幫你理清分析思路
    卡方分析卡方檢驗是研究數據比率上的差異性,用於比較定類與定類數據的關係情況。1. 數據類型卡方檢驗要求X、Y項均為定類數據,即數字大小代表分類。除了上述研究場景外,卡方檢驗還可用於研究配對數據的差異性,比如用兩種方法診斷癌症,看兩種方法的診斷結果是否有差異,則要使用配對卡方檢驗。如果研究目的在於分析實際觀測的比例與期望比例是否一致。比如實際抽樣的男女比例,與預期比例是否存在差異,此時可使用卡方擬合優度。
  • 卡方檢驗,T檢驗和F檢驗
    卡方檢驗、T-test、F檢驗區別卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。
  • python卡方檢驗 - CSDN
    卡方檢驗可以用於判斷兩個類別變量的相關性是否顯著。在分類的應用場景中可以用卡方檢驗選擇特徵,特徵與目標變量的相關性越顯著說明特徵越重要,預測力越強。      一、先簡單介紹一下卡方檢驗的步驟。假設y為目標變量,取值為好和壞,x為特徵變量取值為高、中、低。
  • 卡方檢驗
    對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述
  • 什麼是卡方檢驗?
    卡方檢驗,統計學的方法,現在機器學習看變量的時候也會用到。很多不知道的人,一聽到這個名詞,會馬上聯想到, 啊?還要拿張卡來檢驗嗎?其實卡方檢驗是英文Chi-Square Test 的諧音。在大數據運營場景中,通常用在某個變量(或特徵)值是不是和應變量有顯著關係。
  • spss卡方_spss卡方檢驗 - CSDN
    8、先看到的第一個表格就是交叉表,性別為行、選擇的讀物為列   9、卡方檢驗結果:主要看pearson卡方檢驗,sig值小於0.05,因此認為不同的性別的人對周末讀物的選擇有顯著的差別   10、最後一個表格,輸出的是phi值和V值,兩個都代表兩個變量之間的關係的緊密度,數值小於0.1說明關係不緊密,即性別與周末讀物的選擇沒有明顯的關係,這個結論和上面的卡方檢驗有出入,所以需要進一步進行兩兩比較。
  • 卡方檢驗講解
    這個時候就不可以使用方差分析了,就需要使用專門用於分類變量比較的卡方檢驗。接下來我們具體看一下卡方分析是怎麼做的。現在某個研究機構為了驗證一下吸菸與肺病的關係,通過抽樣調查得到如下數據:Ai為實際頻數(出現的次數),Ti為理論頻數。我們把第一個表中各組的值稱為實際頻數,把第二個表中各組的值稱為理論頻數。
  • T檢驗、F檢驗和卡方檢驗
    T檢驗、F檢驗、卡方檢驗是統計學中常見的假設檢驗,今天記錄下這幾個假設檢驗的原理和應用場景。
  • 管理心理學之統計(23)擬合度卡方檢驗
    什麼是卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇。其根本思想在於使用樣本頻數與比例來檢驗關於相應總體值的假設。當實驗數據不是等距或等比數據時,實驗不符合參數檢驗的要求,實驗者可以使用擬合度卡方檢驗與獨立性卡方檢驗這兩種方法作為替代,使用樣本數據來評估關於總體內部的比例或關係。這兩種卡方檢驗和多數非參數檢驗一樣,沒有陳述關於特定參數的假設,也很少對總體分布做出假設,因此非參數檢驗有時被稱為任意分布檢驗。
  • 卡方檢驗在實際工作中的應用
    答案是:卡方檢驗。為什麼用卡方檢驗?定義是什麼?既然是對兩個分類變量(設計因素、高低CTR)做相關分析,卡方檢驗很適用於此案例。卡方檢驗怎麼做?思路是什麼?結論不符合預期時,卡方檢驗結論如何解讀?至此完成了卡方檢驗的基本操作,但檢驗結果僅代表數據的顯著性,該顯著性是否有意義仍需要結合實際情況來看。當數據顯著性出現與假設、預期不相符時,多是以下幾種情況。1. 描述統計差異較大但卡方檢驗不顯著e.g.
  • python 卡方檢驗專題及常見問題 - CSDN
    卡方檢驗可以用於判斷兩個類別變量的相關性是否顯著。在分類的應用場景中可以用卡方檢驗選擇特徵,特徵與目標變量的相關性越顯著說明特徵越重要,預測力越強。      一、先簡單介紹一下卡方檢驗的步驟。假設y為目標變量,取值為好和壞,x為特徵變量取值為高、中、低。
  • 卡方檢驗(2x2表格)
    摘自:醫學統計園(微信公眾號)臨床上會遇到評價兩種藥物,對治療同一種疾病的不同患者,哪一種療效會更好,如下表,這時就需要用到卡方檢驗。卡方檢驗是針對計數資料的一種檢驗方法。如果卡方值越大,超出了設定檢驗水準(α=0.05)下的卡方值(χdf,0.05),則認為實際值與理論值之間偏差屬於隨機誤差的概率較小,故而拒絕H0假設;若卡方值為0,則表示觀察值與理論值完全一致。下面介紹如何使用SPSS對2x2表格,進行卡方檢驗;如前所述,對數據的預處理,是數據分析過程中花費時間最多也是最麻煩的,因此我們先講述如何將計量資料輸入SPSS。
  • 卡方檢驗原理與應用實例
    本文簡單介紹卡方檢驗的原理和兩個類型的卡方檢驗實例。本期推送的另外幾篇文章,來自微信公眾號「amegroups  」,長按下方二維碼,關注該公眾號。關注後,回復「卡方檢驗」即可看原文,給出出處,以防止轉載過程中,關鍵信息丟失影響閱讀時,找不到原文。
  • 卡方檢驗相關性專題及常見問題 - CSDN
    卡方檢驗和卡方分布卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
  • 多選題如何進行卡方檢驗?
    差異關係 差異研究主要包括方差分析、t檢驗和卡方檢驗。如果是定類和定類,此時應該使用卡方分析;如果是定類和定量,此時應該使用方差或者t檢驗。 多選題也屬於定類數據,分析時類似於單選題,通常是研究兩個分類數據之間的關係,即使用卡方分析。
  • 方差、標準差、正態分布、超幾何分布、卡方檢驗、t檢驗基礎概念
    卡方檢驗卡方檢驗是用途非常廣的一種假設檢驗方法,它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。t檢驗T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n < 30),總體標準差σ未知的正態分布。
  • 每天學習一點R:44.卡方檢驗
    卡方檢驗卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度