卡方檢驗和精確概率法及兩兩比較

2020-11-29 言爸說育兒

看過許多統計教程,這篇是我最推薦的

介 紹

數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。

對於分類變量,採用例數(百分比)的形式描述,組間比較採用χ2檢驗或精確概率法,當組間總的有統計學差異,進一步採用χ2檢驗或精確概率法進行兩兩比較,兩兩比較的P值需採用Boferroni法(也可以選擇其它方法)進行校正。

對於只會SPSS軟體的同學來說,做兩兩比較的卡方檢驗或精確概率法時,需要一次次選擇個案,一次次點菜單,太浪費時間和精力。用R軟體的優勢在於做兩兩比較時,不用再一次一次點菜單了,直接用幾行命令就可以了。

我們想看看不同工作崗位的男女比例是否有差異。

軟體操作

1、導入數據

mydata <- read.delim("clipboard")#查看數據str(mydata)head(mydata)

2、變量因子化

mydata$sex<-factor(mydata$sex,levels=c(0,1),labels=c("Male","Female"))mydata$work<-factor(mydata$work,levels=c(1,2,3,4),labels=c("A崗","B崗","C崗","D崗"))

#查看數據str(mydata)head(mydata)

3、對於分析涉及到的變量,形成表格數據

我們想研究不同工作崗位的男女比例是否有差異,需要把涉及到的兩個變量work和sex生成表格,輸入:

tab<-table(mydata$work,mydata$sex)tab

4、卡方檢驗和精確概率法

#卡方檢驗chisq.test(tab)

#精確概率法fisher.test(tab)

結果解讀:

使用chisq.test命令進行卡方檢驗,結果顯示:統計量χ2=20.911,p=0.0001099,在論文中需寫成χ2=20.91,p<0.001,說明不同崗位的男女比例有差異,但具體是哪兩個崗位有差異,還需進一步兩兩比較。(註:論文中卡方值一般保留兩位小數p值一般保留三位小數,如果p<0.001,可以直接寫成p<0.001)。

如果不符合卡方檢驗條件,需改用精確概率法,其實就算符合卡方檢驗條件,也可以直接用精確概率法。使用fisher.test命令進行精確概率法,結果顯示p=8.359*10-5,論文中需要寫成p<0.001,說明不同崗位的男女比例有差異,但具體是哪兩個崗位有差異,還需進一步兩兩比較。

5、兩兩比較

#install.packages("rcompanion")library(rcompanion)#兩兩比較卡方檢驗pairwiseNominalIndependence(tab,chisq = TRUE,fisher = FALSE,gtest = FALSE,method = "bonferroni")

上面紅色的warning messages提示卡方檢驗得到的結果可能不準確,為了保險起見,我們採用Fisher精確概率法進行兩兩比較。

#兩兩比較精確概率法pairwiseNominalIndependence(tab,chisq = FALSE,fisher = TRUE,gtest = FALSE,method = "bonferroni")

結果解讀:

事後兩兩比較由於檢驗次數的增多,會增加一類錯誤的概率,所以通常需要校正p值或校正檢驗水準,兩者本質是一樣的。

我們通過R軟體進行兩兩比較的好處是,可以直接設定兩兩比較p值校正方法,如本例中,我們直接設置為bonferroni法,p.adj.Fisher列即為校正後的p值,可以直接與0.05相比,如果<0.05,說明兩者之間差異有統計學意義;否則,說明無統計學意義。

本例中,A崗和B崗的男女比例差異有統計學意義,p=6.42*10-5,需要寫成p<0.001。

需要說明的是,有的p值經校正之後=1,這是很正常的。

知識拓展

本例中p值校正的方法,我們選擇的是bonferroni法,只要在論文中說明所用方法即可。

大家也可以嘗試別的方法,更多信息可以在Rstudio中輸入?p.adjust獲取。

相關焦點

  • 基於SPSS軟體實現多組比較的卡方檢驗及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。
  • 卡方檢驗最全總結
    這種資料較為常見,是比較兩樣本總體頻率(構成比)是否有差異。資料類型詳細步驟 → 【卡方檢驗】核心步驟在SPSS中,組間比較常採用Bonferroni調整法。詳細步驟 →【卡方檢驗之兩兩比較】核心步驟勾選「Bonferroni」
  • 卡方檢驗
    對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述
  • spss卡方_spss卡方檢驗 - CSDN
    8、先看到的第一個表格就是交叉表,性別為行、選擇的讀物為列   9、卡方檢驗結果:主要看pearson卡方檢驗,sig值小於0.05,因此認為不同的性別的人對周末讀物的選擇有顯著的差別   10、最後一個表格,輸出的是phi值和V值,兩個都代表兩個變量之間的關係的緊密度,數值小於0.1說明關係不緊密,即性別與周末讀物的選擇沒有明顯的關係,這個結論和上面的卡方檢驗有出入,所以需要進一步進行兩兩比較。
  • 1151期-3:【統計】卡方檢驗詳細講解
    1四格表資料的卡方檢驗用於進行兩個率或兩個構成比的比較應用條件:要求樣本含量應大於40且每個格子中的理論頻數不應小於5。當樣本含量大於40但理論頻數有小於5的情況時卡方值需要校正,當樣本含量小於40時只能用確切概率法計算概率SPSS操作步驟:
  • 【1007】R*C卡方的Fisher確切概率法為什麼會有卡方值
    一位老師問松哥:Fisher確切概率法計算的直接是P值,可是為什麼R×C表的Fisher確切概率法,卻有卡方值,這到底是怎麼回事呢?
  • 卡方檢驗在實際工作中的應用
    ,在<單元格>對話框中勾選<z-檢驗>下方倆選項以便進行多變量間的兩兩比較。兩兩比較方法之Bonferroni法(邦弗倫尼法,修正最小顯著差法):在每次比較中,將顯著性水平α除以兩兩比較的次數N,使得顯著性水平縮小到原來的N分之一,降低α錯誤的概率,避免在原假設為真時拒絕原假設,沒有顯著差異卻認為有顯著差異。
  • 卡方檢驗,T檢驗和F檢驗
    卡方檢驗、T-test、F檢驗區別卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。
  • spss卡方檢驗 - CSDN
    統計學統計學:SPSS計算標準差、作圖等,各種秩和檢驗統計學經典:如何用SPSS做秩和檢驗、組間兩兩比較國外論文:用統計學預測《權力的遊戲》角色壽命卡方檢驗,非常常用,SPSS很快搞定。比如
  • T檢驗、F檢驗和卡方檢驗
    T檢驗、F檢驗、卡方檢驗是統計學中常見的假設檢驗,今天記錄下這幾個假設檢驗的原理和應用場景。
  • 【SPSS】率的兩兩比較(Bonferroni校正)
    《Bonferroni:Step by Step 攻克兩兩比較》一文談及「Bonferroni提出,若每次檢驗水準為α',共進行m次比較,當H0
  • 卡方檢驗講解
    當我們要比較兩組或者多組均值有沒有顯著性差異的時候,我們可以用方差分析。請注意,這裡面我們提到是兩組或者多組之間的均值比較時,我們用方差分析,想一下什麼類型的數據可以求均值呢?是不是只有數值類型的數據才可以求均值。也就是所謂的連續型變量。那如果我們要比較兩組或者多組之間的分類型變量之間是否有顯著性差異呢?這個時候就不可以使用方差分析了,就需要使用專門用於分類變量比較的卡方檢驗。
  • 科研:SPSS卡方檢驗,科研文章匯總
    統計學統計學:SPSS計算標準差、作圖等,各種秩和檢驗統計學經典:如何用SPSS做秩和檢驗
  • 給大家推薦一款輕便的RC列聯表卡方統計分析工具
    2、功能強大:(1)能夠進行任意列聯表的描述性統計、Pearson卡方檢驗、Fisher精確概率、Kappa一致性檢驗、配對卡方檢驗。(2)直接給出統計量的及P值,無需查表。(3)對於四格表,還能給出OR值及置信區間。(4)對於行列數大於2的列聯表,還能自動進行兩兩比較。
  • 什麼是卡方檢驗?
    卡方檢驗,統計學的方法,現在機器學習看變量的時候也會用到。很多不知道的人,一聽到這個名詞,會馬上聯想到, 啊?還要拿張卡來檢驗嗎?其實卡方檢驗是英文Chi-Square Test 的諧音。在大數據運營場景中,通常用在某個變量(或特徵)值是不是和應變量有顯著關係。
  • 卡方分布與卡方檢驗
    本文轉載自CSDNsselssbh的卡方分布與卡方檢驗 https://blog.csdn.net/bitcarmanlee
  • 卡方檢驗中的p值計算 - CSDN
    卡方檢驗作為一種常見的假設檢驗,在統計學中的地位是顯而易見的,如果你還不太清楚可以參看這篇博文:卡方檢驗用於特徵選擇,寫的非常的淺顯易懂,如果你還想再擴展點卡方檢驗方面的知識,可以參看這篇博文卡方檢驗基礎,寫的也很有意思。
  • 卡方檢驗(2x2表格)
    摘自:醫學統計園(微信公眾號)臨床上會遇到評價兩種藥物,對治療同一種疾病的不同患者,哪一種療效會更好,如下表,這時就需要用到卡方檢驗。卡方檢驗是針對計數資料的一種檢驗方法。如果卡方值越大,超出了設定檢驗水準(α=0.05)下的卡方值(χdf,0.05),則認為實際值與理論值之間偏差屬於隨機誤差的概率較小,故而拒絕H0假設;若卡方值為0,則表示觀察值與理論值完全一致。下面介紹如何使用SPSS對2x2表格,進行卡方檢驗;如前所述,對數據的預處理,是數據分析過程中花費時間最多也是最麻煩的,因此我們先講述如何將計量資料輸入SPSS。
  • SPSS超詳細操作:卡方檢驗(R*C列聯表)
    醫咖會之前推送過一些卡方檢驗相關的文章,包括:卡方檢驗(2x2)、卡方檢驗(2xC)、配對卡方檢驗、分層卡方檢驗等。
  • 等級資料的比較:秩和還是卡方?
    :秩和還是卡方?由於它兼具了定量數據和分類數據的一些特點,分析策略更為靈活。研究目的不同,採用的統計策略將有所區別。本文就卡方檢驗和秩和檢驗方法的在等級資料中的應用進行比較分析。•例1:某醫生用某種中藥治療糖尿病患者共45例,隨機分為兩組結果如下,問該中藥對兩型糖尿病的療效有無差異?