提示:點擊上方"R語言中文網"↑掌握更多資源
上期內容回顧上期介紹了一維列聯表、二維列聯表及多維列聯表的生成方法,對本期獨立性檢驗和卡方檢驗有重要意義,下面一起回顧一下吧:
1、一維列聯表:調用table()函數,還可以使用prop.table()函數獲取頻率統計表;
2、二維列聯表:調用table()函數,xtabs()函數(在有頻率的數據表中很有用),gmodels包中的CrossTable()函數;
3、多維列聯表:直接調用table()函數,xtabs()函數。
溫馨提示 :如果感到有些陌生,那就趕快翻開公眾號歷史消息溫習一下~溫故而知新哦~
本期內容導讀學會了列聯表的生成,下面便進入了以列聯表為基礎的獨立性檢驗與卡方檢驗,主要檢驗變量之間是否獨立或相關。
示例數據:
本期採用的數據為R中自帶的數據集HairEyeColor,該數據集是一個三維數列,包含了592名學生的頭髮顏色、眼睛顏色以及性別的信息。
這裡將數據轉化為數據框,方便查看。
1、卡方獨立性檢驗調用函數
chisq.test(x, y, correct=TRUE)
參數解釋:x,y均為向量,當然也可直接將處理好的列聯表名稱代替x,y;correct表示是否應用連續性矯正。
函數調用示例如下:
按照α=0.05的標準來看,這裡的P值較小,落在拒絕域,意味著在統計意義上,頭髮顏色與性別不獨立。
2、Fisher精確檢驗調用函數
fisher.test(x, y, alternative)
參數解釋:x,y同上;alternative可以選擇進行單尾(「greater」、「less」)還是雙尾檢驗(「two.sided」)。
函數調用示例如下:
按照α=0.05的標準來看,這裡的P值在拒絕域中,意為頭髮顏色與性別不獨立,與上面的結果一致。
3、CMH檢驗CMH檢驗(Cochran-Mantel-Haenszel卡方檢驗)指的是在兩個名義變量(x,y)在第三個變量(z)的每個水平下是否獨立。
調用函數
mantelhaen.test(x, y, z, alternative, correct)
參數解釋:x,y均為向量,當然也可直接將處理好的列聯表名稱代替x,y;z為向量,代表以上概念中的第三個變量;correct表示是否應用連續性矯正;alternative可以選擇進行單尾(「greater」、「less」)還是雙尾檢驗(「two.sided」)。
注意:這種檢驗方法假設不存在三個變量的交互作用。
函數調用示例如下:
現在的檢驗驗證了在不同的性別條件下瞳孔顏色與頭髮顏色是否獨立,結果拒絕零假設,即兩個變量是不獨立的,結果表明不同群體間,瞳孔顏色和頭髮顏色有關,生物學上可能存在某些基因影響瞳孔和頭髮顏色。
4、上期補充當然上一期中提到了gmodels包中的CrossTable()函數,它將生成列聯表以及相應的檢驗(卡方檢驗、Fisher精確檢驗)集成在一起。
調用函數
CrossTable(x, y, digits, prop.chisq, chisq, fisher, …)
參數解釋:x, y為兩個變量,digits為結果的小數位數,prop.chisq、fisher等參數是能夠在生成表的同時進行相應的檢驗。
函數調用示例如下:
這裡的結果,與上面幾個例子相同,故不再贅述。
延伸拓展:
1、vcd數據包中有一個Arthritis數據集,記錄了風溼性關節炎的雙盲臨床試驗的結果,請驗證治療情況(Treatment)和改善情況(Improved)是否相互獨立?
2、與1同樣數據集中,在性別的各種水平下,兩變量(Treatment、Improved)是否相互獨立?
下期預告:
本期就到這裡,下期將會介紹相關係數及相關性檢驗,歡迎大家圍觀!
R語言中文網是國內最大、人數最多的R語言學習樂園。以微教學為主,圖文並茂,實戰實例,點滴間積累所有技能。快快關注我們吧~
—官方網站—
R語言中文網 www.r-china.net
—官方QQ群—
R語言中文論壇-2(1000人群):427060123
R語言中文論壇(2000人群,已滿):74076289
Biostatistician(500):186701945
—官方微博—
新浪微博:@R語言中文網官網
—官方微信—
微信名:R語言中文網 微信號:rchinanet