列聯表篇之二:四格表的分析

2021-03-02 張老師漫談六西格瑪

    在列聯表中,二維表是最基礎的一類表,在二維表中,四格表是最基礎的一類表。

    四格表的基本形式在《經典比較篇之十一: 小樣本的比率比較怎麼做?》中已經介紹,這裡在把表貼出來。

    下面針對表格數據的各種不同形式來介紹相應的分析方法。

基本四格表的分析方法

1.正態近似

    基本四格表其實是兩個比率(就是上表的最後一列)的比較,當比率滿足條件np和n(1-p)均大於5時,可以採用正態近似來分析。這個大家都很熟悉了,本文不再涉及。

2.卡方檢驗

    卡方檢驗的原理上一篇已經介紹過了,見《列聯表篇之一:雙向無序列聯表的分析》。對於四格表來說,有一個專用的公式計算卡方值:

    這個公式不再需要計算期望頻數了,也不難記,放在這裡大家參考著用。

3.卡方檢驗的校正公式

    四格表中的數據不是連續的,因此計算出的卡方值也不是連續的,但χ2分布是連續的。當自由度特別小,尤其是四格表這樣只有1的時候,計算出的卡方值偏小,假陽性的概率增大。為此,美國統計學家F.Yates1934年提出了一個計算卡方值的連續性校正公式:

特別的,對於四格表

4.Fisher精確檢驗

    這是一種在小樣本情況下的檢驗方法,對於四格表來說,它運用超幾何分布做檢驗,具體方法和步驟見《經典比較篇之十一:小樣本的比率比較怎麼做?》。對於大於四格表的列聯表,當樣本量比較小時,尤其是期望頻數小於5的格子超過20%時,也需要採用Fisher精確檢驗,不過其方法比較複雜,需要藉助軟體來計算。

5.方法的選擇

    在孫振球教授的《醫學統計學》p.114,介紹了四格表的卡方檢驗的三個選擇原則:

    (1)當n≥40且所有的E≥5(也就是a、b、c、d對應的卡方分布的理論頻數),可以用卡方檢驗的基本公式,但當p≈α時,改用Fisher精確檢驗。

    (2)當n≥40但有1≤E<5時,用卡方檢驗的校正公式,或改用Fisher精確檢驗。

    (3)當n<40,或E<1時,用四格表的Fisher精確檢驗。

    當然,現在統計軟體已經功能非常完善了,我認為不管表格中的數據屬於哪種情況,直接用Fisher精確檢驗總會相對準確一些。個人之見,僅供參考。

配對四格表的卡方檢驗

    熟悉經典比較的都知道有配對t檢驗,在列聯表中也有配對的列聯表。與配對t檢驗類似,配對列聯表也要求樣本保持不變,如可以是部件加工前和加工後的比較,也可以是兩種不同的評價方法的對比。表格可以進一步寫成這樣:

    針對配對的四格表,有兩種分析方法可以選擇,即Mcnemar檢驗和Kappa檢驗。前者關注的是差異,後者關注的是一致性。

1.Mcnemar檢驗

    a和d代表結果的一致性,b和c代表結果產生的變化。在Mcnemar檢驗中,原假設是對樣本所施加的處理沒有顯著效應,也就是發生不同方向變化的可能性是一樣的,有多少「-+」,就應該有多少「+-」,即b=c,如果兩者差異很大,則說明兩種不同的處理有顯著的差異,或一種處理的前後狀態存在顯著差異。

    從另一個角度來說,Mcnemar的原假設是邊緣概率相等,即

    因此Mcnemar檢驗的假設就可以寫成

    以此建立的檢驗統計量為:

從統計量服從自由度為1的χ2分布。

    例1:某公司計劃引入六西格瑪管理,為此選取100員工,在實施六西格瑪戰略宣講前後,就引入六西格瑪的必要性進行調查,調查結果如下表。問宣講前後員工的態度有變化嗎?

    假設就不寫了,大家都知道怎麼寫。計算出的卡方值為:

    在α=0.05時,自由度為1的卡方檢驗臨界值為3.84,因此我們拒絕原假設,認為宣講前後員工的態度有顯著變化。

    根據孫振球教授的說法,當b+c<40時,檢驗統計量需要加以校正,即

    有的資料中指出當b+c<25時,採用卡方檢驗會出現較大的偏差,此時需要採用二項分布的精確檢驗。Mcnemar檢驗就變成了單比率檢驗,假設變成

其中n=b+c。單比率檢驗在《經典比較篇之十一:小樣本的比率比較怎麼做?》中有介紹,這裡不再贅述。

    Mcnemar檢驗與a和d兩個格子的值無關,當這兩個值很大時,即使檢驗結果顯著,其實際意義也不是很大。因此我們需要考慮一致性的問題,這就需要Kappa檢驗。

2.Kappa檢驗

    看到Kappa檢驗,熟悉測量系統分析的人馬上就會想起來,在屬性數據測量系統分析中,大量採用Kappa值來度量測量結果的一致性。在馬逢時教授《六西格瑪管理統計指南》p.399-402對此有詳細介紹。

    Kappa檢驗由Cohen與1960年提出,因此又稱為Cohen'sKappa。它考慮的是實際的結果是不是瞎猜的結果,比如一個新員工對檢驗標準不了解,但也能蒙對一部分。而Kappa值就是對此的衡量,其公式為:

其中

為實際一致的比率,而

為期望的一致率,即蒙對的比率。

    Kappa取值從-1~+1。-1代表完全不一致(a=d=0且b=c);+1代表完全一致(b=c=0);0表示結果純粹是瞎矇的;負值代表結果比瞎矇還差(當然也沒有什麼實際意義,實際上出現得很少);正值越接近1代表一致性越好。通常0.75以上表示一致性較滿意,0.4以下一致性不好。但是對於測量系統來說,需要在0.9以上才能說是好的測量系統。

    例2:某工廠針對注塑產品表面質量一般採用人工和設備兩種方式進行檢驗。為了了解兩種檢驗方式的一致性,隨機選擇35件樣品,採用兩種方式分別進行檢驗,結果如下表。

    根據上面的公式計算出Kappa值為0.2,說明兩種檢驗的結果一致性很差。

    可能有人會問,這個分析並沒有告訴我們哪一種更好。為了確認哪一種方法更好,可以加入標準這個因素,即由專家對樣品進行仔細鑑別,確定標準的結果,然後再將兩種檢驗方法的結果分別與此對比。其中的一張表是這樣的:

    根據此表計算出的Kappa值是0.906,說明人工檢驗的準確率是很高的。

    Kappa值很少做顯著性檢驗,因此本文也不考慮提及其分布和檢驗的問題。

    Kappa值也可以分析多於四格表的列聯表,其P0就是自左上至右下的對角線上的格子中頻數之和除以總樣本量;Pe是此對角線上格子對應的行和乘以列和,然後相加再除以總樣本量的平方。這樣說有點難懂,我不希望再列太多的公式,用一個例子來說明一下。

    例3:某個考試共有80道單選題,每題的有A、B、C、D四個答案,為考察某個考生的成績是不是隨便猜的,可以用Kappa分析做一個較確切的判斷。數據表如下:

    完全一致的有19+18+18+17=72,計算得P0=72/80=0.9。

    Pe=(21×20+21×20+20×20+18×20)/802=0.25。

    由此計算出Kappa=(0.9-0.25)/(1-0.25)=0.867。這個值比較大,說明學生的答案不是瞎矇的,是真的學會了。

相關焦點

  • 列聯表篇之一: 雙向無序列聯表的分析
    本單元主要討論列聯表,在六西格瑪的課程中,列聯表涉及的內容很少,並且是以多比率比較的方式引入。馬逢時老師《六西格瑪管理統計指南》中對內容作了一些拓展,而且引入了三維的列聯表,介紹了Simpson悖論。    當我著手準備開始本單元時,發現列聯表的形式多種多樣,統計學家們提出的分析方法也很多,且各有針對性,如果不是很熟悉的話很容易用錯。
  • 給大家推薦一款輕便的RC列聯表卡方統計分析工具
    前不久,我向各位隆重推薦了王江源老師的博客,有20餘篇SPSS文章都是精品,值得花時間把每一篇文章通讀學習,今天藉機再次推薦:學習資料|王江源博客推薦,21篇優質SPSS文章分享除了分享案例文章之外,實際上王老師博客裡面還給大家埋了一顆彩蛋,不知道大家發現了沒?
  • SPSS分析技術:列聯表分析;男生肺活量一定比女生大嗎?
    對於定類數據和定序數據這類數據總體,因為計算均值和方差是沒有意義的,所以應該用非參數檢驗對它們進行分析,而列聯表分析就非參數檢驗中的一種,特別適用於定類數據的分析。列聯表分析基礎列聯表指一個頻率(頻數)對應兩個變量的表,其中一個變量用於對行進行分類,另一個變量用於對列進行分類。在實際分析中,除了需要對單個變量的數據分布情況進行分析外,還需要掌握多個變量在不同取值情況下的數據分布情況,從而進一步深入分析變量之間的相互影響和關係,這種分析被稱為列聯表分析。
  • SAS列聯表分析
    有時我們得到的數據是每一個觀測的變量取值,比如,我們有每一個學生的性別(SEX)情況和來源(FROM)情況,可以輸入這些原始數據,如:data class; input sno sex $ from $; label sex='性別' from='來源'; cards;1 男 本地2 女 外地3 男 外地…………/* 所有學生的記錄 */;run;
  • SAS系列23:列聯表資料假設檢驗方法
    列聯表(Contingency Tables)是觀測數據兩個或更多個屬性分類時所列出的頻數表,又稱交互分類表,交互分類的目的是為了將兩個變量分組,然後比較各組的分布狀況,從而分析變量間的關係。若考慮的屬性多於兩個,也可按這種方式做出列聯表,即多維列聯表,多維列聯表分析屬於離散多元分析的範疇,列聯表分析在醫學、生物學及社會科學中,有重要的應用。列聯表看似簡單,做起來卻是有一定的難度,在做這類數據分析時我們一定要注意列聯表中的邏輯關係,在做這一類資料時,我會把相應列聯表數據呈現出現,大家可以細細分析雙向無序、單向有序、雙向有序資料。
  • 臨度科研 | 數據統計的理解和運用(七)列聯表數據分析詳解
    接第四期的列聯表之卡方檢驗,這一期,臨度黃老師和大家聊聊列聯表數據分析。列聯表分類眾多,粗略分為以下幾類:成組設計橫斷面研究四格表資料統計分析成組設計隊列研究四格表資料統計分析成組設計病例對照研究四格表資料統計分析成組設計結果變量為多值有序變量的 2XC 表資料統計分析成組設計結果變量為多值名義變量的 2XC 表資料統計分析單因素多水平設計有序原因變量
  • 【花滿帶你學SAS】SAS中的列聯表分析
    列聯表分析在SAS一般步驟:proc freq data=data noprint;       tables Var*group/outpct out=test expected;quit;通過以上步驟計算出數據的總樣本數總樣本數(N),、最小的理論頻數(T),T<5的格子數的個數(TN)等 ,expected表是輸出理論頻數
  • 分類變量的關聯性分析
    這次順道推出關於交叉分類變量的關聯性分析。即現實生活或工作中,經常會遇到關於「兩變量間是否存在關聯」或「如果存在關聯,它們之間的關聯方向與關聯程度如何」的問題。例如:吸菸與患肺癌的關係;人們的幸福指數與經濟收入的關係等。2X2交叉表頻數表的一般形式 如果屬性X ,Y互相獨立,即兩者之間頻率分布無關,否則稱這兩屬性之間存在關聯性。
  • R語言_016基本統計(列聯表)
    列聯表是觀測數據按兩個或更多屬性分類時所列出的頻數分布表,它是由兩個以上的變量進行交叉分類的頻數分布表。
  • 數據收集篇之十七: 我為什麼反對在屬性數據MSA中用Kappa分析(上)(修改)
    本文試圖從Kappa分析的原理來做一探究。    Kappa分析有兩種。    一種是Cohen's Kappa,只能用於分析對同一組對象兩次評價的一致性,如一個人先後兩次評價的一致性、一次評價與標準的一致性、兩個人對同一組對象評價的一致性等。具體原理參見拙作《列聯表篇之二:四格表的分析》。
  • 精益六西格瑪管理-列聯表的獨立性檢驗,離散記錄的分析實例
    因為列聯表的獨立性檢驗應用非常廣泛;尤其在市場管理方面的應用,可以指導組織的行為,使組織在市場營銷方面更有針對性。>02分析步驟列聯表獨立性檢驗分析步驟;二是在確定拒絕域時,由於有三個城市,也就是說有3個因子。即行數等於3,所以r=3。由於有兩個結果,即列數等於2,所以c=2。在本例中,由於計算所得卡方統計量的值為9.301,遠大於拒絕域臨界值5.991。所以拒絕原假設,認為三個城市之間,辦事效率的差異顯著。
  • 相關和回歸—分類變量關聯性分析
    前面兩篇文章分別學習了Pearson積矩相關和Spearman秩相關,用於兩個定量變量之間或定量變量與等級變量之間的關聯性分析。
  • 精益六西格瑪管理-列聯表的獨立性檢驗,如何在Minitab中分析?
    前面我們分享了列聯表獨立性檢驗的分析原理。接下來繼續看如何在Minitab軟體中進行分析;以及其輸出結果如何觀察和判斷。我們還是以前一篇中的問題為例子進行說明。不選時,ANOVA表中表頭顯示為1和2.卡方檢驗分析表;Minitab運行結果如下;由於p-value只有0.002,因此拒絕原假設,即應認為吸菸與咳嗽有關,或說吸菸與不吸菸的咳嗽率是有顯著差別的。統計表中,從上而下,分別是實際觀測值,期望值及其對卡方統計量的貢獻。
  • SPSS教學第二節:基本統計分析功能
    TES工作室SPSS統計分析教學第二期分享:SPSS基本統計分析功能,推送內容不完全按照目錄順序推送,敬請諒解,主要是為了讓大家快速掌握一些配套操作技能。SPSS基本統計分析功能主要包括頻數分析、描述性分析、探索性分析、列聯表分析。
  • 問卷調查中多選題如何分析?
    如今進入數據時代,為了解消費者需求、購買慾望以及政府部門為了對某一經濟指標進行分析,需要對某地區某經濟指標進行深入調查;其中通常會有幾個多選題項。但是,面對這種選擇多個問題的題目,如何分析?本文將對這個問題做一些簡單介紹。
  • 第四節 病例對照研究資料分析
    第四節 病例對照研究資料分析   一、成組病例對照資料分析   (一)資料整理的構架   成組病例對照研究資料可按表29-2所示的四格表整理。   (二)資料分析   1.比較病例組和對照組的暴露比,並作x2檢驗。最簡單的情況是因素與結局都只分為「有」或「無」兩類,結果可歸納2×2表(表29-4)。   2.測定這兩個比的差異有無統計學意義,可用一般四格表x2檢驗或修正x2檢驗。若兩組差異有統計學意義,說明該暴露因素與疾病存在聯繫,則進一步求比值比。
  • 「統計學」最常用的數據分析方法都在這了!Part.2
    五.列聯表分析列聯表是觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表。簡稱r×c表。若所考慮的屬性多於兩個,也可按類似的方式作出列聯表,稱為多維列聯表。列聯表又稱交互分類表,所謂交互分類,是指同時依據兩個變量的值,將所研究的個案分類。
  • 統計學最常用的「數據分析方法」清單(一)
    分類有2種:  外在信度:不同時間測量時量表的一致性程度,常用方法重測信度;  內在信度:每個量表是否測量到單一的概念,同時組成兩表的內在體項一致性如何,常用方法分半信度;  四、列聯表分析  列聯表是觀測數據按兩個或更多屬性(定性變量)分類時所列出的頻數表。  1.
  • 推薦一本量表編制和分析的入門讀物《量化研究與統計分析》
    該書包括四篇▪ 第一篇 量化研究的基本概念▪ 第二篇 數據處理與數據查核▪ 第三篇 統計分析的原理與技術▪ 第四篇 測驗編制的分析技術與其他的量化研究與統計分析方法書的體例相比較,這本書在第四篇最有特色,專門系統地介紹了量表編制的操作步驟和方法。