方差分析後的兩兩比較方法太多了,該怎麼選擇?

2022-01-02 醫咖會

文章來源:「小白學統計」公眾號,感謝作者授權。


兩兩比較方法的選擇,大概是統計學界爭議最多的一個話題了,直至今天,也沒有一個完全統一的說法。所以,本文雖然說是兩兩比較方法的選擇,但更多的是在基於以往文獻的基礎上,再結合作者本人的經驗和理解,給讀者一些提示。

兩兩比較的方法太多了,正因為太多了,所以往往大家都不知道給怎麼選擇。比如SAS提供了12種兩兩比較方法讓人選擇,SPSS更是毫不吝嗇地給出了18種方法讓你選擇。我想任何一個非統計專業的人都有同一個感覺:你在耍我們嗎?

毫無提示地給出10多種方法,讓我一個毫無統計背景的人自己選擇。就像是醫生給你10多種藥,一臉憐憫地對你說:回家自己看著吃啊,你覺得哪個好就吃哪個。

關鍵是,明知道我們沒有這個判別力,為什麼要給我們這麼多的兩兩比較方法,還得讓我們自己選擇?正是統計學家太多了,每個人都能根據自己的理念提出一種方法,而這些方法看起來似乎都沒錯,那怎麼辦?只好都放在軟體中,你自己跟著感覺走吧。

下面就來說幾種比較常見的兩兩比較方法的選擇,希望給大家稍微理清一點思路。先聲明一下,以下結論是參考了不少國外課本和文獻,加上自己的一點經驗,而且只給出結論性的內容,不給出公式和證明,喜歡追根究底的朋友可以自己看專業書籍。

為什麼要用兩兩比較方法呢?大多數兩兩比較方法的目的都是為了控制假陽性,因為兩兩比較次數多了,容易產生假陽性的結果。

首先說醫學統計課本中最喜歡介紹的3種方法:LSD、SNK和Bonferroni法。我大概翻了一下國內的醫學統計學教程,幾乎都是這3種方法,但似乎都沒有說什麼情況下用。

LSD法其實就相當於t檢驗,只不過它需要在方差分析一定要有統計學差異的情況下才用。所以LSD法並沒有控制假陽性錯誤。一般情況下,如果你在設計初期就有很明確的目的,可以考慮這種方法,因為每一對比較都是有特定意義的,不用非得控制假陽性錯誤。

SNK法是先按多組均值大小排序,然後按一個有點類似於t檢驗的公式分別比較(不過誤差計算不同)。比如a、b、c三組均值分別是a最小,c最大,b居中。那麼比較時,很顯然a和c差別最大,所以在最後的界值上做一些調整。

例如,原來可能t檢驗的界值是2.83,只要t值大於2.83就算有差異,現在把界值調大,比如調到3.40,a和c的比較計算的t值,只有大於3.4才算有差異。這種調整的界值叫做q界值。這種方法對假陽性錯誤的控制依然不到位。所以如果你想控制假陽性,不要選這種方法。

Bonferroni法大概是最流行的一種方法,因為簡單。它的思想是調整檢驗水準,根據比較的次數重新設定檢驗水準,然後根據P值做出結論。比如常規的檢驗水準是0.05,只要P小於0.05就認為有統計學差異。但是如果用Bonferroni法調整,則需要0.05除以比較次數,如比較6次,這時調整後的檢驗水準是0.05/6=0.0083,也就是說,P值小於0.0083才算有差異。

這種方法其實更像是一種檢驗水準調整方法,簡單易用,不僅可以用於均值的兩兩比較,也可用於率的兩兩比較。比如你要做三組的卡方檢驗,想進一步兩兩比較,就可以考慮用這種方式,即分別做兩組的卡方,但是一共比較3次,所以P值小於0.0167才算有差異。這種方法的缺點是,當比較次數多時,結果過於保守,比如比較10次,那就需要P值小於0.005才算有差異,有時很難達到。

再說點其它國內課本上不大介紹但是國外介紹比較多的幾種方法。

下面這兩種方法一般用於各組之間例數相等的情形。

Tukey法,有時也叫Tukey HSD法(Honestly Significant Difference test)。這種方法大概是統計學家最認可一致的方法了,絕大多數統計學家都相信,Tukey法的檢驗效率可能是最高的。Tukey法也是基於q檢驗,大概意思是先確定一個最大差異的臨界值,然後分別對其中兩組比較,看看哪兩組差值大於這個界值,就算有差異。

Tukey法是大多數統計學家首先推薦的兩兩比較方法,不過這種方法只適用於組間例數相等的情況。對於組間例數不等的時候,可用修正的Tukey法,也叫作Tukey-Kramer法。

與Tukey法效率差不多的大概是REGWQ法(不要奇怪這個名字,每個字母代表一個人名,Ryan,Einot,Gabriel ,Welsch;Q表示方法)。REGWQ法與Tukey法都對假陽性錯誤控制的比較好。這種方法一般也只用於各組例數相等的情況。

下面這幾種方法一般可用於各組例數不等的情形。

如果各組例數雖然不同,但差的並不大,可以考慮用Gabriel 檢驗,這種情況下一般效率較高,但如果組間的例數差別較大,一般不要採用這種方法,否則容易結果不穩定。

當各組例數差別較大時,Hochberg's GT2法效率較高,這種方法的思路與Tukey法有點類似,只不過採用的界值不同。這種方法的效率不如Tukey法,尤其在組間例數相等時,它的效率一直不如Tukey法,但與Gabriel的效率基本相當。但在組間例數相差懸殊的時候,可以考慮這種方法。但是如果各組方差相差較大,這種方法很不可靠。

Scheffe法在國外用的也比較多,該法效率也非常高。大概是僅次於Tukey法。有時候你可能會遇到這種情況:方差分析有統計學意義,而兩兩比較卻發現任何兩組都沒有差異。這時候用Scheffe法通常不會出現這種尷尬的場面。

其它情形下的一些方法:

Dunnett檢驗是一種比較特殊的檢驗,它不是用於兩兩比較,而是某些固定的比較。通常情況下是,如果有一個對照組,多個試驗組,多個試驗組之間不做比較,但是每個試驗組分別與對照組作比較,這時候就選擇用Dunnett法。這種比較方式通常都是在研究設計階段就設定好的。

如果各組之間方差差別較大,通常可考慮用Games-Hotwell檢驗,這種方法在方差不等時可以提供更有高的效率,而且允許各組例數不等。但如果每組例數較小,這種方法容易不穩定。

最後的個人小結(僅代表個人觀點):

如果各組例數相等,建議首選Tukey法;如果例數不等,建議首選Scheffe法(如果比較組數不多,如3組,Bonferroni法也可以作為首選);如果要分別比較每個試驗組與對照組,建議採用Dunnett法;如果各組方差相差較大,建議採用Games-Hotwell法。

事實上,每一種兩兩比較方法都有自己的道理,真正在發表文章時,除非方法本身有特定的要求(比如Tukey法只能用於組間例數相等的情形),其實你採用哪種方法可能都不能說錯。有時需要結合自己的研究計劃和研究目的,比如從藥監局的角度,肯定更側重控制假陽性率,從其它不同角度可能有不一樣的目的,這些都可以作為選擇的參考。

關注醫咖會,提升臨床研究水平~

快加小咖個人微信(xys2018ykf),拉你進統計討論群和眾多熱愛研究的小夥伴們一起交流學習。

點擊左下角「閱讀原文」,看看醫咖會既往推送了哪些統計教程。或者使用電腦打開網址:http://www.mediecogroup.com/,查看70種SPSS教程。

相關焦點

  • 方差分析中兩兩多重比較方法的含義及如何正確選擇
    以SPSS方差分析為例,十多種多重比較方法可選,上圖為英文視圖,下圖為中文翻譯視圖,請對照學習。簡單介紹一下常用的方法它們的含義,以及如何正確恰當選擇使用這些方法。S-N-K:即 Student Newman Keuls 法,是應用最廣泛的一種兩兩比較方法。它採用Student-Range 分布進行所有組均值間的配對比較。該方法保證在H0真正成立時總的α水準等於實際設定值,即控制了一類錯誤。檢驗後將沒有顯著差異的組別放在一個子集,有顯著差異的組別分在不同子集,控制了犯I類錯誤的概率。
  • 方差分析&兩兩對比
    此時就需要做兩兩對比。但是由於先做了多組的方差分析,此時兩兩對比的p值不能再與0.05對比了。這就是最核心的知識點。首先我們了解下第一類錯誤。第一類錯誤:實際各組都相同,但是錯誤地認為並非各組都相同。也可以認為是太過於激進,敏感性太高,動不動就覺得不公平。
  • 如何選擇方差分析的多重比較方法?資料集錦
    方差分析時,如果因素主效應有顯著影響,則需要對因素水平進行兩兩比較,以確認因素水平間的具體差異。這個過程也叫作多重比較。SPSS提供14種用於方差齊次的多重比較方法,還有4種方差不齊情況下的多重比較方法,共18種,看似方法眾多,實則給用戶造成選擇上的困惑,這麼多的方法,我應該選哪一種呢?
  • 方差分析之多重比較
    有統計基礎的同學應該知道(如果沒有這些基礎,請自己補上)t檢驗是針對兩個組間均值比較的方法,而方差分析可以比較的組間均值不少於3個。這就需要進行多重比較(也稱兩兩比較)了。有人可能會問,為啥不直接進行t檢驗呢?做了方差分析不還是要進行兩兩比較嗎?這個問題的答案是,對這些組一起進行方差分析,能夠減少犯第一類錯誤的概率。
  • 方差分析、事後比較及簡單效應分析中的效應量
    顯然,這是個2x3的組間設計,進行單變量的方差分析即可。詳細操作過程參考「菜鳥入門」方差分析部分。而本次分析重點為效應量的報告。如下圖,在方差分析的「選項」窗口中選中「功效估計」,即可獲得F檢驗中效應量ηp2的值。另外(本圖使用的17.0版本,不同版本內容可能不同,但輸出部分必然有這一選項)
  • 方差分析的幾個統計學問題
    進行方差分析時,如果多組間比較認為總的有統計學差異,通常還可進一步做組間多重比較。多重比較的方法比較多,這裡主要介紹sas軟體中常用的方法,主要有Tukey法、Scheffe法、Bonferroni法、Dunnett法等。Tukey法:只能用於組間例數相同的情形,而且只能用於成對的兩兩比較。
  • 30天學習醫學統計與SPSS(Day 6): 方差分析與多重比較
    Day 6: 方差分析與多重比較隸屬第二章:實驗性研究定量數據的統計分析策略t檢驗主要用於兩組定量正態分布的數據比較,但是如果需要比較多組定量數據,t檢驗分析方法很可能不合適,此時,必須要藉助另外一種方法,方差分析,英文縮寫ANOVA(ANlysis Of VAriance)。
  • 多變量方差分析實例分析
    上一節我們介紹了多變量方差分析的理論,下面將分享多變量方差分析實例操作。多變量方差分析用於研究控制變量對多個因變量的影響。多變量方差分析的基本原理與單變量方差分析的原理相似,用於分析控制因素取不同水平時因變量的均值是否存在顯著性差異。但是,多變量方差分析在分析過程中還利用了各因變量協方差的相關信息。
  • 方差分析中深層次統計學問題
    2、關於方差分析兩兩比較方法的選擇     進行方差分析時,如果多組間比較認為總的有統計學差異,通常還可進一步做組間多重比較。 多重比較的方法比較多,這裡主要介紹sas軟體中常用的方法,主要有Tukey法、Scheffe法、Bonferroni法、Dunnett法等。
  • 一文讀懂SPSS單因素方差分析及方差分析(Analysis of Variance, ANOVA)——【醫學和生物統計】
    對偏態分布應考慮用對數轉換、平方根變換、倒數變換、平方根反正弦變換等變量變換方法變為正態或接近正態分布後再進行方差分析。獨立性各樣本必須是相互獨立的隨機樣本,樣本含量儘可能相等或相差不大。二、基本原理由於各種因素的影響,方差分析研究的數據呈現波動性。
  • 實驗分析技術:事後多重比較;方差分析拒絕原假設就結束了?還沒分析完呢
    事後多重比較如果單因素方差分析的結果顯示至少有兩個水平均值存在顯著性差異,那麼接下來分析者希望通過所有水平均值之間的兩兩比較,以確定哪些水平的均值不同。跟著草堂君學習過SPSS軟體的朋友,應該對下圖比較熟悉:事後多重比較的方法很多,可以分成兩類,假設方差齊性和不假設方差齊性。
  • 案例實戰|單因素方差分析詳解
    判斷數據是否滿足方差分析的使用前提①   繪製分組箱線圖觀察數據  首先用箱線圖來觀察不同組別的分布差異。選對話框如下圖所示:得到的分析結果如下所示:SPSS中對數據方差齊性檢驗可以和方差分析同時進行,得到上圖中的數據結果。從方差齊性檢驗表來看,顯著性檢驗P值小於0.05,所以認為不同組間的方差不齊。這個進一步說明該案例數據不滿足使用單因素方差分析的前提條件。
  • Bonferroni:Step by Step 攻克兩兩比較
    網友們在閱讀SIC或其他文獻時,可能會發現Bonferroni是在研究中涉及多重比較時出現較多的一個高頻詞,文獻中常出現Bonferroni的統計方法有獨立樣本參數檢驗(非參數檢驗)的兩兩比較、率的兩兩比較、隨機區組設計的兩兩比較等。
  • 兩兩比較SNK檢驗沒有P值?
    多重比較的方法有很多,按照「事前事後」的標準,事前比較的常用方法有LSD、Bonferroni和Dunnett法;事後比較的常用方法有SNK、Turkey、Scheffe和Bonferroni法。上述都是針對均值資料的多重比較方法,秩均值和率資料的多重比較方法,可查閱「統計諮詢」公眾號的往期文章《常用的多重比較統計方法》。
  • 全流程總結方差分析,就靠它了!
    單因素方差分析可以比較一個自變量(比如品牌);而雙因素方差可以比較兩個自變量(品牌和銷售地區);多因素方差可比較三個及以上的自變量,以及可以研究多個自變量對因變量Y的交互影響。單因素方差分析在問卷研究中常用於分析個人背景信息對核心研究變量的影響(比如不同性別,滿意度是否有顯著差異)。
  • 差異性分析中不可不知的方差分析
    而研究過程中,往往是兩組以上的數據進行差異性比較,比如大學四個年級的心理健康素質的差異性,某個省不同縣市收入水平的差異性等等,這些只能求助方差分析啦。方差分析,簡稱ANOVA,又稱「變異數分析」或「F檢驗」,是主要用於兩個及兩個以上樣本均數差別的顯著性檢驗。從定義上我們可以知道獨立樣本T檢驗其實是方差分析的一種特例。
  • 單因素方差分析超完整分析流程
    當我們想了解不同年級的學習態度是否有區別,進而提供有針對性的教學方案,又或者分析不同職業對某產品的購買意願是否有差異,進而根據分析結果精準投放廣告。以上這些分析兩個及兩個數據之間的差異情況都可以使用同一種分析方法——方差分析。01.
  • 醫學科研課堂丨統計說說(四):統計學方法之靈魂—方差分析
    這期厲害了,統計學方法的靈魂,大家一起來聽劉嶺教授說一說方差分析。因此在應用方差分析時,要結合具體的研究設計方法來選擇相應的方差分析方法。常用的設計有:隨機單位組設計/拉丁方設計/交叉設計/析因設計/正交設計/嵌套設計/裂區設計/重複測量數據/協方差分析等進行方差分析時同樣要求資料滿足正態分布且方差相等兩個基本假設(與獨立樣本t檢驗的條件一樣一樣滴)。即:1. 各樣本組內觀察值相互獨立,且服從正態分布;2.
  • 只有均數標準差和樣本量做方差分析
    今天又有同學問我,假如只有多組的均數、標準差和樣本量,如何進行方差分析?還要需要進一步兩兩比較?這個問題就值得研究了,非常幸運的是R軟體的rpsychi包提供了這個功能。假如您不想寫命令,還可以提供一個網頁直接計算。兩種方法結果完全一致。
  • SPSS統計:單因素方差分析與單變量方差分析
    這兩種方法既有區別又有聯繫,在統計學中,這兩種分析方法統稱為方差分析,在spss中由於線性模型的引入,才有所區分,那麼這兩種分析方法在具體應用中有什麼樣的區別和聯繫?二者的適用情況是什麼?分析結果有何異同?下面將進行詳細介紹。