多重比較Bonferroni校正太苛刻?如何解決?

2021-03-01 統計諮詢

  前言  

當研究者進行一組假設檢驗,傳統的統計方法將因「多重比較」的問題導致結論不可靠。當研究者進行多次假設檢驗,儘管實際上沒有統計學意義,但總有一兩次能得到有意義的結果。

傳統的假設檢驗是基於一個原假設得到的觀察樣本結果或更極端情況的概率。當進行多重比較時,傳統P值就不能代表基於原假設的真實概率了。

  多重比較問題  

幾乎所有科學研究都會面臨多重比較問題。常見的是,研究者不僅關注某個處理組與對照組的比較。下面是幾種常見的多重比較情況:

多個處理組。假設有n個處理組,將會有n(n-1)/2對可能的比較。

亞組分析。比如,我們會按性別分組進行亞組分析,看看效應在兩組中是否一致。

多次估計。實驗者常對同一個數據集應用多次估計,對於這種設計和分析,有時需要考慮多重比較的影響。

多個結局。研究者對某個幹預對多個不同結局的影響。

在多重比較後綜合一系列的結果,英文中我們稱為「family claim」。比如,某個「family claim」稱,處理組A、B、C、D沒有作用,但處理組E有。再如,處理因素在組1、2、3中沒有作用,但在組4中具有強效應。

多重比較的問題與「fishing」相關,但有很大不同。「fishing」指的是研究者做了大量的檢驗,但僅匯報其中「interesting」的結果。實際上,「fishing」中進行的大量檢驗我們都應該進行多重比較的校正。

  Bonferroni校正太苛刻  

Bonferroni校正因其操作簡單而成為常用的多重比較校正方法。若進行了k次檢驗,檢驗水準應該校正為α/k,或者直接將P值乘以k後跟α進行比較。(註:後者可能出現P值超過1的情況,難以解釋)

比如,研究某個幹預對三個結局的影響,進行三次組間比較得到P值為:0.004、0.020、0.122。採用Bonferroni法進行校正後,α' = 0.05/3 = 0.016,只有第一個檢驗具有統計學意義。當檢驗次數增大時,具有統計學意義的檢驗個數將更少。

  Benjamini-Hochberg校正  

為了克服Bonferroni校正的苛刻性,我們可以選取Benjamini-Hochberg校正方法進行代替。假設有m個P值,該方法先將所有P值從小到大進行排序,可看做Pk,k=1,2,...,m,然後計算每個Pk對應的α' = k ÷ m × α,所以α'依次為0.017、0.033、0.050。

  R語言實操  

像Benjamini-Hochberg校正這麼「好」的方法,R語言當然可以簡單的實現。

#設定隨機種子為周五的日期

set.seed(20180713)

#模擬產生50個檢驗對應的P值

x <- rnorm(50, mean = c(rep(0, 25), rep(3, 25)))

p <- round(2*pnorm(sort(-abs(x))), 3)

#分別計算bonferroni校正和Benjamini-Hochberg校正的P值

bonferroni <- p.adjust(p, "bonferroni")

BH <- p.adjust(p, "BH")

#計算各個情況下有統計學意義的P值個數

length(which(bonferroni < 0.05))

length(which(BH < 0.05))

length(which(p < 0.05))

結果顯示,具有統計學意義的P值個數分別為5、19、23,可以看出相對於苛刻的Bonferroni校正,Benjamini-Hochberg校正是個不錯的選擇。

  相關閱讀  

本文摘譯自《10 Things to Know About Multiple Comparisons》,感興趣的朋友可以自行查閱原文:https://egap.org/methods-guides/10-things-you-need-know-about-multiple-comparisons

本公眾號往期相關文章《臨床試驗中的多重性校正》,感興趣的朋友也可自行查閱。

▼歡迎關注《統計諮詢》公眾號▼

▼掃碼讚賞▼

相關焦點

  • 多重檢驗校正與Bonferroni校正
    多重檢驗(10000次)會使得單次檢驗的標準(p=0.01)變得過於寬鬆,使得陽性結果出現的頻數大大升高(10000*0.01=100)。解決的辦法就是要提高判斷的標準(p-value),單次判斷的犯錯概率就會下降,總體犯錯概率也會下降。多重檢驗中提高判斷標準的辦法就稱之為多重檢驗校正。Bonferroni校正即為最嚴格的多重檢驗矯正方法。
  • 卡方檢驗和精確概率法及兩兩比較
    看過許多統計教程,這篇是我最推薦的介 紹數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。
  • 百年正太鐵路和石家莊的故事,你知道多少?
    1904年5月,經過一系列的波折之後,正太鐵路終於開始施工,並於1907年建成通車。正太鐵路全長243公裡,大部分路段穿越的是峰迴路轉的山區。以當時的技術條件與設備,3年完成全線通車,施工效率不得不讓人嘆服。此外,其精妙的線路設計,也為後來的石太鐵路複線及高鐵修建奠定了基礎。
  • 陰陽師官方新瓜劇透 源博雅預定正太皮膚?
    陰陽師二周年慶正太當道,顯示少羽大天狗、小白,後有晴明少時之約,想必平安京的禿子們都被這寫正太萌出血了,近日陰陽師官方又爆出三張圖透
  • 【SPSS】率的兩兩比較(Bonferroni校正)
    《Bonferroni:Step by Step 攻克兩兩比較》一文談及「Bonferroni提出,若每次檢驗水準為α',共進行m次比較,當H0
  • 有種「重男輕女」叫張庭,女兒顏值一般,兒子卻繼承好基因成正太!
    2009年張庭的女兒出生,很多人都比較期待,覺得這一定會是一個和媽媽一樣精緻的女孩子,但是誰都沒有想到女兒長得很一般!後來張庭又生下兒子,很多人都發現兒子從小長相非常可愛,留著學生頭的他給人的感覺非常乖巧,是一個標準的小正太。不少人都覺得張庭的兒子繼承了媽媽的優點,小小年紀就非常乖巧,給人的感覺非常清秀!
  • 一塊耐火磚多重?如何計算耐火磚重量?
    一塊耐火磚多重?如何計算耐火磚重量?耐火磚重量是多少?為什麼大家這麼關心耐火磚的重量問題?耐火根據所採用原材料種類不同,其密度也不同,耐火磚在出廠前都會檢測其體積密度。體積密度是表示乾燥製品的質量與其總體積之比,用g/cm3表示。
  • <聖境傳說>小正太帶領活體羊駝驚現北京動漫展
    今日,在中國國際展覽中心,一頭昂首闊步的「神獸草泥馬」——可愛的澳洲羊駝,在一個超萌小正太的帶領之下,悠然漫步於北京繁華的鬧市街頭,引來了無數路人圍觀,引發了不小的轟動。一位超級可愛「萌」態十足的小正太,身著印有「不要迷戀哥,哥只是聖境裡的傳說」字樣的T恤牽著「草泥馬」羊駝走出了展館,出現在了國展中心外場,開始派發《聖境傳說》的產品宣傳單和小禮品,可愛的小正太,超萌的羊駝,很快便引發了現場路人的圍觀,掀起了文博會動漫展開幕以來的最大高潮!
  • 非人哉漫畫:神仙醉酒也很可怕,敖烈變成了正太,昂日星君撩九月
    敖烈就在和外國客戶吃飯的時候喝醉了,他們還在飯桌上互相扔魔法,這就比較麻煩了,讓九月也是非常擔心,還特意留下來照顧敖烈。第二天九月就發現出事了,原本喝醉的敖烈不見了,變成一個小正太烈烈,九月面對縮小的烈烈束手無策,但是卻沒人準備幫她,九月只能硬著頭皮自己帶娃。
  • 工作細胞第9集:殺手T細胞原來是個小正太,他被輔助T細胞彈額頭
    工作細胞第9集更新,在本集中給我們回憶了殺手T細胞的童年,原來小時候的殺手T細胞是一個萌萌的小正太,而輔助性T細胞是天才的存在,他常常欺負殺手T細胞,還經常彈他的額頭,不過隨著感情的加深,我們慢慢聞到了搞基的味道。小時候的殺手T細胞可一點也不強壯,就是一個很容易被欺負的小正太,而且在輔助T細胞的欺負下經常哭鼻子。
  • 《中國新聲代》陷"孩子荒" 正太男團TFBOYS救場
    對此,《中國新聲代》節目組重新撒網,不但計劃調整節目內容,吸收更多的音樂學員加入,還瞄準了如日中天的正太男團TF boys,並說服他們來參加《中國新聲代》第二季的錄製,為節目增添代表00後青春活力的「小鮮肉」。 TFBOYS是由王俊凱、王源和易烊千璽等三名初中生組成的全新少年偶像團體,憑藉著夢幻可愛的外形,被網友稱為「正太男團」,萌殺眾多姐姐媽媽級女粉絲的心。
  • 校小貓招生來威海了!
    人們都說選擇大於努力,選擇了努力便風雨兼程,選擇了遠方便永不停歇,選擇了校小貓,學校招生更easy,學生學習更放心。一切始於選擇,也得益於選擇,而校小貓也終究不會讓您的選擇失望。校小貓是旌旗(山東)教育科技有限責任公司旗下的部門。
  • 《鋼鐵俠4》主角將是小正太?2019年將重返銀幕!
    《鋼鐵俠4》主角將是小正太?2019年將重返銀幕!最近有一個傳聞被說的有板有眼兒,據稱漫威已經鎖定了小羅伯特·唐尼的鋼鐵俠繼承者,不是別人,正是《鋼鐵俠3》中的那個正太Harley Keener
  • 家長來校「反映」教師教學問題,怎樣解決?
    值得考慮的是:如何應對? 一、善待家長的反映。家長的反映一般也不會空穴來風,希望老師能負責認真,有本領,帶著學生取得好的成績。學校不應該阻擋家長反映問題,而是要歡迎家長到學校,面對面溝通交流。這樣更有助於問題的解決,否則容易激化矛盾。二、注重交流的藝術。注重溝通交流的藝術不是迴避、不是不認真。相反,要更謹慎,認真對待。
  • 超臨界液體萃取存在哪些苛刻的標準
    超臨界液體萃取存在哪些苛刻的標準 ,「12vugqc」   超臨界液體萃取,節能高效,型號齊全,可非標定製,7*24小時售後服務。無錫冠亞從事超臨界液體萃取的研發,生產,銷售與服務於一體的企業。
  • 事後多重對比如何使用使用?
    SPSSAU-多重比較方法選擇分析時,首先判斷方差分析的p值是否呈現出顯著性,如果呈現出顯著性,則說明不同組別數據具有顯著性差異非參數的事後多重比較當數據呈現嚴重的偏態或方差不齊,可考慮使用非參數分析,同樣可以進行兩兩對比。
  • 為什麼物理學家都不喜歡「多重宇宙論」?!
    有的科學家對各種形式的「人擇原理」嗤之以鼻,很不待見多重宇宙假說,因為它無法驗證。即便那些不排斥多重宇宙觀點的,也巴不得繞過宇宙學常數問題,尋找別的探索途徑。但直到目前,拋開多重宇宙,這個問題幾乎無解。
  • 基於正交可見光化學反應的多重聚合物網絡凝膠快速高效構築策略
    2003年,北海道大學龔劍萍教授以「Double‐Network Hydrogels with Extremely High Mechanical Strength」為題首次提出以多重聚合物網絡設計策略來提高凝膠力學性能和韌性
  • 美國人眼中名校的七個級別,你知道如何分類比較嗎?
    西方人喜歡分類比較。同樣,美國人民也將大學分為七個級別,猶如階梯,越往上走,越好。 美國人眼中名校的七個級別 一、 頂級 單說學術,在美國人心中,能達到這個級別的只有三所:Harvard、Yale 和Stanford。這個非常苛刻,一就是一,頂級就是頂級,差一點都不行。
  • 黑之契約者:結局正太伊邪那美的出現,揭示著什麼?
    現在我們知道正太擁有伊邪那美的能力,就是這個能力會對以後的世界產生非同一般的影響。那正題來了,作者特意在後面撰寫出一個這樣人物,此所為究竟為何?有什麼深意在裡面?第二種可能:作者實在不想黑孤獨終身,他已經失去了白、琥珀,連共事的黃都離他而去,所以想來個happy ending,但自己反想到自己挖了個巨坑說世界會終結,不可能打自己嘴巴吧,也不可能讓黑跟著銀到處是殘害人命吧,所以就想了個方法,留下小正太,讓他去完成任務。