兩組均數的95%CI重疊,t檢驗的P值一定大於0.05嗎?

2021-02-15 醫咖會

經常有小朋友問我:區間估計的95%可信區間(95%CI)和假設檢驗的P值是等價的嗎?更具體的問法是:兩組均數的95%CI重疊,t檢驗的P值一定大於0.05嗎?

答案是:不一定。如果兩組均數的95%CI不重疊,t檢驗的P值一定小於0.05;但如果兩組均數的95%CI重疊,t檢驗的P值可能大於0.05,也可能小於0.05。

這是為什麼呢?

由於t檢驗需要考慮方差齊性的問題,計算公式比較複雜,且當n足夠大時,t分布趨近標準正態分布。我們這裡以符合標準正態分布的Z檢驗來解釋上述問題(如果使用t檢驗的公式,會比較複雜,但結果類似)。

我們假設兩個樣本,N1=64,N2=81,其它參數如下表。

可以看到樣本1的均數的95%CI為(62.4,97.6),樣本2的均數95%CI為(90.4,129.6),兩個95%CI重疊。

95%可信區間的估計公式是Mean±1.96*Se。則對於兩個樣本(假設樣本1的均數較小),判斷95%CI是否重疊,則需要判斷樣本1的95%CI上限是否大於樣本2的95%CI下限,等價於判斷Mean1+1.96*Se1-(Mean2-1.96*Se2) > 0 是否成立。即Mean2-Mean1<1.96*(Se1+Se2)時,95%CI重疊。

實際上,上述的1.96,是標準正態分布Z0.05/2對應的界值,對應t分布自由度為無窮大的界值。如果使用t/t'檢驗,由於單個樣本區間估計和兩樣本t/t'檢驗時自由度不同,檢驗界值會略有不同,情況比較複雜。

但結論是一樣的,即:如果兩組均數的95%CI不重疊,t檢驗的P值一定小於0.05;但如果兩組均數的95%CI重疊,t檢驗的P值可能大於0.05,也可能小於0.05

醫咖會面向醫生個人、醫院/單位、企業提供各種科研服務,包括研究設計、統計分析、EDC系統、科研培訓等,詳情查看:醫咖會可為你提供這些科研服務,助你解決各種科研難題!。快加小咖微信(xys2019ykh)或掃描以下二維碼加小咖微信諮詢吧。

相關焦點

  • f檢驗的p值大於 - CSDN
    p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成 的。即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。(這並不是 說如果變量間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變量存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯 是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成 的。即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。
  • 第七章 t檢驗與u檢驗--第一節 t檢驗
    本例H0為某山區成年男子的脈搏均數與一般成年男子的相等,μ=μ0=72次/分;H1為兩者不相等μ≠μ0,即μ大於或小於μ0(這是雙側檢驗,如果事先已肯定山區人的脈搏不可能低於一般人,只檢驗它是否高於一般人,則應用單側檢驗,H1必為μ>μ)。   (2)定顯著性水準α,並查出臨界t值。α是:若檢驗假設為真但被錯誤地拒絕的概率。
  • T檢驗與F檢驗,你分清楚嗎?
    專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是 總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如 p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。
  • f檢驗求p值 - CSDN
    p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成 的。即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。(這並不是 說如果變量間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變量存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)
  • 理解 t 檢驗與 F 檢驗的區別
    意即通常情況下,p值越小,對我們的假設越有利。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。
  • r語言 t檢驗 假設 - CSDN
    假設檢驗 -T檢驗 -F檢驗 -卡方檢驗 -正太性檢驗T檢驗2兩樣本的T檢驗 -有原始數據的獨立兩樣本T檢測 -有原始數據的配對T檢測 實例如下: Wage 數據中大學學歷的收入和中學一樣嗎
  • 統計︱P值-0.05就發表,不然就去死!
    Fisher的具體做法是:2.選擇一個檢驗統計量(例如z 統計量或Z 統計量) ,該統計量的分布在假定的參數取值為真時應該是完全已知的。3.從研究總體中抽取一個隨機樣本4計算檢驗統計量的值5計算概率P值或者說觀測的顯著水平,即在假設為真時的前提下,檢驗統計量大於或等於實際觀測值的概率。.如果P<0.01,說明是較強的判定結果,拒絕假定的參數取值。
  • t檢驗的目的_單樣本t檢驗的目的 - CSDN
    p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。(這並不是說如果變量間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變量存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。
  • 兩樣本t檢驗原理與R語言實現
    (4)看t檢驗的p值,判斷兩樣本均值有無顯著差異(是否接收原假設)。Shapiro-Wilk normality test ## ## data: y ## W = 0.95748, p-value = 0.6486可以看出,x、y的p值都大於0.1,不能拒絕x、y都來自正態總體的假設(顯著性水平0.1)。
  • 樣本量n>30時,還能繼續使用T檢驗嗎?
    專業上,p 值為結果可信程度的一個遞減指標,p 值越大,我們越不能認為樣本中變量的關聯是 總體中各變量關聯的可靠指標。p 值是將觀察結果認為有效即具有總體代表性的犯錯概率。如 p=0.05 提示樣本中變量關聯有 5% 的可能是由於偶然性造成的。
  • T檢驗與F檢驗,傻傻分不清楚?
    專業上,p 值為結果可信程度的一個遞減指標,p 值越大,我們越不能認為樣本中變量的關聯是 總體中各變量關聯的可靠指標。p 值是將觀察結果認為有效即具有總體代表性的犯錯概率。如 p=0.05 提示樣本中變量關聯有 5% 的可能是由於偶然性造成的。 即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約 20 個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。
  • matlab t檢驗值_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。','fontsize',14)legend('T檢驗值', 'T(0.05)值', 'T(0.01)值')xlabel('樣品號'), ylabel('T檢驗值')% 白酒結果for i=1:K2 Ta2(i)=a; Tb2(i)=b;endt2=1:K2;subplot(2,1,2);plot(t2,AT_W,'*k-',t2,Ta2,'r-',t2,Tb2,'-.b', 'LineWidth
  • matlab t檢驗_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。','fontsize',14)legend('T檢驗值', 'T(0.05)值', 'T(0.01)值')xlabel('樣品號'), ylabel('T檢驗值')% 白酒結果for i=1:K2 Ta2(i)=a; Tb2(i)=b;endt2=1:K2;subplot(2,1,2);plot(t2,AT_W,'*k-',t2,Ta2,'r-',t2,Tb2,'-.b', 'LineWidth
  • 通俗理解T檢驗與F檢驗的區別
    專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。即假設總體中任意變量間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。
  • t檢驗中t值的意義 - CSDN
    顯著性檢驗是針對我們對總體所做的假設做檢驗,其原理就是「小概率事件實際不可能性原理」來接受或否定假設。下文簡述各種差異性檢驗思想(兩組樣本差異),同時結合scipy.stats文檔中的描述進行python實踐。
  • OMG:我直接用t檢驗,竟然被拒稿了?
    01為什麼不能直接用t檢驗?辛辛苦苦收集數據寫文章,如果因為錯誤的統計方法,而被拒稿,豈不太冤了?可能有人會問:統計有那麼重要嗎?我拿來數據直接用t檢驗分析,多簡單暢快了,怎麼還被拒稿了?對於非正態的數據,t檢驗可能得出錯誤結果,這時候就需要非參數檢驗;但對於正態數據,非參數檢驗效能比較低,所以又要用t檢驗。至於選擇用t檢驗,還是非參數檢驗,確定數據是否是正態分布,就變得很關鍵。下面我們一起看一下如果通過SPSS實現簡單快速的正態性檢驗。02如何進行正態性檢驗?
  • 第三節 u檢驗和t檢驗
    (一)u檢驗 可用於兩樣本含量n1、n2、均足夠大時,如均大於50或100。   公式(19.9)   算得的統計量為u 值,按表19-3所示關係作出判斷。     算得的u=13.63>2.58,P<0.01,按 α=0.05檢驗水準拒絕H0,接受H1,可認為該地男女紅細胞數的均數不同,男性高於女性。   (二)t檢驗 可用於兩樣本含量n1、n2較小時,且要求兩總體方差相等,即方差齊(homoscedasticity)。
  • 回歸分析t檢驗公式_線性回歸t檢驗公式 - CSDN
    b、查詢二項分布表,單側p值【8,9,10】            p(8/9/10)=0.05      這個結果怎麼解讀?      在H0假設條件下【硬幣公平的】,拋出8次正面及更極端的情況的單側p值是0.05,如果顯著水平0.05,那麼我們拒絕改H0假設,而認為硬幣是有問題的。1.2   既然拋了8次正面,為啥還有加上9次正面,10次正面,這兩個更極端的的概率?
  • r語言兩樣本檢驗 - CSDN
    =σ2^2時,可以用以下統計量近似t統計量:1.5 步驟(1)檢驗觀測是否來自正態總體(2)檢驗方差是否相等(3)如果(1)、(2)都滿足,則計算t統計量和p值。(4)看t檢驗的p值,判斷兩樣本均值有無顯著差異(是否接收原假設)。