第七章 t檢驗與u檢驗--第一節 t檢驗

2021-01-08 生物谷

第七章 t檢驗與u檢驗

  抽樣研究包含參數估計與通過假設檢驗作統計推斷這樣一些重要內容。前者在第六章最後一節中已經涉及,後者如X2檢驗,我們亦已有過接觸。本章將介紹兩均數相比時的假設檢驗。

第一節 t檢驗

  一、樣本均數與總體均數的比較

  為了判斷觀察到的一組計量數據是否與其總體均數接近,兩者的相差系同一總體中樣本與總體之間的誤差,相差不大;還是已超出抽樣誤差的一般允許範圍而存在顯著差別?應進行假設檢驗,下面通過實例介紹t檢驗的方法步驟。

  例7.1 根據大量調查得知,健康成年男子脈搏均數為72次/分,某醫生在某山區隨機抽查健康成年男子25人,其脈搏均數為74.2次/分,標準差為6.5次/分。根據這個資料能否認為某山區健康成年男子的脈搏數與一般健康成年男子的不同?

  在醫學領域中有一些公認的生理常數如本例提到的健康成人平均脈搏次數72次/分,一般可看作為總體均數μ。已知在總體均數μ和總體標準差σ已知的情況下可以予測樣本均數分布情況,現缺總體標準差,則需用樣本標準差來估計它,那麼樣本均數圍繞總體均數散布的情況服從t分布(尤其當樣本含量n較小時,)。t分布的基本公式即6.5。

  從式中可知,t是樣本均數與總體均數之差(以標準誤為單位),t的絕對值越大也即X距μ越遠。在t分布中距μ越遠的樣本均數分布得越少(所佔百分比小,P值小),後面附表3右上角的示意圖中展示了這種關係,如欲知各自由度下t值與其相應的P值可查附表3。

  下面回答本例提出的問題而進行假設檢驗。按一般步驟:

  (1)提出檢驗假設H0與備擇假設H1。本例H0為某山區成年男子的脈搏均數與一般成年男子的相等,μ=μ0=72次/分;H1為兩者不相等μ≠μ0,即μ大於或小於μ0(這是雙側檢驗,如果事先已肯定山區人的脈搏不可能低於一般人,只檢驗它是否高於一般人,則應用單側檢驗,H1必為μ>μ)。

  (2)定顯著性水準α,並查出臨界t值。α是:若檢驗假設為真但被錯誤地拒絕的概率。現令α=0.05,本例自由度ν=n-1=25-1=24、查附表3得t0.05,24=2.064。若從觀察資料中求出的∣t∣值小於此數,我們就接受H0;若等於或大於此值則在α=0.05水準處拒絕H0而接受H1。

  (3)求樣本均數X、標準差S及標準誤Sχ並進而算出檢驗統計量t。現已知X=74.2次/分,S=6.5次/分,只要求出Sχ及t值即可。 

  (4)下結論:因∣t∣t0.05,24=2.064,所以檢驗假設H0得以接受,從而認為就本資料看,尚不能得出山區健康成年人的脈搏數不同於一般人而具有顯著差別的結論。

  二、成對資料樣本均數的比較

  上面介紹了已知總體均數時的顯著性檢驗方法,但有時我們並不知道總體均數,且醫學數據資料中更為常見的是成對資料,若一批某病病人治療前有某項測定記錄,治療後再次測定以觀察療效,這樣,觀察n例就有n對數據,這即是成對資料(也可對動物做成病理模型進行治療實驗以收集類似的成對資料);如果有兩種處理要比較,將每一份標本分成兩份各接受一種處理,這樣觀察到的一批數據也是成對資料,醫學科研中有時無法對同一批對象進行前後或對應觀察,而只得將病人(或實驗動物)配成對子,儘量使同對中的兩者在性別、年齡或其它可能會影響處理效果的各種條件方面極為相似,然後分別給以一種不同的處理後觀察反應,這樣獲得的許多對不可拆散的數據同樣是成對資料。由於成對資料可控制個體差異使之較小,故檢驗效率是較高的。

  關於成對資料,每對數據始終相聯這是它的特點,我們可以先初步觀察每對數據的差別情況,進一步算出平均相差作為樣本均數,再與假設的總體均數比較看相差是否顯著,下面舉實例說明檢驗過程。

表 7.1 豚鼠注入上腺素前後每分鐘灌流滴數

豚鼠號 每分鐘灌流滴數 用藥前 用藥後 增加數d 1 30 46 16 2 38 50 12 3 48 52 4 4 48 52 4 5 60 58 -2 6 46 64 18 7 26 56 30 8 58 54 -4 9 46 54 8 10 48 58 10 11 44 36 -8 12 46 54 8 總 計 — — 96

  例7.2 為了驗證腎上腺素有無降低呼吸道阻力的作用,以豚鼠12隻,進行支氣管灌流實驗,在注入定量腎上腺素前後,測定每分鐘灌流滴數,結果見表7.1,問用藥後灌流速度有無顯著增加?

  (1)假設用藥前後灌流滴數相同,則相差的總體均數μ為0;即H0:μ=μ0;H1:μ≠μ0。

  (2)令顯著性水準α=0.05,由本例ν=12-1=11查得臨界值t0.05,11=2.201。

  (3)求樣本統計量平均相差數d、差數的標準差Sd、標準誤Sd及檢驗統計量t值。

  

  (4)下結論。今∣t∣t0.05,11,p <0.05,故認為檢驗假設μ=μ0難以接受,在α=0.05水準外拒絕HO而接受H1,相差顯著,注入腎上腺素後每分鐘灌流滴數比注射前要多。

  例7.3 從以往資料發現,慢性支氣管炎病人血中膽鹼酯酶活性常常偏高。某校藥理教研室將同性別同年齡的病人與健康人配成8對,測量該值加以比較,資料如下。問可否通過這一資料得出較為明確的結論?

表7.2 慢性氣管炎病人與健康人血液膽鹼酯酶活性測定(μM/ml)

對子序號 病人組,X

1

健康人組,X

2

差數

D=X

1

-X

2

1 3.28 2.36 0.92 2 2.60 2.40 0.20 3 3.32 2.40 0.92 4 2.72 2.52 0.20 5 2.38 3.04 -0.66 6 3.64 2.64 1.00 7 2.98 2.56 0.42 8 4.40 2.40 2.00

  (1)檢驗假設H0:μ=μ0;H1:μ>μ0

  (2)令α=0.05,得t0.05,7=1.895(單側)

  (3)用差數求統計量

  (4)結論∣t∣=2.264>t0.05,7=1.895,P<0.05,在α=0.05水準處拒絕H0,接受備擇假設,認為慢性氣管炎病人血中膽鹼酯酶高於正常人。

  上例用了單側檢驗是因為事先並不認為該類病人血中膽鹼酯含量會出現低於健康人的情況。

  三、兩組資料樣本均數的比較

  在日常工作中,我們經常要比較某兩組計量資料的均數間有無顯著差別,如研究不同療法的降壓效果或兩種不同製劑對殺滅鼠體內鉤蟲的效果(條數)等。這時假若事先難以找到年齡、性別等條件完全一樣的人(或動物)作配對比較,那麼不能求每對的差數只能先算出各組的均數,然後進行比較。兩組例數可以相等也可稍有出入。檢驗的方法同樣是先假定兩組相應的總體均數相等,看兩組均數實際相差與此假設是否靠近,近則把相差看成抽樣誤差表現,遠到一定界限則認為由抽樣誤差造成這樣大的相差的可能性實在太小,拒絕假設而接受H1,作出兩總體不相等的結論。

  例7.4 為觀察中成藥青黛明礬片對急性黃疸肝炎的退黃效果,以單用輸液保肝的病人作為對照進行了觀察,兩組患者均為成人,黃疸指數在30-50之間,各人退黃天數如下,試比較用藥組(1組)與對照組(2組)退黃天數有無顯著差別。

表7.3 急性黃疸性肝炎病人的退黃天數

中藥組,X

1

5 10 14 21 17   ∑X

1

=67 對照組,X

2

18 21 30 23 22 22 ∑X

2

=136

  (1)檢驗假設 設該藥對縮短退黃天數無效,兩組的總體均數相等,即H0=μ1=μ2;H1:μ1≠μ2。

  (2)求自由度ν

  ν=n1+n2-2

   =5+6-2=9  (7.1)

  定α=0.05,ν=9時的t值為t0.05,9=2.262

  (3)計算各組均數,合併方差S2c及兩均數相差的標準誤Sχ1-χ2,然後求t值。

  合併方差:(7.2)

  代入得

  兩均數相差的標準誤: 

   (7.3) 

  代入得

  求t:

(7.4) 

  (4)下結論 因│t┃>t0.05,9,P<0.02,所以我們在α=0.05水準處拒絕H0而接受H1,兩者平均退黃天數和有顯著差別,服青黛明礬片藥的病人退黃天數較短。如果檢驗假設屬實,這樣的結論也還可能下錯,但概率在2%以下。

  上例為兩組資料均數間的比較,與前面成對資料的t檢驗有些區別。前者每對中兩數據不能分離,後者任一組中的各數據可以在組內前後互換位置;前者只有一個樣本平均差數d對應於一個假設的總體平均差數μ0,後者,認為X1為第一個總體的隨機樣本均數,X2則來自μ2,所以後者要計算兩組合併的方差S2c(方差是標準差的平方)。再者,與前者相比標準誤、自由度的計算方法也不相同。

  例7.5 某人測定半歲至1歲小兒、7至8歲兒童各9人的免疫球蛋白IgG(國際單位/ml),算得平均數與標準差前者(第1組)為55.1± 11.5,後者(第2組)為 95.5 ±17.8,試檢驗這兩種不同年齡的人免疫球蛋白IgG有無顯著差別。

  (1)檢驗假設H0:μ1=μ2;H1:μ1≠μ2。

  (2)令α=0.01,查自由度ν=9+9-2=16時的臨界值,得t0.01,16=2.921

  (3)求統計量 已知X1=55.1,X2=95.5,至於求t值時作為分母的標準誤,在暫缺原始數據時由已知的兩個標準差先推算出合併方差Sc2進而求出Sχ1-χ2即可,方法如下;

  ①一般方法;根據標準差算式 

  則 

  於是

  由式(7.2)

    

  由式(7.3)

  

  ②在兩組例數相等時也可直接用S1、S2代入下式求Sχ1-χ2,結果一樣。

  

  現已有了均數及標準誤可由X1、X2、Sχ1-χ2求出t值。

  

  (4)結論 │t│>=5.719>t0.01,16=2.921,P<0.001,在α=0.01水準處拒絕H0,接受H1,兩年齡組的人免疫球蛋白IgG的均數相差顯著,7-8歲組的高於小几組。

  關於檢驗水準α定在0.05還是0.01或其它處,要看檢驗者事先對結論的可靠性要求之高低而定。本例定α=0.01,要求是較高的,最後查出P值小於0.001就更說明X1-X2=-40.4隨機來自μ1-μ2=0的假設總體的可能性是很小的。

相關焦點

  • 第三節 u檢驗和t檢驗
    第三節 u檢驗和t檢驗   u檢驗和t檢驗可用於樣本均數與總體均數的比較以及兩樣本均數的比較。理論上要求樣本來自正態分布總體。但在實用時,只要樣本例數n較大,或n小但總體標準差σ已知時,就可應用u檢驗;n小且總體標準差σ未知時,可應用t檢驗,但要求樣本來自正態分布總體。
  • 假設檢驗、Z檢驗與T檢驗
    單樣本t檢驗雙樣本t檢驗Z檢驗和t檢驗的決定案例研究:Python冠狀病毒的假設檢驗假設檢驗基礎讓我們舉一個例子來理解假設檢驗的概念。一個人因刑事犯罪正在接受審判,法官需要對他的案件作出判決。現在,在這種情況下有四種可能的組合:第一種情況:此人是無辜的,法官認定此人是無辜的第二種情況:此人無罪,法官認定此人有罪第三種情況:此人有罪,法官認定此人無罪第四種情況:此人有罪,法官認定此人有罪正如你可以清楚地看到的
  • 第二十一章 秩和檢驗--第一節 配對資料的比較
    第二十一章 秩和檢驗   提要秩和檢驗是一種非參數統計方法。用於配對資料、兩組資料以及多組資料的比較。   前面討論的u檢驗、t檢驗和方差分析都是假定樣本的數據來自正態或近似正態分布的總體。在實際工作中往往碰到非正態資料或不了解現有的數據來自何種分布。
  • t檢驗 機器學習_機器學習 t 檢驗 - CSDN
    假設檢驗常見的假設檢驗有:T檢驗(Student’s t Test),F檢驗(方差齊性檢驗),卡方驗證等。為了應用方便,常將一般的正態變量X通過u變換[(X-μ)/σ]轉化成標準正態變量u,以使原來各種形態的正態分布都轉換為μ=0,σ=1的標準正態分布(standard normaldistribution),亦稱u分布。根據中心極限定理,通過抽樣模擬試驗表明,在正態分布總體中以固定 n 抽取若干個樣本時,樣本均數的分布仍服從正態分布,即N(μ,σ)。
  • t檢驗的目的_單樣本t檢驗的目的 - CSDN
    為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。在t-test for Equality of Means中,第一排(Variances=Equal)的情況:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99 既然
  • 理解 t 檢驗與 F 檢驗的區別
    它主要用於:均數差別的顯著性檢驗、分離各有關因素並估計其對總變異的作用、分析因素間的交互作用、方差齊性(Equality of Variances)檢驗等情況。t檢驗過程,是對兩樣本均數(mean)差別的顯著性進行檢驗。惟t檢驗須知道兩個總體的方差(Variances)是否相等;t檢驗值的計算會因方差是否相等而有所不同。
  • 卡方檢驗,T檢驗和F檢驗
    t檢驗為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,一般是小樣本,n<30。t檢驗可分為單總體檢驗和雙總體檢驗,以及配對樣本檢驗。這裡主要舉例說明雙總體檢驗(即獨立樣本t檢驗),雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。獨立樣本t檢驗統計量為:
  • 通俗理解T檢驗與F檢驗的區別
    在Levene's Test for Equality of Variances一欄中 F值為2.36, Sig.為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。 2.
  • T檢驗與F檢驗,你分清楚嗎?
    為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。2.在t-test for Equality of Means中,第一排(Variances=Equal)的情況:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99既然Sig=.000,亦即,兩樣本均數差別有顯著性意義!3.
  • T檢驗與F檢驗,傻傻分不清楚?
    為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面 t 檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。2.  在t-test for Equality of Means中,第一排(Variances=Equal)的情況:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99既然Sig=.000,亦即,兩樣本均數差別有顯著性意義!3.
  • z檢驗和t檢驗 - CSDN
    T 檢驗T 檢驗,亦稱 student t 檢驗(Student's t test),主要用於樣本含量較小(例如 n < 30),總體標準差 σ 未知的正態分布資料。T 檢驗是用 T 分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。
  • matlab t檢驗_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。', 2)title('白酒顯著性檢驗結果','fontsize',14)legend('T檢驗值', 'T(0.05)值', 'T(0.01)值')xlabel('樣品號'), ylabel('T檢驗值')% 顯示平均檢驗結果disp(['兩組品酒師對紅酒的平均顯著性T檢驗值:' num2str(M_AT_R)]);disp(['兩組品酒師對白酒的平均顯著性T檢驗值:' num2str(M_AT_W
  • matlab t檢驗值_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。', 2)title('白酒顯著性檢驗結果','fontsize',14)legend('T檢驗值', 'T(0.05)值', 'T(0.01)值')xlabel('樣品號'), ylabel('T檢驗值')% 顯示平均檢驗結果disp(['兩組品酒師對紅酒的平均顯著性T檢驗值:' num2str(M_AT_R)]);disp(['兩組品酒師對白酒的平均顯著性T檢驗值:' num2str(M_AT_W
  • 實習十 t檢驗
    實習十 t檢驗   一、目的要求   1.明確t檢驗的意義。   2.學會t檢驗的計算方法,並正確運用假設檢驗對資料進行分析評價。   [是非題]   1.t 檢驗是對兩個樣本不同樣本均數的差別進行假設檢驗的方法之一。( )   2.T檢驗結果t=1.5,可認為兩總體均數送別無意義。( )   3.兩次t檢驗都是對兩個不同樣本均數的差別進行假設檢驗,一次P<0.01,一次0.01<P<0.05,就表明前者兩樣本均數差別大,後者兩樣本均數差別小。
  • 第二節 假設檢驗的基本步驟
    第二節 假設檢驗的基本步驟   上述抽樣模擬試驗表明,從同一總體中以固定n隨機抽樣,由於抽樣誤差的影響,樣本均數x與總體均數μ往往不相等,且兩個樣本均數x1和x2也往往不相等。因此在實際工作中遇到樣本均數與總體均數間或樣本均數與樣本均數間不相等時,要考慮兩種可能:①由於抽樣誤差所致;②兩者來自不同總體。如何作出判斷?
  • 線性回歸方程的顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第8章,顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗。上一章,我講述了回歸方程的精度,在回歸分析中,我們求出回歸方程後,除了確認回歸方程的精度外,我們要需要對回歸方程進行顯著性驗證,以確認回歸方程的有效性。本章,我同樣分如下三個小節對顯著性驗證進行講解,歡迎閱讀與探討。我的《線性回歸分析》專欄總目錄見下圖。1、什麼是顯著性驗證?
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    1 在Levene's Test for Equality of Variances一欄中 F值為2.36, Sig.為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。
  • t檢驗中t值的意義 - CSDN
    參數檢驗在下文中,我們給出了兩個樣本,它們可以來自相同或不同的分布,我們想檢驗這些樣本是否具有相同的統計特性:比較均值t檢驗t檢驗適用於:正態分布、方差具有齊性的兩組間小樣本比較;對於大樣本不滿足正態分布的數據而言t-檢驗還是相當精確有效的手段。檢驗:兩個平均數的差異是否顯著。
  • 回歸分析t檢驗公式_線性回歸t檢驗公式 - CSDN
    ++++++++++++++++++++++參考眾多文章++++++++++++++++++++++第一:假設檢驗以拋硬幣來說H0 假設【假設】:硬幣是公平【出現正反概率各為
  • 在回歸分析中t檢驗_回歸分析的t檢驗如何做 - CSDN
    (3)t分布(3)F分布三大分布的用途:卡方分布:常用於擬合優度檢驗t分布:       多用於比例的估計和檢驗,用於方差分析,協方差分布和回歸分析t分布:       在信息不足的情況下,只能用t分布,比如在整體方差不知道的情況下,對總體均值的估計和檢驗常用