第七章 t檢驗與u檢驗
抽樣研究包含參數估計與通過假設檢驗作統計推斷這樣一些重要內容。前者在第六章最後一節中已經涉及,後者如X2檢驗,我們亦已有過接觸。本章將介紹兩均數相比時的假設檢驗。
第一節 t檢驗
一、樣本均數與總體均數的比較
為了判斷觀察到的一組計量數據是否與其總體均數接近,兩者的相差系同一總體中樣本與總體之間的誤差,相差不大;還是已超出抽樣誤差的一般允許範圍而存在顯著差別?應進行假設檢驗,下面通過實例介紹t檢驗的方法步驟。
例7.1 根據大量調查得知,健康成年男子脈搏均數為72次/分,某醫生在某山區隨機抽查健康成年男子25人,其脈搏均數為74.2次/分,標準差為6.5次/分。根據這個資料能否認為某山區健康成年男子的脈搏數與一般健康成年男子的不同?
在醫學領域中有一些公認的生理常數如本例提到的健康成人平均脈搏次數72次/分,一般可看作為總體均數μ。已知在總體均數μ和總體標準差σ已知的情況下可以予測樣本均數分布情況,現缺總體標準差,則需用樣本標準差來估計它,那麼樣本均數圍繞總體均數散布的情況服從t分布(尤其當樣本含量n較小時,)。t分布的基本公式即6.5。
從式中可知,t是樣本均數與總體均數之差(以標準誤為單位),t的絕對值越大也即X距μ越遠。在t分布中距μ越遠的樣本均數分布得越少(所佔百分比小,P值小),後面附表3右上角的示意圖中展示了這種關係,如欲知各自由度下t值與其相應的P值可查附表3。
下面回答本例提出的問題而進行假設檢驗。按一般步驟:
(1)提出檢驗假設H0與備擇假設H1。本例H0為某山區成年男子的脈搏均數與一般成年男子的相等,μ=μ0=72次/分;H1為兩者不相等μ≠μ0,即μ大於或小於μ0(這是雙側檢驗,如果事先已肯定山區人的脈搏不可能低於一般人,只檢驗它是否高於一般人,則應用單側檢驗,H1必為μ>μ)。
(2)定顯著性水準α,並查出臨界t值。α是:若檢驗假設為真但被錯誤地拒絕的概率。現令α=0.05,本例自由度ν=n-1=25-1=24、查附表3得t0.05,24=2.064。若從觀察資料中求出的∣t∣值小於此數,我們就接受H0;若等於或大於此值則在α=0.05水準處拒絕H0而接受H1。
(3)求樣本均數X、標準差S及標準誤Sχ並進而算出檢驗統計量t。現已知X=74.2次/分,S=6.5次/分,只要求出Sχ及t值即可。
(4)下結論:因∣t∣t0.05,24=2.064,所以檢驗假設H0得以接受,從而認為就本資料看,尚不能得出山區健康成年人的脈搏數不同於一般人而具有顯著差別的結論。
二、成對資料樣本均數的比較
上面介紹了已知總體均數時的顯著性檢驗方法,但有時我們並不知道總體均數,且醫學數據資料中更為常見的是成對資料,若一批某病病人治療前有某項測定記錄,治療後再次測定以觀察療效,這樣,觀察n例就有n對數據,這即是成對資料(也可對動物做成病理模型進行治療實驗以收集類似的成對資料);如果有兩種處理要比較,將每一份標本分成兩份各接受一種處理,這樣觀察到的一批數據也是成對資料,醫學科研中有時無法對同一批對象進行前後或對應觀察,而只得將病人(或實驗動物)配成對子,儘量使同對中的兩者在性別、年齡或其它可能會影響處理效果的各種條件方面極為相似,然後分別給以一種不同的處理後觀察反應,這樣獲得的許多對不可拆散的數據同樣是成對資料。由於成對資料可控制個體差異使之較小,故檢驗效率是較高的。
關於成對資料,每對數據始終相聯這是它的特點,我們可以先初步觀察每對數據的差別情況,進一步算出平均相差作為樣本均數,再與假設的總體均數比較看相差是否顯著,下面舉實例說明檢驗過程。
表 7.1 豚鼠注入上腺素前後每分鐘灌流滴數
豚鼠號 每分鐘灌流滴數 用藥前 用藥後 增加數d 1 30 46 16 2 38 50 12 3 48 52 4 4 48 52 4 5 60 58 -2 6 46 64 18 7 26 56 30 8 58 54 -4 9 46 54 8 10 48 58 10 11 44 36 -8 12 46 54 8 總 計 — — 96
例7.2 為了驗證腎上腺素有無降低呼吸道阻力的作用,以豚鼠12隻,進行支氣管灌流實驗,在注入定量腎上腺素前後,測定每分鐘灌流滴數,結果見表7.1,問用藥後灌流速度有無顯著增加?
(1)假設用藥前後灌流滴數相同,則相差的總體均數μ為0;即H0:μ=μ0;H1:μ≠μ0。
(2)令顯著性水準α=0.05,由本例ν=12-1=11查得臨界值t0.05,11=2.201。
(3)求樣本統計量平均相差數d、差數的標準差Sd、標準誤Sd及檢驗統計量t值。
(4)下結論。今∣t∣t0.05,11,p <0.05,故認為檢驗假設μ=μ0難以接受,在α=0.05水準外拒絕HO而接受H1,相差顯著,注入腎上腺素後每分鐘灌流滴數比注射前要多。
例7.3 從以往資料發現,慢性支氣管炎病人血中膽鹼酯酶活性常常偏高。某校藥理教研室將同性別同年齡的病人與健康人配成8對,測量該值加以比較,資料如下。問可否通過這一資料得出較為明確的結論?
表7.2 慢性氣管炎病人與健康人血液膽鹼酯酶活性測定(μM/ml)
對子序號 病人組,X
1健康人組,X
2差數
D=X
1-X
21 3.28 2.36 0.92 2 2.60 2.40 0.20 3 3.32 2.40 0.92 4 2.72 2.52 0.20 5 2.38 3.04 -0.66 6 3.64 2.64 1.00 7 2.98 2.56 0.42 8 4.40 2.40 2.00
(1)檢驗假設H0:μ=μ0;H1:μ>μ0
(2)令α=0.05,得t0.05,7=1.895(單側)
(3)用差數求統計量
(4)結論∣t∣=2.264>t0.05,7=1.895,P<0.05,在α=0.05水準處拒絕H0,接受備擇假設,認為慢性氣管炎病人血中膽鹼酯酶高於正常人。
上例用了單側檢驗是因為事先並不認為該類病人血中膽鹼酯含量會出現低於健康人的情況。
三、兩組資料樣本均數的比較
在日常工作中,我們經常要比較某兩組計量資料的均數間有無顯著差別,如研究不同療法的降壓效果或兩種不同製劑對殺滅鼠體內鉤蟲的效果(條數)等。這時假若事先難以找到年齡、性別等條件完全一樣的人(或動物)作配對比較,那麼不能求每對的差數只能先算出各組的均數,然後進行比較。兩組例數可以相等也可稍有出入。檢驗的方法同樣是先假定兩組相應的總體均數相等,看兩組均數實際相差與此假設是否靠近,近則把相差看成抽樣誤差表現,遠到一定界限則認為由抽樣誤差造成這樣大的相差的可能性實在太小,拒絕假設而接受H1,作出兩總體不相等的結論。
例7.4 為觀察中成藥青黛明礬片對急性黃疸肝炎的退黃效果,以單用輸液保肝的病人作為對照進行了觀察,兩組患者均為成人,黃疸指數在30-50之間,各人退黃天數如下,試比較用藥組(1組)與對照組(2組)退黃天數有無顯著差別。
表7.3 急性黃疸性肝炎病人的退黃天數
中藥組,X
15 10 14 21 17 ∑X
1=67 對照組,X
218 21 30 23 22 22 ∑X
2=136
(1)檢驗假設 設該藥對縮短退黃天數無效,兩組的總體均數相等,即H0=μ1=μ2;H1:μ1≠μ2。
(2)求自由度ν
ν=n1+n2-2
=5+6-2=9 (7.1)
定α=0.05,ν=9時的t值為t0.05,9=2.262
(3)計算各組均數,合併方差S2c及兩均數相差的標準誤Sχ1-χ2,然後求t值。
合併方差:(7.2)
代入得
兩均數相差的標準誤:
(7.3)
代入得
求t:
(7.4)
(4)下結論 因│t┃>t0.05,9,P<0.02,所以我們在α=0.05水準處拒絕H0而接受H1,兩者平均退黃天數和有顯著差別,服青黛明礬片藥的病人退黃天數較短。如果檢驗假設屬實,這樣的結論也還可能下錯,但概率在2%以下。
上例為兩組資料均數間的比較,與前面成對資料的t檢驗有些區別。前者每對中兩數據不能分離,後者任一組中的各數據可以在組內前後互換位置;前者只有一個樣本平均差數d對應於一個假設的總體平均差數μ0,後者,認為X1為第一個總體的隨機樣本均數,X2則來自μ2,所以後者要計算兩組合併的方差S2c(方差是標準差的平方)。再者,與前者相比標準誤、自由度的計算方法也不相同。
例7.5 某人測定半歲至1歲小兒、7至8歲兒童各9人的免疫球蛋白IgG(國際單位/ml),算得平均數與標準差前者(第1組)為55.1± 11.5,後者(第2組)為 95.5 ±17.8,試檢驗這兩種不同年齡的人免疫球蛋白IgG有無顯著差別。
(1)檢驗假設H0:μ1=μ2;H1:μ1≠μ2。
(2)令α=0.01,查自由度ν=9+9-2=16時的臨界值,得t0.01,16=2.921
(3)求統計量 已知X1=55.1,X2=95.5,至於求t值時作為分母的標準誤,在暫缺原始數據時由已知的兩個標準差先推算出合併方差Sc2進而求出Sχ1-χ2即可,方法如下;
①一般方法;根據標準差算式
則
於是
由式(7.2)
由式(7.3)
②在兩組例數相等時也可直接用S1、S2代入下式求Sχ1-χ2,結果一樣。
現已有了均數及標準誤可由X1、X2、Sχ1-χ2求出t值。
(4)結論 │t│>=5.719>t0.01,16=2.921,P<0.001,在α=0.01水準處拒絕H0,接受H1,兩年齡組的人免疫球蛋白IgG的均數相差顯著,7-8歲組的高於小几組。
關於檢驗水準α定在0.05還是0.01或其它處,要看檢驗者事先對結論的可靠性要求之高低而定。本例定α=0.01,要求是較高的,最後查出P值小於0.001就更說明X1-X2=-40.4隨機來自μ1-μ2=0的假設總體的可能性是很小的。