第二十一章 秩和檢驗
提要秩和檢驗是一種非參數統計方法。用於配對資料、兩組資料以及多組資料的比較。
前面討論的u檢驗、t檢驗和方差分析都是假定樣本的數據來自正態或近似正態分布的總體。在實際工作中往往碰到非正態資料或不了解現有的數據來自何種分布。秩和檢驗(rand sum test)是一種非參數統計(nonparametric statistics)方法。此法可用於多種總體分布或分布不明確的情況,因此適用範圍廣。缺點是沒有充分利用資料所提供的信息,當資料適用參數統計卻用了非參數法處理時,常損失部分信息,降低檢驗效率。
第一節 配對資料的比較
一、符號檢驗(sign test)
此法主要用於配對資料的比較,現以表21-1資料為例介紹其方法步驟。
例21.112名太空人行前及返航後24小時的心率變化如表21-1所示,試問航行對心率有無影響?
表21-1太空人航行前後的心率(次/分)及符號檢驗計算表
太空人編號(1) 航前(2) 航後(3) (2)-(3)差數的符號(4) 1 76 93 - 2 71 68 + 3 70 65 + 4 61 65 - 5 80 93 - 6 59 78 - 7 74 83 - 8 62 79 - 9 79 98 - 10 72 78 - 11 84 90 - 12 63 60 +
(一)建立檢驗假設
H0:宇航對心率無影響,即差值的「正」、「負」號個數相等
H1:宇航對心率有影響,即差值的「正」、「負」號個數不等
α=0.05
(二)將各對數據中,航前大於航後者記為「+」,航前小於航後者記為「-」,航前等於航後者記為「0」,列於表21-1第(4)欄。
(三)分別數出「+」「-」號的個數,並以「+」號的個數作為a,「-」號的個數作為b ,代入式(21.1)
公式(21.1)
本例a=3,b=9
v=1,x20..05(1)=3.84,今x2=2.083<3.84,P>0.05,按α=0.05檢驗水準不拒絕H0,因此尚不能認為宇航對心率有影響。
二、符號秩和檢驗(Wilcoxon法)
符號等級檢驗(signed rank test)是上述方法的改進,是在觀察「+」「-」號個數的基礎上亦考慮差值的大小,通過對差值偏秩求和進行檢驗的,故效果較好。仍以例21,1介紹其方法步驟。
表21-1太空人航行前後的心率(次/分)比較
太空人號(1) 航前(2) 航後(3) 差值(4)=(2)-(3) 秩次 +(5) -(6) 1 76 93 -17 9 2 71 68 3 1 3 70 65 5 4 4 61 65 -4 3 5 80 93 -13 8 6 59 78 -19 11 7 74 83 -9 7 8 62 79 -17 10 9 79 98 -19 12 10 72 78 -6 5 11 84 90 -6 6 12 63 60 3 2 合計 7 71
(一)建立假設
H0:宇航對心率無影響,即差值的總體中位數M=0
H1:宇航對心率有影響,即差值的總體中位數M≠0
α=0.05
(二)求各對數值的差數如表21-2第(4)欄
(三)編秩按差值的絕對值由小到大編秩,將秩次按差值的正負分兩欄,如表21-2第(5)、(6)欄。注意:編秩時,遇有幾個絕對值相等、符號相反的差值時,各取平均秩次;符號相同的相等差數,可不必取平均秩次;遇有差值為0的,則棄去不計,隨之從相應的對子數n中減去。
(四)確定統計量t 分別求正負秩次之和,以絕對值較小者為統計量T,如表21-2第(5)、(6)兩欄的合計。本例T=7。
(五)確定P值,作出推論
1.查表法用於對子數n≤25時,根據對子數n查附表21-1符號秩和檢驗臨界值表。若現有統計量T值大於表中相應的界值T0.05,則P>0.05;若現有統計量小於或等於表中相應的T0.05,則P≤0.05。本例對子數n=12,查表得T0.01=7,本例T=7,故P=0.01,按α=0.05檢驗水準拒絕H0,可認為宇航對心率有影響,使心率增快。由此看出符號秩和檢驗比符號檢驗效率高。
2.正態近似法對子數n>25時,按式(21.2)計算統計u值。
公式(21.2)
因統計量為u值,按表19-3所示關係作出判斷。