第三節 u檢驗和t檢驗

2020-12-10 生物谷

第三節 u檢驗和t檢驗

  u檢驗和t檢驗可用於樣本均數與總體均數的比較以及兩樣本均數的比較。理論上要求樣本來自正態分布總體。但在實用時,只要樣本例數n較大,或n小但總體標準差σ已知時,就可應用u檢驗;n小且總體標準差σ未知時,可應用t檢驗,但要求樣本來自正態分布總體。兩樣本均數比較時還要求兩總體方差相等。

  一、樣本均數與總體均數比較

  比較的目的是推斷樣本所代表的未知總體均數μ與已知總體均數μ0有無差別。通常把理論值、標準值或經大量調查所得的穩定值作為μ0。根據樣本例數n大小和總體標準差σ是否已知選用u檢驗或t 檢驗。

  (一)u檢驗 用於σ已知或σ未知但n足夠大[用樣本標準差s作為σ的估計值,代入式(19.6)]時。

公式(19.6)

  以算得的統計量u,按表19-3所示關係作判斷。

表19-3 u值、P值與統計結論

α |t|值 P值 統計結論 0.05雙側

單側 <1.96

<1.645 >0.05 不拒絕H0,差別無統計學意義 0.05雙側

單側 ≥1.96

≥1.645 ≤0.05 拒絕H0,接受H1,差別有統計學意義 0.01雙側

單側 ≥2.58

≥2.33 ≤0.01 拒絕H0,接受H1,差別有高度統計學意義

  例19.3根據大量調查,已知健康成年男子脈搏均數為72次/分,標準差為6.0次/分。某醫生在山區隨機抽查25名健康成年男子,求得其脈搏均數為74.2次/分,能否據此認為山區成年男子的脈搏高於一般?

  據題意,可把大量調查所得的均數72次/分與標準差6.0次/分看作為總體均數μ0和總體標準差σ,樣本均數x為74.2次/分,樣本例數n為25。

  H0: μ=μ0

  H1: μ>μ0

  α=0.05(單側檢驗)

  算得的統計量u=1.833>1.645,P<0.05,按α=0.05檢驗水準拒絕H0,可認為該山區健康成年男子的脈搏高於一般。

  (二)t檢驗 用於σ未知且n較小時。

            公式(19.7)

  以算得的統計量t,按表19-4所示關係作判斷。

表19-4 |t|值、P值與統計結論

α |t|值 P值 統計結論 0.05 <t0.05(v) <0.05 不拒絕H0,差別無統計學意義 0.05 ≥t0.05(v) ≤0.05 拒絕H0,接受H1,差別有統計學意義 0.01 ≥t0.01(v) ≤0.01 拒絕H0,接受H1,差別有高度統計學意義

  例19.4 若例19.3中總體標準差σ未知,但樣本標準差已求出,s=6.5次/分,餘數據同例19.3。

  據題意,與例19.3不同之處在於σ未知,可用t檢驗。

  H0: μ=μ0

  H1: μ>μ0

  α=0.05(單側檢驗)

  本例自由度v=25-1=24,查t界值表(單側)(附表19-1)得t0.05(24)=1.711。算得的統計量t=1.692<1.711,P>0.05,按α=0.05檢驗水準不拒絕H0,尚不能認為該山區成年男子的脈搏高於一般。

  二、配對資料的比較

  在醫學研究中,常用配對設計。配對設計主要有四種情況:①同一受試對象處理前後的數據;②同一受試對象兩個部位的數據;③同一樣品用兩種方法(儀器等)檢驗的結果;④配對的兩個受試對象分別接受兩種處理後的數據。情況①的目的是推斷其處理有無作用;情況②、③、④的目的是推斷兩種處理(方法等)的結果有無差別。

           公式(19.8)

  式中,0為差數年總體均數,因為假設處理前後或兩法無差別,則其差數的均數應為0,d為一組成對數據之差d(簡稱差數)的均數,其計算公式同式(18.1);Sd為差數均數的標準誤,sd為差數年的標準差,計算公式同式(18.3);n為對子數。

  因計算的統計量是t,按表19-4所示關係作判斷。

  例19.5 應用某藥治療9例高血壓病人,治療前後舒張壓如表19-5,試問用藥前後舒張壓有無變化?

表19-5 高血壓病人用某藥治療前後的舒張壓(kPa)

病人編號 治療前 治療後 差數d D2 1 12.8 11.7 1.0 1.21 2 13.1 13.1 0.0 0.00 3 14.9 14.4 0.5 0.25 4 14.4 13.6 0.8 0.64 5 13.6 13.1 0.5 0.25 6 13.1 13.3 -0.2 0.04 7 13.3 12.8 0.5 0.25 8 14.1 13.6 0.5 0.25 9 13.3 12.3 1.0 1.00 合計     4.7 3.89

  H0:該藥治療前後的舒張壓無變化,即μd=0

  H1:該藥治療前後的舒張壓有變化,即μd≠0

  α=0.05

  自由度v=n-1=8,查t界值表得t0.05(8)=2.306,t0。01(8)=3.355,本例t=3.714>t0.01(8),P<0.01,按α=0.05檢驗水準拒絕H0,接受H1,可認為治療前後舒張壓有變化,即該藥有降壓作用。

  三、完全隨機設計的兩樣本均數的比較

  亦稱成組比較。目的是推斷兩樣本各自代表的總體均數μ1與μ2是否相等。根據樣本含量n的大小,分u檢驗與t檢驗。

  (一)u檢驗 可用於兩樣本含量n1、n2、均足夠大時,如均大於50或100。

  公式(19.9)

  算得的統計量為u 值,按表19-3所示關係作出判斷。

  例19.6某地抽樣調查了部分健康成人紅細胞數,其中男性360人,均數為4.660×1012/L,標準差為0.575×1012/L;女性255人,均數為4.178×1012/L,標準差為0.291×1012/L,試問該地男、女紅細胞數的均數有無差別?

  H0: μ=μ0

  H1: μ≠μ0

  α=0.05

  今x1=4.660×1012/L,s1=0.575×1012/L,n1=360;

  x2=4.1781012/L,s2=0。2911012/L,n2=255.

 

  算得的u=13.63>2.58,P<0.01,按 α=0.05檢驗水準拒絕H0,接受H1,可認為該地男女紅細胞數的均數不同,男性高於女性。

  (二)t檢驗 可用於兩樣本含量n1、n2較小時,且要求兩總體方差相等,即方差齊(homoscedasticity)。若被檢驗的兩樣本方差相差較大且差別有統計學意義則需用t'檢驗。

      公式(19.10)

      公式(19.11)

      公式(19.12)

  式中sx1-x2,為兩樣本均數之差的標準誤,s2c為合併估計方差(combined estimate variance)。算得的統計量為t,按表19-4所示關係作出判斷。

  例19.7某醫生統廣西瑤族和侗族正常婦女骨盆X線測量資料各50例。骨盆入口前後徑:瑤族的均數為12.002(cm),標準差0.948(cm),侗族相應的為11.456(cm)和1.215(cm)。問兩族婦女的骨盆入口前後徑是否有差別?

  H0: μ1=μ2

  H1: μ1≠μ2

  α=0.05

  已知n1=n2=50, x1=12.002(cm),s1=0.948(cm);

  x2=11.456(cm),s2=1.215(cm).

  

  本例自由度v =n1+n2-2=98,查t界值表[表內自由度一欄無98,可用內插法(從略)或用v =100估計]。T0.05(100)=1.948,t0.01(100)=2.626,今t=2.505>t0.05(1000,P<0.05,按α=0.05檢驗水準拒絕H0,接受H1,可認為廣西瑤族和侗族婦女骨盆入口前後徑不同,前者大於後者。

  四、完全隨機設計的兩樣本幾何均數比較

  醫學上有些資料為等比資料或正態分布資料,宜用幾何均數表示其平均水平。比較兩樣本幾何均數的目的是推斷它們分別代表的總體幾何均數是否相等。此種情況下,應先把原始數據X進行對數變換,用變換後的數據代入式(19.10)、(19.11)、(19.12)計算t值。

  例19.8 將20名鉤端螺旋體病人的血清隨機分為兩組,分別用標準株或水生株作凝溶試驗,測得稀釋倍數如下,問兩組的平均效價有無差別?

  X1:標準株(11人)100,200,400,400,400,400,800,1600,1600,1600,3200

  X2:水生珠(9人)100,100,100,200,200,200,200,400,400

  H0: μ1=μ2

  H1: μ1≠μ2

  α=0.05

  將兩組數據分別取對數,以對數作為新變量X1和X2。

  X1:2.000,2.301,2.602,2.602,2.602,2.602,2.903,3.204,3.204,3.204,3.505

  X2: 2.000,2.000,2.000,2.301,2.301,2.301,2.301,2.602,2.602

  用變換後的數據計算 x1,s12;x2,s22再代入式(19.10)、(19.11)、(19.12)計算t值。

  x1=2.794,s12=0.2043;x2=2.268,s22=0.0554

  自由度v=11+9-2=18,查t界值表得t0.01(18)=2.878,今t=3.150>2.878,P<0.01,按α=0.05檢驗水準拒絕H0,接受H1,可認為兩組平均效價不同,標準株高於水生株。

相關焦點

  • 第七章 t檢驗與u檢驗--第一節 t檢驗
    第七章 t檢驗與u檢驗   抽樣研究包含參數估計與通過假設檢驗作統計推斷這樣一些重要內容。前者在第六章最後一節中已經涉及,後者如X2檢驗,我們亦已有過接觸。本章將介紹兩均數相比時的假設檢驗。
  • 第二節 假設檢驗的基本步驟
    第二節 假設檢驗的基本步驟   上述抽樣模擬試驗表明,從同一總體中以固定n隨機抽樣,由於抽樣誤差的影響,樣本均數x與總體均數μ往往不相等,且兩個樣本均數x1和x2也往往不相等。因此在實際工作中遇到樣本均數與總體均數間或樣本均數與樣本均數間不相等時,要考慮兩種可能:①由於抽樣誤差所致;②兩者來自不同總體。如何作出判斷?
  • t檢驗 機器學習_機器學習 t 檢驗 - CSDN
    假設檢驗常見的假設檢驗有:T檢驗(Student’s t Test),F檢驗(方差齊性檢驗),卡方驗證等。特徵X和目標Y的數值類型經常會出現兩類:1. 連續型數值,2. 離散性數值(類別特徵可以編碼成離散型特徵)。特徵X和目標Y在不同數值類型的組合下,應該採用不同的假設檢驗手段去做特徵相關性分析。下圖羅列了特徵X和目標Y在各種數值類型組合時最適合的假設檢驗方法。
  • 卡方檢驗,T檢驗和F檢驗
    t檢驗為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,一般是小樣本,n<30。t檢驗可分為單總體檢驗和雙總體檢驗,以及配對樣本檢驗。這裡主要舉例說明雙總體檢驗(即獨立樣本t檢驗),雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。獨立樣本t檢驗統計量為:
  • 第二十一章 秩和檢驗--第一節 配對資料的比較
    第二十一章 秩和檢驗   提要秩和檢驗是一種非參數統計方法。用於配對資料、兩組資料以及多組資料的比較。   前面討論的u檢驗、t檢驗和方差分析都是假定樣本的數據來自正態或近似正態分布的總體。在實際工作中往往碰到非正態資料或不了解現有的數據來自何種分布。
  • z檢驗和t檢驗 - CSDN
    均值對比的假設檢驗方法主要有 Z 檢驗和 T 檢驗,它們的區別在於 Z 檢驗面向總體數據和大樣本數據,而 T 檢驗適用於小規模抽樣樣本。下面分別介紹 Z 檢驗和 T 檢驗。 Z 檢驗需要事先知道總體方差,另外,如果總體不服從正態分布,那麼樣本量要大於等於 30 ;如果總體服從正態分布,那麼對樣本量沒有要求。
  • 假設檢驗、Z檢驗與T檢驗
    概述假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。
  • t檢驗的目的_單樣本t檢驗的目的 - CSDN
    T檢驗和F檢驗的關係另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。若兩總體方差相等,則直接用t檢驗,若不等,可採用t』檢驗或變量變換或秩和檢驗等方法。 其中要判斷兩總體方差是否相等,就可以用F檢驗。
  • 理解 t 檢驗與 F 檢驗的區別
    F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本結果的機率。統計學結果的意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。
  • 通俗理解T檢驗與F檢驗的區別
    F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本這結果的機率。 2,統計學意義(P值或sig值)結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。
  • 在回歸分析中t檢驗_回歸分析的t檢驗如何做 - CSDN
    (3)t分布(3)F分布三大分布的用途:卡方分布:常用於擬合優度檢驗t分布:       多用於比例的估計和檢驗,用於方差分析,協方差分布和回歸分析t分布:       在信息不足的情況下,只能用t分布,比如在整體方差不知道的情況下,對總體均值的估計和檢驗常用
  • T檢驗與F檢驗,傻傻分不清楚?
    F 值和 t 值就是這些統計檢定值,與它們相對應的概率分布,就是 F 分布和 t 分布。統計顯著性(sig)就是出現目前樣本這結果的機率。 2.  統計學意義(P 值或 sig 值)結果的統計學意義,是結果真實程度(能夠代表總體)的一種估計方法。
  • T檢驗與F檢驗,你分清楚嗎?
    F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是 F分布和t分布。統計顯著性(sig)就是出現目前樣本這結果的機率。 2.  統計學意義(P值或sig值)結果的統計學意義,是結果真實程度(能夠代表總體)的一種估計方法。
  • 不滿足t檢驗應用條件的計量資料,選用的統計分析方法是
    不滿足t檢驗應用條件的計量資料,選用的統計分析方法是A.u檢驗 B.x2檢驗 C.秩和檢驗 D.直線回歸 查看答案解析【正確答案】 C 考點解析:秩和檢驗
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    就是因為要評估兩個總體的方差(Variances)是否相等,要做Levene's Test for Equality of Variances,要檢驗方差,故所以就有F值。另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。
  • 實習十 t檢驗
    實習十 t檢驗   一、目的要求   1.明確t檢驗的意義。   2.學會t檢驗的計算方法,並正確運用假設檢驗對資料進行分析評價。   [是非題]   1.t 檢驗是對兩個樣本不同樣本均數的差別進行假設檢驗的方法之一。( )   2.T檢驗結果t=1.5,可認為兩總體均數送別無意義。( )   3.兩次t檢驗都是對兩個不同樣本均數的差別進行假設檢驗,一次P<0.01,一次0.01<P<0.05,就表明前者兩樣本均數差別大,後者兩樣本均數差別小。
  • matlab t檢驗_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。', 2)title('白酒顯著性檢驗結果','fontsize',14)legend('T檢驗值', 'T(0.05)值', 'T(0.01)值')xlabel('樣品號'), ylabel('T檢驗值')% 顯示平均檢驗結果disp(['兩組品酒師對紅酒的平均顯著性T檢驗值:' num2str(M_AT_R)]);disp(['兩組品酒師對白酒的平均顯著性T檢驗值:' num2str(M_AT_W
  • adf檢驗r語言分析_r語言adf檢驗 - CSDN
    協整檢驗是為了檢驗非平穩序列的因果關係,協整檢驗是解決偽回歸為問題的重要方法。Error t value Pr(>|t|)## (Intercept) -29.32697 1.36716 -21.4 <2e-16 ***## y2 1.44079 0.00752 191.6 <2e-16 ***## Residual standard error
  • r語言 t檢驗 假設 - CSDN
    假設檢驗 -T檢驗 -F檢驗 -卡方檢驗 -正太性檢驗T檢驗2兩樣本的T檢驗 -有原始數據的獨立兩樣本T檢測 -有原始數據的配對T檢測 實例如下: Wage 數據中大學學歷的收入和中學一樣嗎
  • matlab t檢驗值_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。', 2)title('白酒顯著性檢驗結果','fontsize',14)legend('T檢驗值', 'T(0.05)值', 'T(0.01)值')xlabel('樣品號'), ylabel('T檢驗值')% 顯示平均檢驗結果disp(['兩組品酒師對紅酒的平均顯著性T檢驗值:' num2str(M_AT_R)]);disp(['兩組品酒師對白酒的平均顯著性T檢驗值:' num2str(M_AT_W