多組比較的非參數檢驗——K-W檢驗

2020-12-06 CDA數據分析師

作者:丁點helper

來源:丁點幫你

前面我們已經講完兩組比較的非參數檢驗,類似t檢驗與方差分析,當比較的數據超過兩組時,我們就需要換一個方法了。

非參數K-W檢驗,相比前文講解的Mann-Whitney 檢驗就是這樣,我們可以把它理解為「非參數檢驗的方差分析」。

K-W檢驗的全稱為,Kruskal-Wallis檢驗,它是用於正態分布條件不滿足情況下,多組獨立樣本方差分析的替代。

案例:

為了解DON(某毒素)對關節的損傷情況,將15隻家兔按體重隨機分為對照組、低劑量組和高劑量組,分別注射生理鹽水、0.05mg/g和0.10mg/g劑量DON毒素進行實驗處理。

實驗期滿後測定關節衝洗液中腫瘤壞死因子(TNF-α)的水平(μg/L),獲得數據見下表10-6。現比較3組家兔關節衝洗液TNF-α測定結果是否具有統計學差異?

做醫學統計相關的研究,經常會碰到上述這種複雜的專業術語,我們要有化繁為簡的能力,仔細看題,我們把「腫瘤壞死因子(TNF-α)」記做「Y」,其實就是一個簡單的單因素類方差分析,比較三組的「Y」是否有差異。

因為這裡樣本量一共只有15(每組5隻家兔),屬於典型的小樣本研究,當樣本例數太小時,很難可靠地判斷數據的正態性,從而無法使用單因素方差分析進行檢驗。

因為非參數檢驗不要求數據的正態性,因此,樣本量較少時,可採用更加穩健的Kruskal-Wallis檢驗進行統計推斷。

簡單而言,Kruskal-Wallis檢驗的基本思想就是用所有觀測值的代替原始觀測值進行單因素方差分析,其檢驗統計量為H值:

SPSS的操作步驟及結果截圖如下:

如上表,P=0.004<0.05,按α=0.05 水準拒絕H0,接受H1,可認為三組家兔關節衝洗液TNF-α測定結果的差異有統計學意義。

相關焦點

  • 非參數檢驗 之 k個相關樣本檢驗
    可有時候所採集的數據常常不能滿足這些條件,像多樣本比較時一樣,我們可嘗試將數據轉化為秩統計量,因為秩統計量的分布與總體分布無關,可以擺脫總體分布的束縛。秩方法在方差分析中的應用。在K個相關樣本中,也有幾個相關因素:  處理-因素:條件,k個構成k個總體。區組—樣本點:每個處理下nj(或N)個樣本點。
  • 方差分析不能用,那就用多組獨立樣本的非參數檢驗
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,兩組比較採用t檢驗,三組及三組以上組間組間比較採用方差分析;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • 手把手教你多組獨立樣本的非參數檢驗及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 基於R語言實現多組獨立樣本的非參數檢驗(Kruskal-Wallis秩和檢驗)及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 多個獨立樣本的非參數檢驗
    多個獨立樣本的非參數檢驗多組定量數據的比較用什麼檢驗方法?
  • 使用非參數統計檢驗進行分析的指南
    問題是沒有人告訴你如何進行像假設檢驗這樣的分析。統計檢驗用於制定決策。為了使用中位數進行分析,我們需要使用非參數檢驗。非參數測試是分布獨立的檢驗,而參數檢驗假設數據是正態分布的。說參數檢驗比非參數檢驗更加的臭名昭著是沒有錯的,但是前者沒有考慮中位數,而後者則使用中位數來進行分析。接下來我們就進入非參數檢驗的內容。
  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    例:有幹預組和對照組,測得兩組的5個指標數據,分析幹預組和對照組的差異。首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。
  • 一篇概全:非參數檢驗思路總結
    非參數檢驗和參數檢驗的對比① 適用範圍:非參數檢驗用作參數檢驗的替代方法,當數據不滿足正態性時,將使用非參數檢驗。因此,關鍵是要弄清楚是否具有正態分布。如果數據大致呈現"鍾型"分布,則可以使用參數檢驗。
  • Kruskal-Wallis檢驗:單因素方差分析的非參數方法
    3組以上數據均值有無差異,通常我們使用單因素方差分析來完成,前提是3組數據分別來自正態分布總體,且方差齊次,對於正態分布來說,可以不用過於嚴苛
  • 非參數檢驗-配對樣本的Wilcoxon符號秩和檢驗
    之前我們學習了單樣本的K-S檢驗常用來檢測數據是否滿足正態分布,並不是單樣本t檢驗的代替方法。
  • 基於SPSS軟體實現多組比較的卡方檢驗及兩兩比較
    再送兩個介紹多組間比較的統計分析:數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。
  • 如何用非參數檢驗,分析多個相關樣本數據?
    不同的方法有不同的要求和側重,因此才出現這麼多的檢驗方法,分別針對不同的應用場景。下面就介紹幾種側重於檢驗多組相關數據的非參數檢驗方法。①Friedman檢驗Friedman檢驗,是研究多相關樣本差異性的方法,屬於非參數檢驗的一種。
  • Stata第五章多組計量資料比較的非參數檢驗命令與輸出結果說明
    本節STATA 命令摘要ranksum觀察變量,by(分組變量)kwallis 觀察變量,by(分組變量)·       秩 和檢驗(Mann,WhitneyandWilcoxon非參數檢驗) 對於計量資料不滿足正態分布要求或方差不齊性,但樣本資料之間是獨立抽取的,則可以應用秩和檢驗方法進行比較兩組資料的中位數是否有差異
  • 非參數中的秩和檢驗到底怎麼做的?
    文章來源: 丁點幫你微信公眾號作者:丁點helper今天,我們開始講非參數檢驗。對於非參數檢驗,大家可能主要是把它和「不符合正態分布」一起記憶的。剛開始學統計的時候,我們都知道:數據符合正態分布就用t檢驗,不符合就用非參數檢驗,更具體點,就是所謂的「秩和檢驗」。
  • r語言卡方檢驗和似然比檢驗_r語言似然比檢驗代碼 - CSDN
    單因素方差分析:多重比較:#各組均值差異的成對檢驗TukeyHSD(fit)#glht()函數提供了更為全面的方法,適用於線性模型和廣義線性模型library(multcomp)tuk <- glht(fit, linfct = mcp(trt = 「Tukey」))plot(cld(tuk, level
  • 卡方檢驗,T檢驗和F檢驗
    它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
  • 檢驗k的方法 - CSDN
    在對數據建模前需要做數據探索,比如做特徵相關性的時候,經常會用到假設檢驗,很多時候我們需要對數據做正態性檢驗,進而通過檢驗結果確定下一步的分析方案。='two_sided', mode='approx', **kwds)對於正態性檢驗,我們只需要手動設置三個參數即可:rvs:待檢驗的一組一維數據cdf:檢驗方法,例如'norm','expon','rayleigh','gamma',這裡我們設置為'norm',即正態性檢驗alternative:默認為雙尾檢驗,可以設置為'less'或'greater
  • 什麼是f檢驗 - CSDN
    方差檢驗是多變量t檢驗的延續,對於超過兩個樣本的對比檢驗就無法直接使用獨立T檢驗了,這個時候就需要使用卡方檢驗。例子:冰淇凌老闆想知道三種口味的冰淇凌的銷售情況是否一樣,他有如下的數據巧克力味草莓味原味233234321233343344等等等F檢驗又叫方差齊性檢驗,目的是判斷兩個樣本的總體方差是否相等,計算雙總體樣本檢驗的前提條件。
  • t檢驗 方差分析 - CSDN
    非參數檢驗是在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。2.非參數檢驗適用類型連結:非參數檢驗來自百度.
  • 實用 | Wilcoxon test非參數檢驗了解下?
    ↑↑點上面藍色小字 | 關注↑↑引言對分組變量的差異顯著性檢驗T-test是最為常用的檢驗方法,但t-test要求數據符合正態分布,在不符合正態分布的時候檢驗準確性要大打折扣。檢驗數據是否符合正態分布的方法可見往期推文「看SPSS如何檢驗數據是否服從正態分布」。如果被檢數據不符合正態分布怎麼辦呢?