手把手教你多組獨立樣本的非參數檢驗及兩兩比較

2020-12-03 言爸說育兒

10萬+文章推薦的科研神器,秒殺「谷歌翻譯」。不夠用?再送兩個

介 紹

數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。

我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。

軟體操作

1、導入數據

使用read.delim命令讀取剪貼板上的數據,str命令查看數據的樣本量和變量數及每個變量的類型,head命令查看數據集的前6行。

2、分類變量因子化

使用factor命令把sex、bmig、work和disease因子化,並添加值標籤,使用str命令查看數據類型,使用head命令查看前6行。

3、Kruskal-Wallis秩和檢驗

使用kruskal.test命令進行Kruskal-Wallis秩和檢驗,結果顯示統計量H=12.365,p=0.002<0.05,提示不同BMI組人群的年齡有差異,但具體是哪兩組有差異,還需進一步兩兩比較。

4、Dunn法進行兩兩比較

安裝並調用FSA包,使用dunnTest命令進行Dunn法,實現對不同BMI組人群年齡的兩兩比較,p值校正方法選擇bonferroni法,可以直接看P.adj列,即為校正後的p值,可以與0.05直接比較。

結果顯示Overweight組與Obese組年齡存在差異,統計量Z=3.30,校正後p=0.003<0.05。

註:統計量保留兩位小數,p值保留三位小數。

#install.packages("FSA")library(FSA)

技能拓展

1、如果要發表SCI,統計方法可以描述為:

Differences in characteristics between groups were analyzed using the Kruskal–Wallis test with Dunn post hoc tests (for continuous variables, R package FSA) or χ2 tests with post hoc tests (for categorical variables, R package fifer).

2、我們之前介紹了如何快速生成研究對象基本特徵的Table1(參考《對中文期刊友好的,臨床基線資料table快速生成,不學就OUT了》),非常方便,但遺憾的是,對於多組比較,不能提供進一步兩兩比較的p值。好在,R在實現Kruskal-Wallis秩和檢驗和兩兩比較方面還是比較方便的,在得到結果後,我們可以手動把相應p值標註在Table1上。

精品內容介紹

小白學統計訓練營廣受好評,如果你正在因為不會數據分析而發愁,加入訓練營絕對是一個好的選擇,詳見《第三期小白變統計高手訓練營,開班在即》。

如果你想顯著提升統計分析和作圖效率,可以考慮加入小白學R技能訓練營。

以上兩個訓練營,這兩天都將開班,可聯繫老師諮詢。

相關焦點

  • 基於R語言實現多組獨立樣本的非參數檢驗(Kruskal-Wallis秩和檢驗)及兩兩比較
    ,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 方差分析不能用,那就用多組獨立樣本的非參數檢驗
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,兩組比較採用t檢驗,三組及三組以上組間組間比較採用方差分析;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • 多個獨立樣本的非參數檢驗
    多個獨立樣本的非參數檢驗多組定量數據的比較用什麼檢驗方法?
  • 多組比較的非參數檢驗——K-W檢驗
    作者:丁點helper來源:丁點幫你前面我們已經講完兩組比較的非參數檢驗,類似t檢驗與方差分析,當比較的數據超過兩組時,我們就需要換一個方法了。非參數K-W檢驗,相比前文講解的Mann-Whitney 檢驗就是這樣,我們可以把它理解為「非參數檢驗的方差分析」。K-W檢驗的全稱為,Kruskal-Wallis檢驗,它是用於正態分布條件不滿足情況下,多組獨立樣本方差分析的替代。
  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    例:有幹預組和對照組,測得兩組的5個指標數據,分析幹預組和對照組的差異。首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。
  • 如何用非參數檢驗,分析多個相關樣本數據?
    不同的方法有不同的要求和側重,因此才出現這麼多的檢驗方法,分別針對不同的應用場景。下面就介紹幾種側重於檢驗多組相關數據的非參數檢驗方法。①Friedman檢驗Friedman檢驗,是研究多相關樣本差異性的方法,屬於非參數檢驗的一種。
  • 一篇概全:非參數檢驗思路總結
    何時使用非參數檢驗或許你還沒有理解什麼是參數檢驗、非參數檢驗,但一定曾在無意之中使用過它們。如我們常用的方差分析、T檢驗,都屬於參數檢驗。你可能聽說過,當在使用方差分析時,需要在分析前對數據的正態性和方差齊性進行判斷,如果服從正態性、方差齊性,才可以使用方差分析。
  • 基於SPSS軟體實現多組比較的卡方檢驗及兩兩比較
    再送兩個介紹多組間比較的統計分析:數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。
  • 手把手教你用 GraphPad 做配對樣本 t 檢驗
    今天給大家介紹一下它的統計分析功能——配對樣本(paired)t 檢驗。 配對 t 檢驗中的數據是每行代表一個不同的主題(或一組不同的匹配數據),用行標題進行標記。請注意,與許多統計程序不同,組和主題不是通過將變量分組來定義的。相反,每列定義一個單獨的組,每行代表一個不同的主題。
  • 非參數檢驗-配對樣本的Wilcoxon符號秩和檢驗
    之前我們學習了單樣本的K-S檢驗常用來檢測數據是否滿足正態分布,並不是單樣本t檢驗的代替方法。
  • 非參數檢驗 之 k個相關樣本檢驗
    可有時候所採集的數據常常不能滿足這些條件,像多樣本比較時一樣,我們可嘗試將數據轉化為秩統計量,因為秩統計量的分布與總體分布無關,可以擺脫總體分布的束縛。秩方法在方差分析中的應用。在K個相關樣本中,也有幾個相關因素:  處理-因素:條件,k個構成k個總體。區組—樣本點:每個處理下nj(或N)個樣本點。
  • 使用非參數統計檢驗進行分析的指南
    到目前為止,一切都很好——我相信你已經看到人們早些時候提出了這一點。問題是沒有人告訴你如何進行像假設檢驗這樣的分析。統計檢驗用於制定決策。為了使用中位數進行分析,我們需要使用非參數檢驗。非參數測試是分布獨立的檢驗,而參數檢驗假設數據是正態分布的。說參數檢驗比非參數檢驗更加的臭名昭著是沒有錯的,但是前者沒有考慮中位數,而後者則使用中位數來進行分析。
  • 卡方檢驗和精確概率法及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。
  • 兩個獨立組之間的對比分析(SPSS:獨立樣本T檢驗)
    獨立樣本T檢驗解決的問題:一個自變量(離散變量,水平數=2)對一個因變量(連續變量)的影響。 適用條件:正態性、獨立性、方差齊性。 實驗設計:選取40名初中女生,隨機分為契約學習組、常規教學組。契約學習組採用契約學習法教學;常規教學組採用常規教學法教學。教學時間為2個月。實驗後測試學生體質健康水平,進行組間對比。 自變量:教學方法(1-契約學習法、2-常規教學法)。
  • Kruskal-Wallis檢驗:單因素方差分析的非參數方法
    3組以上數據均值有無差異,通常我們使用單因素方差分析來完成,前提是3組數據分別來自正態分布總體,且方差齊次,對於正態分布來說,可以不用過於嚴苛
  • SPSS科研統計:獨立樣本T檢驗
    兩獨立樣本T檢驗的目的是利用來自兩個總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異。這個檢驗的前提要求是:(1)獨立。
  • 卡方檢驗,T檢驗和F檢驗
    它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
  • 兩獨立樣本的T檢驗
    在前面幾次更新中,小編已經連續推送單樣本T檢驗和配對設計T檢驗,詳情看這裡:單樣本資料的t檢驗(案例篇),配對設計的t檢驗    兩獨立樣本T檢驗是利用來自兩個總體的獨立樣本,去推斷兩個總體的均值是否存在顯著差異。(現實生活中,我們想比較兩個班級之間的成績;比較城市和農村的幸福指數等。)
  • 【SPSS】率的兩兩比較(Bonferroni校正)
    《Bonferroni:Step by Step 攻克兩兩比較》一文談及「Bonferroni提出,若每次檢驗水準為α',共進行m次比較,當H0
  • Stata第五章多組計量資料比較的非參數檢驗命令與輸出結果說明
    本節STATA 命令摘要ranksum觀察變量,by(分組變量)kwallis 觀察變量,by(分組變量)·       秩 和檢驗(Mann,WhitneyandWilcoxon非參數檢驗) 對於計量資料不滿足正態分布要求或方差不齊性,但樣本資料之間是獨立抽取的,則可以應用秩和檢驗方法進行比較兩組資料的中位數是否有差異