實用 | Wilcoxon test非參數檢驗了解下?

2021-03-02 微生物生態

↑↑點上面藍色小字 | 關注↑↑

引言

對分組變量的差異顯著性檢驗是微生物生態數據分析中常見的內容。T-test是最為常用的檢驗方法,但t-test要求數據符合正態分布,在不符合正態分布的時候檢驗準確性要大打折扣。檢驗數據是否符合正態分布的方法可見往期推文「看SPSS如何檢驗數據是否服從正態分布」。如果被檢數據不符合正態分布怎麼辦呢?

什麼是Wilcoxon test?

今天向大家介紹一種非參數檢驗——Wilcoxon test。Wilcoxon test無需數據服從正態分布,適合在數據總體方差未知或知道甚少的情況下使用。相應的缺點是,在數據符合正態分布的情況下,檢驗的準確性要比t-test低。下面介紹如何在R中實現Wilcoxon test。

用法

Wilcoxon test使用方法和t-test類似,在R中輸入『?wilcox.test()』即可查看使用方法。如下:

舉兩個例子

若要計算兩種處理(x和y)的效果差異是否顯著(獨立樣品),示例數據如下:

在R中執行wilcox.test(x, y, alternative ="two.sided")。這裡兩處理的樣品數目可以不等。我們不知道x和y誰大誰小,所以我們選擇雙尾檢驗(『two.sided』)。如果要驗證x是否顯著大於y,可以選擇『greater』;驗證x是否顯著小於y,可以選擇『less』

如果要計算處理前後各樣品變化是否顯著(配對樣品),示例數據如下:

則在R中執行wilcox.test(x, y, alternative ="two.sided",paired=T)。這裡各樣品處理前後數據要一一對應,數目相等。同樣地,用『greater』或『less』可以驗證x是否顯著大於或小於y。

今天就分享到這裡咯,若有任何問題或不足之處歡迎留言指出~

往期原創精選:(點擊藍色標題直達)

如何快速評估16S rRNA基因引物的覆蓋率及特異性

教你一鍵下載同一屬下不同模式種的16S rRNA基因序列

兩種土壤細菌群落結構高通量絕對定量方法

畫完gene map就過年啦!

內標法測序研究生物炭對大豆土壤細菌群落的影響

古菌漫談 | 深古菌門--Bathyarchaeota

簡單粗暴!系統發育樹的構建-MEGA篇

利用反向穩定同位素標記方法檢測微生物降解有機物的活性

蠟狀芽胞桿菌類群(Bacillus cereus group)分類研究

利用穩定同位素探針(SIP)揭示不可培養微生物的功能

如何用FAPROTAX預測微生物群落功能

海洋可培養微生物的鑑定與分類

教你用ggtree繪製高顏值進化樹

臨近畢業,微生物生態相關文章可以投稿哪些SCI雜誌?

教你如何簡單快速繪製heatmap圖

根據16S預測微生物群落功能最全攻略

Rhizosphere、Rhizoplane到底誰才是根際,根際土該如何取?

微生物生態領域專業SCI期刊

Springer發表第二版「宏基因組學」研究最新指導書

看SPSS如何檢驗數據是否服從正態分布

如何第一時間了解研究領域最新動態?

真菌也可以功能預測?FUNGuild教你從ITS到功能分類

簡單粗暴!系統進化樹的解讀

如何與國際科學界接軌?你需要ResearchGate!

簡單粗暴,微生物生態研究中常用資料庫簡介

從《你的名字》學做「網絡關係圖」——Gephi篇

16S多樣性測序,到底該選啥引物?!

STAMP也可以輕鬆搞定

嵌合體?也就那麼回事兒——高通量數據處理二三事

微生物培養的福音:一個直接用16S rDNA序列來預測其培養基配方的網站!!!

【特別策劃】霧霾中的微生物

本期排版:盧瑟菌

本期校審:盧瑟菌,參天大蔥,李小圓

這裡是「微生物生態」,「科學思想值得傳播」,

歡迎大家轉發、評論、投稿~

相關焦點

  • t檢驗中t值的意義 - CSDN
    顯著性檢驗(significance test)就是事先對總體(隨機變量)的參數或總體分布形式做出一個假設,然後利用樣本信息來判斷這個假設(備擇假設)是否合理,即判斷總體的真實情況與原假設是否有顯著性差異。或者說,顯著性檢驗要判斷樣本與我們對總體所做的假設之間的差異是純屬機會變異,還是由我們所做的假設與總體真實情況之間不一致所引起的。
  • 非參數檢驗-配對樣本的Wilcoxon符號秩和檢驗
    之前我們學習了單樣本的K-S檢驗常用來檢測數據是否滿足正態分布,並不是單樣本t檢驗的代替方法。
  • 使用非參數統計檢驗進行分析的指南
    問題是沒有人告訴你如何進行像假設檢驗這樣的分析。統計檢驗用於制定決策。為了使用中位數進行分析,我們需要使用非參數檢驗。非參數測試是分布獨立的檢驗,而參數檢驗假設數據是正態分布的。說參數檢驗比非參數檢驗更加的臭名昭著是沒有錯的,但是前者沒有考慮中位數,而後者則使用中位數來進行分析。接下來我們就進入非參數檢驗的內容。
  • 第十三講 R-配對樣本Wilcoxon檢驗
    但是,當樣本差值分布非正態,且經過一定的數值轉換嘗試後,仍然無法滿足正態性要求時,配對樣本的Wilcoxon符號秩檢驗成為備選方法,它將非正態樣本的差值的中位數與0進行比較。它是一種非參數樣本檢驗,基於樣本差值的秩次排列,而非平均值。
  • 手把手教你多組獨立樣本的非參數檢驗及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 多組比較的非參數檢驗——K-W檢驗
    作者:丁點helper來源:丁點幫你前面我們已經講完兩組比較的非參數檢驗,類似t檢驗與方差分析,當比較的數據超過兩組時,我們就需要換一個方法了。非參數K-W檢驗,相比前文講解的Mann-Whitney 檢驗就是這樣,我們可以把它理解為「非參數檢驗的方差分析」。K-W檢驗的全稱為,Kruskal-Wallis檢驗,它是用於正態分布條件不滿足情況下,多組獨立樣本方差分析的替代。
  • 多個獨立樣本的非參數檢驗
    多個獨立樣本的非參數檢驗多組定量數據的比較用什麼檢驗方法?
  • 非參數檢驗 之 k個相關樣本檢驗
    K個相關樣本檢驗簡介  在參數檢驗中,我們常常對三個或三個以上的總體的均值進行相等性檢驗,使用的方法是方差分析,在非參數分析中也會遇到同樣的問題,檢驗多個總體的分布是否相同。方差分析過程需要假定條件,F檢驗才有效。
  • 基於R語言實現多組獨立樣本的非參數檢驗(Kruskal-Wallis秩和檢驗)及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 一篇概全:非參數檢驗思路總結
    非參數檢驗和參數檢驗的對比① 適用範圍:非參數檢驗用作參數檢驗的替代方法,當數據不滿足正態性時,將使用非參數檢驗。因此,關鍵是要弄清楚是否具有正態分布。如果數據大致呈現"鍾型"分布,則可以使用參數檢驗。
  • r語言卡方檢驗算法_r語言符號檢驗算法 - CSDN
    三、其它重要的非參數檢驗法  3.1.理論分布完全已知的情況下     3.1.1.皮爾森擬合優度檢驗假定從分布函數未知的F(x)和G(x)的總體中分別抽出25個和20個觀察值的隨即樣品,其數據由下表所示。現檢驗F(x)和G(x)是否相同。
  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。分析--描述統計--探索,將指標全部放進因變量列表裡,將組放進因子列表裡,單擊 圖 ,勾選含檢驗的正態圖--繼續--確定。輸出結果,看正態性檢驗。一般情況下(樣本量比較少)看夏皮諾威爾克檢驗結果。
  • stata中chow檢驗(Chow test)的操作
    chow檢驗(Chow test)也叫鄒氏檢驗、鄒至莊檢驗,它是由鄒至莊提出的,用於判斷結構在預先給定的時點是否發生了變化的一種方法。
  • 顯著性檢驗的計算 - CSDN
    根據不同適用條件,常用的統計方法有:兩配對樣本的t檢驗、兩配對樣本的非參數檢驗(如Wilcoxon符號秩檢驗)、配對卡方檢驗(McNemar)。【1】兩配對樣本的t檢驗其本質是兩配對樣本的差值與0的比較。跟兩獨立樣本的t檢驗一樣,兩配對樣本的t檢驗用到的函數也是t.test {stats}。
  • 非參數中的秩和檢驗到底怎麼做的?
    文章來源: 丁點幫你微信公眾號作者:丁點helper今天,我們開始講非參數檢驗。對於非參數檢驗,大家可能主要是把它和「不符合正態分布」一起記憶的。剛開始學統計的時候,我們都知道:數據符合正態分布就用t檢驗,不符合就用非參數檢驗,更具體點,就是所謂的「秩和檢驗」。
  • f分布的檢驗 r語言 - CSDN
    統計學中的t檢驗法和F檢驗法的應用條件是樣本都來自正態總體或近似正態總體,只有符合這個條件,才能用它們來檢驗各樣本所屬的總體參數的差異顯著性。
  • r語言卡方檢驗和似然比檢驗_r語言似然比檢驗代碼 - CSDN
    library(mvoutlier)outliers <- aq.plot(y)ouliers  穩健多元方差分析: 如果多元正態性或者方差-協方差均值假設都不滿足,又或者擔心多元離群點,那麼可以考慮用穩健或非參數版本的MANOVA檢驗。
  • r語言 t檢驗 假設 - CSDN
    配對T檢測 註:它要求要進行配對的兩樣本的參數一樣長。若小夥伴們想對T檢測進一步了解,請參考http://blog.csdn.net/tiaaaaa/article/details/58130363,這個大佬的博客講解的很詳細。F檢驗F檢驗觀察兩總體方差是否相等。
  • 如何用非參數檢驗,分析多個相關樣本數據?
    不同的方法有不同的要求和側重,因此才出現這麼多的檢驗方法,分別針對不同的應用場景。下面就介紹幾種側重於檢驗多組相關數據的非參數檢驗方法。①Friedman檢驗Friedman檢驗,是研究多相關樣本差異性的方法,屬於非參數檢驗的一種。
  • Kruskal-Wallis檢驗:單因素方差分析的非參數方法
    此時可以嘗試非參數檢驗方法:Kruskal-Wallis 單因素 ANOVA(k 個樣本)檢驗。現在我們收集到4種不同飼料增肥效果的實驗數據,假設4組數據嚴重偏離正態分布,請使用Kruskal-Wallis非參數方法檢驗飼料效果的差異性。菜單及參數設置,如下方GIF動圖所示: