R統計繪圖-單因素非參數重複測量方差分析[Translation]

2021-12-27 EcoEvoPhylo
# 示例數據wide formatdata("selfesteem", package = "datarium")selfesteem # 每個個體在三個不同時間段的自尊評分
# 數據轉換為long formatselfesteem <- selfesteem %>% gather(key = "time", value = "score", t1, t2, t3) %>% convert_as_factor(id, time)head(selfesteem)
# 對數據進行描述統計selfesteem %>% group_by(time) %>% get_summary_stats(score, type = "common")
# 數據可視化繪製帶散點的箱線圖ggboxplot(selfesteem, x = "time", y = "score", add = "jitter")

圖1|long format selfesteem數據。time為自變量,score為因變量,id為獨一無二的樣本序號。

2.3 Friedman test


rstatix包中friedman_test()用於進行單因素非參數重複測量方差分析
# Friedman testres.fried <- selfesteem %>% friedman_test(score ~ time |id) res.fried # p<0.05,時間點各組間的score差異顯著
# Effect size計算:Kendall's W一致性檢驗,用於檢測Friedman檢驗的效應量。##W=X2/N(K-1),W是Kendall's W值,X2是Friedman檢驗統計值,N是樣品數量(此處為10),k是自變量的分組數(此處t1-3,k=3)。##Kendall'W 係數假定值從0(表示沒有關係)到1(表示完全一致關係)。##Kendall』W採用Cohen的解釋準則:0.1<0.3(小效應)、0.3-<0.5(中度效應)和>=0.5(強效應)。採用Bootstap計算置信區間。?friedman_effsize#edit(friedman_effsize) # 查看和編輯函數selfesteem %>% friedman_effsize(score ~ time |id) # W=0.91,預示著強效應。

統計顯著性(statistical significance)表明研究中存在一種效應,而實際顯著性(practical significance)則表明這種效應在現實世界中是有意義的。統計顯著性用p值來表示,而實際顯著性用effect size來表示。effect size即不同處理下的總體均值之間差異的大小,是衡量處理效應大小的指標,表示變量之間的關係或組間差異的實際顯著性,簡稱ES。僅統計顯著性本身可能產生誤導,因為它受樣本大小的影響。增加樣本的數量總是使其更有可能發現一個統計顯著的影響,無論這個影響在現實世界中是多麼的小。相反,ES與樣本大小無關。只使用數據來計算效果大小。ES大意味著一個研究發現具有實際顯著性,而小的ES表明實際意義有限。因此在研究論文中有必要報告ES和置信區間,以表明結果的實際意義。


圖2|Friedman test檢驗結果。p<0.05,時間點各組間的score差異顯著。

圖3|Kendall'W 係數結果。Kendall's W一致性檢驗,用於檢測Friedman檢驗的效應量。

W=X2/N(K-1),W是Kendall's W值,X2是Friedman檢驗統計值,N是樣品數量(此處為10),k是自變量的分組數(此處t1-3,k=3)。Kendall'W 係數假定值從0(表示沒有關係)到1(表示完全一致關係)。Kendall』W採用Cohen的解釋準則:0.1<0.3(小效應)、0.3-<0.5(中度效應)和>=0.5(強效應)。採用Bootstap計算置信區間。W=0.91,預示著強效應。

2.4 多重比較及數據可視化

# 多重比較,Wilcoxon signed-rank tests用於檢測分組兩兩之間的差異是否顯著。##檢測時,數據必須嚴格按照id進行排序,使t1與t2的樣本順序一一對應。pwc <- selfesteem %>%  wilcox_test(score ~ time, paired = TRUE, p.adjust.method = "bonferroni")pwc # 不同時間分組兩兩間都差異顯著。
# 數據可視化# Visualization: box plots with p-valuespwc <- pwc %>% add_xy_position(x = "time")?ggboxplot # 查看幫助手冊
## 設置離群值形狀ggboxplot(selfesteem, x = "time", y = "score", add = "point",outlier.shape = 25) + stat_pvalue_manual(pwc, hide.ns = TRUE) + labs( subtitle = get_test_label(res.fried, detailed = TRUE), caption = get_pwc_label(pwc) )
## 顯示均值與標準誤差並隱藏離群值ggboxplot(selfesteem, x = "time", y = "score", add = "mean_se",bxp.errorbar = TRUE,outlier.shape = NA) + stat_pvalue_manual(pwc, hide.ns = TRUE) + labs( subtitle = get_test_label(res.fried, detailed = TRUE), caption = get_pwc_label(pwc) )

圖4|Wilcoxon signed-rank檢驗結果。使用bonferroni方法校正p值(p.adj=p x 3)。p<0.05,三個時間點的score,兩兩間都差異顯著。

圖5|單因素非參數重複測量方差分析結果箱型圖。以時間點為橫坐標,score為縱坐標。*表示2組之間差異顯著。圖中添加樣本點,並將離群值的形狀設置為倒三角。

圖6|單因素非參數重複測量方差分析結果箱型圖以時間點為橫坐標,score為縱坐標。*表示2組之間差異顯著。圖中添加樣本點,均值與誤差棒,並隱藏離群值。

圖7|ggplot2的shape對應數字圖縱坐標和橫坐標合併的數字表示對應的交叉點shape,如25表示無填充色倒三角。

公眾號後臺回復"Friedman檢驗"獲取全部R代碼。

相關焦點

  • R統計繪圖-混合方差分析[Translation]
    註:如果假設不滿足,可以考慮對轉換後數據進行雙因素重複測量方差分析,或者使用WRS2包進行穩健方差分析。如果協方差同質性假設不滿足,則可以考慮對每個組進行重複測量ANOVA。或者省略對交互作用的解釋。中:simple main effect:在第二個自變量(時間)的每個水平上運行第一個自變量(心理練習程度)的單因素重複測量方差分析。結果顯示t1時間點group對焦慮評分的效應不顯著,t2和t3顯著,因此隨後對t2和t3組進行group各水平的兩兩比較即可。。
  • 輕鬆學用Origin完成單因素方差分析及繪圖
    之前的推文中,我們介紹了origin如何進行數據描述以及正態性分析(點一下,連結到全文)。數據的正態性檢測2.均值比較選擇第一個統計方法(Origin優選出了好幾個統計方法,差異不大,選擇第一個即可)6. 看一下最終結果,包括描述性統計結果,可以以此來進行作圖使用7. 總體方差中P小於0.05,表明該四組數據中,至少有兩組數據平均值有顯著差別8.
  • R統計-方差齊性檢驗[Translation]
    兩個獨立樣本T檢驗和方差分析等統計檢驗方法,假設不同群體之間的方差是相等的(方差齊性)。
  • R與Python之基本統計分析(五) ---- 單因素方差分析
    圖 2 R 單因素方差分析在 Python 中,我們有兩種方式可以處理單因素方差分析,大家可以看看喜歡哪一種方式。圖 6 R 單因素方差分析Python 中運用 scipy 包中的 f_oneway 函數,是不是會產生一樣的結果呢?這裡要注意的是 f_oneway 中的參數格式和 R 中的aov 是不一樣的。
  • Kruskal-Wallis檢驗:單因素方差分析的非參數方法
    3組以上數據均值有無差異,通常我們使用單因素方差分析來完成,前提是3組數據分別來自正態分布總體,且方差齊次,對於正態分布來說,可以不用過於嚴苛
  • 重複測量數據的方差分析在SPSS中的應用——【杏花開醫學統計】
    關 注 重複測量數據的方差分析 在SPSS中的應用 關鍵詞:spss、重複測量方差 導 讀 在醫學研究中,很多實驗都涉及到重複測量的數據資料
  • SPSS學習筆記:重複測量的多因素方差分析
    from http://blog.sina.com.cn/s/blog_44befaf601015mp5.html重複測量數據的方差分析是對同一因變量進行重複測量的一種試驗設計技術。在給予一種或多種處理後,分別在不同的時間點上通過重複測量同一個受試對象獲得的指標的觀察值,或者是通過重複測量同一個個體的不同部位(或組織)獲得的指標的觀察值。
  • R繪圖應用實例:單因素方差分析ANOVA及繪圖
    本文主要是利用日常實驗數據,嘗試用R進行單因素方差分析並繪製柱形圖。
  • 生物統計(4)-單因素方差分析
    方差分析的基本思想在進行科學研究時,有時要按實驗設計將所研究的對象分為多個處理組進行不同的處理,其中處理因素(treatment)至少有兩個水平(level)。這類科研資料的統計分析,是通過所獲得的樣本信息來推斷各處理組均數間的差別是否有統計學意義,即處理是否有影響。
  • R語言 | 方差分析(下)
    既然有擴展版的獨立樣本t檢驗,那麼也肯定會有擴展版本的配對樣本t檢驗,這種檢驗分析方法被稱作單因素重複測量方差分析(one-way repeated measures ANOVA),它的典型特徵是同一組個體參加了所有不同的處理條件,或者是不同時間點的不同水平。
  • SPSS統計:單因素方差分析與單變量方差分析
    在spss統計分析中,方差分析在比較均值菜單和一般線性模型菜單中都可以做,單因素方差分析一般稱為單因素
  • 重複測量資料的方差分析在SPSS軟體中的實現
    繼上期講解了「隨機區組方差分析在 SPSS 軟體中的實現」之後,筆者一氣呵成,繼續為你剖析重複測量資料的方差分析在 SPSS 軟體中的實現,一起學起來吧!一、重複測量的概念重複測量是指同一受試對象的同一觀察指標在不同的時間點或者不同的狀態下進行多次測量所獲得的資料,重複測量資料的典型特點是同一個研究對象被多次測量。
  • SPSS詳細教程:三因素重複測量方差分析
    註:在重複測量的方差分析模型中,對同一個體相同變量的不同次觀測結果被視為一組,用於區分重複測量次數的變量被稱為受試者內因素,受試者內因素實際上是自變量。如果數據不服從正態分布,可以有如下3種方法進行處理:(1) 數據轉換:對轉換後呈正態分布的數據進行三因素重複測量方差分析。當各組因變量的分布形狀相同時,正態轉換才有可能成功。對於一些常見的分布,有特定的轉換形式,但是對於轉換後數據的結果解釋可能比較複雜。(2) 直接進行分析:由於方差分析對於偏離正態分布比較穩健,儘管沒有專門針對三因素重複測量方差分析的驗證。
  • 案例實戰|單因素方差分析詳解
    對於我們這份數據,它很明顯是希望對數據進行差異性分析,而且分類變量的中有3組類別,所以不適合用t檢驗,而應該用單因素方差分析。得到的結果如下:從得到的數據分析結果來看,殘差值正態性檢驗的顯著性P值<0.05,所以數據不滿足正態分布。因此,這份數據不適合用單因素方差分析方法,而應該使用非參數檢驗的方法對數據進行分析,我在《使用非參數檢驗方法判斷多獨立樣本間的差異性》這篇文章中對這種情況進行了詳細的案例介紹,大家可以點擊查看。
  • SPSS分析技術:單因素方差分析結果的模型解讀
    平時我們在進行方差分析時,經常只關注方差分析表,用表中的顯著性概率值p來判斷因素是否對因變量有顯著性影響,然而這只是方差分析結果的一部分內容。SPSS的方差分析過程就是以方差分析模型的形式進行計算和結果輸出的。下面我們將以單因素方差分析為例,介紹單因素方差分析結果的模型函數解讀。幫助大家充分理解方差分析的深層模型含義。
  • R語言統計篇: 單因素協方差分析
    單因素
  • R與生物專題 | 第十四講 R-單因素方差分析1
    在「R與生物統計專題」中,我們會從介紹R的基本知識展開到生物統計原理及其在R中的實現。
  • 方差分析(二): ANOVA過程單因素方差分析
    >「朝陽35處」可查看「說人話的大數據」系列合輯在方差分析中,最簡單的情形為單因素。在SAS中進行單因素方差分析可以使用ANOVA過程和GLM過程,本文先對ANOVA過程進行方差分析進行介紹,下面一篇將文章介紹SLM過程進行方差分析。在方差分析中,最簡單的情形為單因素,熟練掌握單因素的方差分析對理解、解決多因素方差問題很有幫助。在SAS中,方差分析可以通過PROC TTEST、PROC ANOVA與PROC GLM實現。
  • SPSS實操教程——單因素方差分析
    這個時候需要使用方差分析。那怎麼做呢?做分析之前需要思考幾個問題?是不是單因素?是不是獨立?各組應變量是不是符合正態分布?各組應變量是不是方差齊性?好,他這個研究是單因素的,只是分析了藥物一個因素,包括三種不同的藥物,分為三組。而且各組之間也是相互獨立的。
  • 數學建模培訓26_數據分析基礎(3)_單因素方差分析
    方差分析就是一種分析、處理多組實驗數據間均值差異的顯著性的統計方法。其主要任務是,通過對數據的分析處理,搞清楚各實驗條件對實驗結果的影響,以便更有效地指導實踐,提高經濟效益或者科研水平。在統計中,人們稱受控制的條件為因素,因素所處的狀態稱為水平。