教你畫雙分類變量的箱線圖

2021-03-02 生信星球

 今天是生信星球陪你的第573天

   大神一句話,菜鳥跑半年。我不是大神,但我可以縮短你走彎路的半年~

   就像歌兒唱的那樣,如果你不知道該往哪兒走,就留在這學點生信好不好~

   這裡有豆豆和花花的學習歷程,從新手到進階,生信路上有你有我!

背景基礎

箱線圖的解釋:

添加p值的需求


這樣的箱線圖,添加p值的需求是很多見的,核心就是stat_compare_means函數,可以很輕易搜到代碼:

library(ggpubr)my_comparisons <- list( c("0.5", "1"), c("1", "2"), c("0.5", "2") )
ggboxplot(ToothGrowth, x = "dose", y = "len",
          color = "dose", palette = "jco")+ 
  stat_compare_means(comparisons = my_comparisons)+ 
  stat_compare_means(label.y = 50)  

加難度

如題,有的箱線圖不止一個分組,下面的例子中,橫坐標按照cyl列映射,填充顏色按照am列映射,即可得到展示雙分類的箱線圖。

作圖數據

library(ggplot2)
library(dplyr)
x = mtcars %>%
  mutate_at(vars(am, cyl), as.factor)
p <- ggplot(x,aes(am, disp, fill=cyl))+
  geom_boxplot()+theme_classic()
p1 = p + stat_compare_means(aes(group = am),label = "p.format")
p2 = p + stat_compare_means(aes(group = cyl), label = "p.format")
library(patchwork)
p1+p2


此圖添加p值,可根據am分組,也可根據cyl分組,計算出的p值是不同的。
本想繼續探索如何給分組內部添加比較連線,卻發現stat_compare_means的comparisons參數無法支持這樣的操作,一個畫圖愛好者抱著執念搜索了好久,沒有找到直接添加的操作,只能是通過分面了。

p <- ggplot(x,aes(cyl, disp, fill=cyl))+
  facet_wrap(~am)+
  geom_boxplot()+theme_classic()+
  stat_compare_means(comparisons = list(c("4","6"),c("6","8")));p

以前寫的箱線圖教程:箱線圖走一個批量繪製配對樣本差異基因的箱線圖
兩種方法批量繪製差異基因箱線圖(朋友圈無獎競答公布答案)

攢錢買麥旋風,點一下廣告=2毛

相關焦點

  • 箱線圖的N種畫法
    箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。在各種領域也經常被使用。下圖中標示了箱線圖中每條線和點所表示的含義,應用到了分位數的概念。
  • 箱線圖!Esquisse作圖神器免費教程等你來領!
    (什麼,你還不知道我們的Esquisse學習計劃嗎?快去往期回顧一下,《免費!這個只用點一點就能出圖的工具我們來教你!》)我們了解了去畫柱狀圖所需要的數據類型和組成以及怎樣用Esquisse去快速實現從數據到柱狀圖的轉變。細節的更改也讓我們進一步了解了Esquisse的強大功能。那麼今天我們繼續Esquisse的學習,用它去復現文章中常見的Figure!
  • 箱線圖的生物學含義
    箱線圖的組成樣本大小可以通過成比例的調整箱線圖的寬度實現,如上圖b中的第二個箱線圖,箱子的凸凹程度表示樣本量的多少。其次,一些軟體如R使用鉸鏈hinges而非四分位數來作為箱邊界,下鉸鏈和上鉸鏈分別是數據下半部分和上半部分的中位值,這種箱線圖與基於四分位數的箱線圖略有不同。箱線圖的寬度,上下限的位置,凹口尺寸和異常值都需要調整,因此,在文章描述清箱線圖的構造方式是非常重要的。
  • 散點圖、箱線圖、核密度函數……數據分析必備的9種可視化圖表
    如果x軸是一個時間序列,那麼線圖是一個很好的選擇。我們可能會在數據中看到一些時間上的趨勢。在本例中,只能看到數據是按「物種」列排序的(圖中紫色的步驟),並且其他列的移動平均值遵循該模式(花瓣長度,特別是紅色標記的花瓣長度)。散點圖這是一種將兩個連續變量之間的關係可視化的完美圖表。
  • ggplot2|從0開始繪製箱線圖
    繼續「一圖勝千言」系列,箱線圖通過繪製觀測數據的五數總括,即最小值、下四分位數、中位數、上四分位數以及最大值,描述了變量值的分布情況。
  • R之箱線圖繪製
    16s分析一直在連載,但是最基礎的莫過於alpha多樣性了,但是箱線圖卻不是alpha多樣性的唯一選擇,箱線圖也不是局限於alpha多樣性,這裡藉助
  • EXCEL箱線圖的作法
    豐富的繪圖功能是EXCEL軟體一大特色,在EXCEL中可以實現大部分統計圖的繪製,但作為常見的一種統計圖—箱線圖在EXCEL中並沒有它的身影。難道在EXCEL真的無法實現箱線圖的繪製嗎?在實踐中我們發現,儘管箱線圖在EXCEL中不能直接實現,卻可以通過間接的形式加以實現。
  • 箱線圖boxplot的多種畫法
    BioNews,專注於報導生命科學領域相關新聞,長按下方二維碼即可關注"BioNews"(id : iBioNews)本文作者:侯衛博箱線圖主要是通過四分位數描述數據分布箱線圖能夠顯示出可能為離群點(範圍±1.5*IQR以外的值,IQR表示四分位距,即上四分位數與下四分位數的差值)的觀測。從箱線圖中,可以大致推斷出數據的集中或離散趨勢。
  • 箱線圖中的極端值為什麼刪除後還是會存在?
    前面的文章《箱線圖中顯示的異常值,應該如何去除?》
  • 一圖看懂箱線圖,順便帶你鞏固matplotlib繪圖流程!
    在我之前發的箱線圖圖鑑中,有讀者表示看不懂箱線圖。今天本文就通過下面這張圖簡單講一下箱線圖沒錯,這張圖也是用matplotlib一點一點的繪製出來的,所以順便鞏固一下matplotlib繪圖的綜合應用。箱線圖怎麼看?
  • Excel-箱線圖(數據分布)分析
    來源:CSDN博客箱線圖(Boxplot)也稱箱須圖(Box-whisker通過將多組數據的箱線圖畫在同一坐標上,則可以清晰地顯示各組數據的分布差異,為發現問題、改進流程提供線索。1.什麼是四分位數箱線圖需要用到統計學的四分位數
  • python學習筆記:同時畫多圖,折線圖,箱線圖,條形圖,柱狀圖等
    1.同時畫六張圖#從Matplotlib中導入了pyplot繪圖模塊from matplotlib.pyplot import *#設置相關的數值x=[1,2,3,4]y=[5,4,3,2]#創建一個圖紙
  • R語言中使用boxplot函數繪製箱線圖
    箱線圖簡介箱線圖又稱箱形圖或盒須圖,該圖是由5個特徵值繪製而成的圖形。5個特徵值是變量的最大值、最小值、中位數、第1四分位數和第3四分位數。連接兩個分位數畫出一個箱子,箱子用中位數分割,把兩個極值點與箱子用線條連接,即成箱線圖。
  • R數據分析:雙分類變量的交互作用作圖
    之前的雙連續變量交互作用作圖,和分類變量與連續變量的交互都給大家寫了,今天給大家寫寫,兩個分類變量的交互,及簡單斜率圖畫法。
  • 柱狀圖、箱線圖、提琴圖、傑特圖還有蜂窩圖,你要哪個?
    上次提到箱線圖等這些類型的圖可以展示更多的數據特點,很多人並不推薦使用柱狀圖。為了在科研論文中普及箱線圖(boxplot)的使用,nature method還專門發文力推。Visualization samples with box plots文中詳細講解了箱線圖的原理和優點,並與傳統柱狀圖做了對比。
  • 擴增子統計繪圖1箱線圖:Alpha多樣性
    其章節設計與《擴增子圖表解讀》對應,為八節課八種常用圖形(箱線圖、散點圖、熱圖、曼哈頓圖、火山圖、維恩圖、三元圖和網絡圖),基本滿足文章常用的圖片種類需求。也適合對公司標準化分析返回結果的進一步統計、可視化及美化,達到出版級別,衝擊高分文章。
  • EDA 中篇 | 數據類型與單變量分析
    從變量的個數來分有:單變量分析和多變量分析。單變量分析首先,我們來看單變量分析。圖形化展示通常使用:直方圖(Histograms)、箱線圖(Boxplots)、密度圖(Density Plot)和條形圖(Barplot)。
  • 2016考研英語翻譯分類詞彙:品質類(B)
    2016考研英語翻譯分類詞彙:品質類(B)   Bar chart, 條形圖   Bar graph, 條形圖   Base period, 基期   Bayes' theorem , Bayes定理   Bell-shaped curve
  • 箱線圖的一生(作圖數據的整理)
    前面有篇文章講的就是怎麼用R簡單製作箱線圖,用的是R自帶數據,相對來說還是比較容易理解,主要是R自帶數據是非常完美的,剛好適合做某種特定的分析,那遇到我們自己的數據呢