擴增子統計繪圖1箱線圖:Alpha多樣性

2021-02-20 宏基因組

點擊上方藍色「宏基因組」關注我們!專業乾貨每日推送!

寫在前面

優秀的作品都有三部分曲,如駭客帝國、教父、指環王等。

擴增子系列課程也分為三部曲:

第一部《擴增子圖表解讀》:加速大家對同行文章的解讀能力。

第二部《擴增子分析解讀》:學習數據分析的基本思路和流程。

第三部《擴增子統計繪圖》:對結果進行可視和統計檢驗,達到出版級的圖表結果。

《擴增子統計繪圖》系列文章介紹

《擴增子統計繪圖》是之前發布的《擴增子圖表解讀》和《擴增子分析解讀》的進階篇,是在大家可以看懂文獻圖表,並能開展標準擴增子分析的基礎上,進行結果的統計與可視化。其章節設計與《擴增子圖表解讀》對應,為八節課八種常用圖形(箱線圖、散點圖、熱圖、曼哈頓圖、火山圖、維恩圖、三元圖和網絡圖),基本滿足文章常用的圖片種類需求。

也適合對公司標準化分析返回結果的進一步統計、可視化及美化,達到出版級別,衝擊高分文章。

本部分練習所需文件位於百度網盤,連結:http://pan.baidu.com/s/1hs1PXcw 密碼:y33d。

繪製Alpha多樣性線箱圖

繪圖和統計全部為R語言,建議複製代碼,在Rstuido中運行,並設置工作目錄為存儲之前分析結果文件的result目錄。

# 運行前,請在Rstudio中菜單欄選擇「Session - Set work directory -- Choose directory」,彈窗選擇之前分析目錄中的result文件夾# 安裝相關軟體包,如果末安裝改為TRUE運行即可安裝if (FALSE){    source("https://bioconductor.org/biocLite.R")    biocLite(c("ggplot2"))}# 加載相關軟體包library("ggplot2") # load related packages# 讀入實驗設計和Alpha多樣性值design = read.table("design.txt", header=T, row.names= 1, sep="\t") alpha = read.table("alpha.txt", header=T, row.names= 1, sep="\t")# 以Observed OTU為例進行可視化和統計分析,其它指數將observed_otus替換為shannon, chao1, PD_whole_tree即可計算# 合併Alpha指數與實驗設計index = cbind(alpha, design[match(rownames(alpha), rownames(design)), ]) # 繪圖代碼、預覽、保存PDFp = ggplot(index, aes(x=genotype, y=observed_otus, color=genotype))+  geom_boxplot(alpha=1, outlier.size=0, size=0.7, width=0.5, fill="transparent") +    geom_jitter( position=position_jitter(0.17), size=1, alpha=0.7)+  labs(x="Groups", y="observed_otus index")pggsave(paste("alpha_observed_otus.pdf", sep=""), p, width = 5, height = 3)# 統計組間是否顯著差異# anova對指數與分組統計observed_otus_stats <- aov(observed_otus ~ genotype, data = index)# 使用TukeyHSD對組間進行檢驗,效正pvalueTukey_HSD_observed_otus <- TukeyHSD(observed_otus_stats, ordered = FALSE, conf.level = 0.95)# 結果中提取需要的結果Tukey_HSD_observed_otus_table <- as.data.frame(Tukey_HSD_observed_otus$genotype)# 預覽結果Tukey_HSD_observed_otus_table# 保存結果到文件,按Pvaule值由小到大排序write.table(Tukey_HSD_observed_otus_table[order(Tukey_HSD_observed_otus_table$p, decreasing=FALSE), ], file="alpha_observed_otus_stats.txt",append = FALSE, quote = FALSE, sep="\t",eol = "\n", na = "NA", dec = ".", row.names = TRUE,col.names = TRUE)

Observed OTU多樣性箱線圖

詳細的圖片講解,可參考1箱線圖:Alpha多樣性,老闆再也不操心我的文獻閱讀  

各組間的統計結果如下:主要看最後一列p adj(Adjust P-value)是否顯著,本文數據不顯著

diff    lwr     upr     p adjOE-KO   -7.52380952380952       -24.480725165752        9.43310611813294        0.515429907536906WT-KO   -6.11111111111111       -21.9728532782553       9.75063105603303        0.604309699204896WT-OE   1.4126984126984 -15.5442172292441       18.3696140546409        0.976169656924344

其它箱線圖繪製教程

推薦閱讀並實際操作陳同博士寫的文章:
R語言學習 - 箱線圖(小提琴圖、抖動圖、區域散點圖)
R語言學習 - 箱線圖一步法

Reference

http://mp.weixin.qq.com/s/5PkLAQ0yOxyGfl9MAH7veQ

http://mp.weixin.qq.com/s/Zvmht0kOyOf02P8jQNjaOw

http://mp.weixin.qq.com/s/8w6jV9MtJZ4h3ATaPP_Rsw

http://mp.weixin.qq.com/s/MJWyUzeBZ7WJQhpAGX6Fgg

想了解更多宏基因組、16S分析相關文章,

快關注「宏基因組」公眾號,乾貨第一時間推送。

系統學習生物信息,快關注「生信寶典」,

那裡有幾千志同道合的小夥伴一起學習。

相關焦點

  • 一圖看懂箱線圖,順便帶你鞏固matplotlib繪圖流程!
    在我之前發的箱線圖圖鑑中,有讀者表示看不懂箱線圖。今天本文就通過下面這張圖簡單講一下箱線圖沒錯,這張圖也是用matplotlib一點一點的繪製出來的,所以順便鞏固一下matplotlib繪圖的綜合應用。箱線圖怎麼看?
  • R之箱線圖繪製
    16s分析一直在連載,但是最基礎的莫過於alpha多樣性了,但是箱線圖卻不是alpha多樣性的唯一選擇,箱線圖也不是局限於alpha多樣性,這裡藉助
  • EXCEL箱線圖的作法
    豐富的繪圖功能是EXCEL軟體一大特色,在EXCEL中可以實現大部分統計圖的繪製,但作為常見的一種統計圖—箱線圖在EXCEL中並沒有它的身影。難道在EXCEL真的無法實現箱線圖的繪製嗎?在實踐中我們發現,儘管箱線圖在EXCEL中不能直接實現,卻可以通過間接的形式加以實現。
  • 箱線圖的生物學含義
    箱線圖是能同時反映數據統計量和整體分布,又很漂亮的展示圖。四、箱線圖的優點與不足1.箱線圖能直觀展現樣本的分布 從下圖中可以看出箱線圖的統計描述比均值和標準差更直觀的展現了數據集的統計分布。直方圖、散點圖和箱線圖比較上圖展示了三個樣本量為20的正態分布數據,其中標準差都為1,AB均值為1,C均值為3。
  • Alpha多樣性指數的計算和差異分析(差異檢驗結果可視化)
    ,本文將不會花費大量篇幅介紹這些基礎知識,而是重點帶來對alpha多樣性進行統計學分析並直接生成圖像的方法。Alpha多樣性指數Alpha多樣性用於分析樣品內(Within-community)的微生物群落多樣性,可以反映樣品內的微生物群落的豐富度和多樣性。alpha多樣性指數包括豐富度、多樣性、均一性等。
  • R語言繪圖之ggplot2
    那麼今天我們就為大家介紹一下目前在R語言中流行的繪圖包ggplot2。1. ggplot2的安裝:install.packages("ggplot2")。2. ggplot2的繪圖原理: ggplot2的核心理念是將繪圖與數據分離,數據相關的繪圖與數據無關的繪圖分離,並按圖層作圖。
  • 箱線圖的N種畫法
    箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。在各種領域也經常被使用。下圖中標示了箱線圖中每條線和點所表示的含義,應用到了分位數的概念。
  • Excel-箱線圖(數據分布)分析
    通過將多組數據的箱線圖畫在同一坐標上,則可以清晰地顯示各組數據的分布差異,為發現問題、改進流程提供線索。1.什麼是四分位數箱線圖需要用到統計學的四分位數2.箱線圖的結構箱線圖包括一個矩形箱體和上下兩條豎線,箱體表示數據的集中範圍,上下兩條豎線分別表示數據向上和向下的延伸範圍
  • 箱線圖boxplot的多種畫法
    BioNews,專注於報導生命科學領域相關新聞,長按下方二維碼即可關注"BioNews"(id : iBioNews)本文作者:侯衛博箱線圖主要是通過四分位數描述數據分布箱線圖能夠顯示出可能為離群點(範圍±1.5*IQR以外的值,IQR表示四分位距,即上四分位數與下四分位數的差值)的觀測。從箱線圖中,可以大致推斷出數據的集中或離散趨勢。
  • 控制ggplot2箱線圖的顏色
    > 第七十九題 2021年2月7日控制ggplot2箱線圖的顏色
  • 123.R簡介和統計繪圖
    123R簡介和統計繪圖本節作者:劉永鑫 中國科學院遺傳與發育生物學研究所;陳同 中國中醫科學院版本1.0.2,更新日期:2020年
  • 編程模板-R語言腳本寫作:最簡單的統計與繪圖,包安裝、命令行參數解析、文件讀取、表格和矢量圖輸出
    之前分享過我個人的《Shell語言》和《Perl語言》腳本寫作模板(藍色字為連結直達),今天再分享一下我的R語言模板,一次性解決困擾新手的眾多問題,如包安裝、命令行參數解析、文件讀取、Anova組間統計和箱線圖展示
  • 基於ggplot2包繪製SCI學術箱線圖的保姆級教程
    箱線圖(Boxplot)是一種用作顯示一組數據分散情況資料的統計圖表。箱線圖,又稱箱形圖(boxplot)或盒式圖,不同於一般的折線圖、柱狀圖或餅圖等圖表,其包含一些統計學的均值、分位數、極值等統計量,該圖信息量較大,不僅能夠分析不同類別數據平均水平差異,還能揭示數據間離散程度、異常值、分布差異等。
  • python學習筆記:繪製風杆圖、箱線圖和簡單填充圖
    )#X,Y表示坐標,U,V表示風向標的指向,flagcolor定義風杆任何旗標的顏色plt.barbs(X,Y,U,V,flagcolor='green',alpha=0.75)#設置網格線plt.grid(True,color='gray')#子圖二plt.subplot(1,2,2)plt.barbs(X,Y,U,V,flagcolor='deeppink',alpha=0.75)plt.grid
  • 擴增子-β多樣性分析
    一、關於擴增子β多樣性分析β多樣性(Beta Diversity)是指不同樣品間的生物多樣性的比較,是對不同樣品間的微生物群落構成進行比較。β多樣性分析通常由計算環境樣本間的距離矩陣開始,對群落數據結構進行自然分解,並通過對樣本進行排序(Ordination),從而觀測樣本之間的差異。
  • 從零開始學Python可視化(二):掌握統計圖形的繪製
    這次我們會嘗試更多常見的統計圖形,比如條形圖、直方圖、餅圖等,我們的目標是掌握工作學習過程中使用最頻繁的圖形技能。1. 柱狀圖(條形圖) —— bar() / barh()柱狀圖又叫條形圖,用於繪製定性(分類)數據的分布特徵,比如不同國家的GDP、不同年齡段的平均體重等。
  • R語言之ggplot2繪圖
    集合對象geom_abline線圖,由斜率和截距指定geom_area面積圖(即連續的條形圖)geom_bar條形圖geom_bin2d二維封箱的熱圖geom_bar條形圖geom_blank空的幾何對象,什麼也不畫geom_boxplot箱線圖geom_contour條形圖geom_bar箱線圖geom_contour條形圖geom_bar等高線圖geom_crossbarcrossbar
  • NAR:MicrobiomeAnalyst微生物組分析師——統計、可視化和元分析微生物組數據的網頁工具
    、Beta多樣性、物種組成、組間差異比較、機器學習等20餘種常用分析和繪圖;同時結合文獻挖掘和公共數據建立了物種富含分析方法;可一鍵下載分析報告,助力生物學家輕鬆開展宏組學數據挖掘和探索。微生物組數據分析分為四大類:1. 物種組成taxonomic profiling - 群體組成特徵,基於生態的方法有Alpha多樣性(樣本內多樣性),Beta多樣性(樣本間多樣性);2. 功能組成functional profiling - 分配基因為不同的功能組(如代謝通路或生物過程),以理解功能潛能;3.
  • python學習筆記:同時畫多圖,折線圖,箱線圖,條形圖,柱狀圖等
    1.同時畫六張圖#從Matplotlib中導入了pyplot繪圖模塊from matplotlib.pyplot import *#設置相關的數值x=[1,2,3,4]y=[5,4,3,2]#創建一個圖紙
  • ggplot2|從0開始繪製箱線圖
    箱線圖能夠顯示出離群點(outlier),通過箱線圖能夠很容易識別出數據中的異常值。本文利用R語言的ggplot2包,從頭帶您繪製各式各樣的箱線圖。) #查看數據集 len supp dose1 4.2 VC 0.52 11.5 VC 0.53 7.3 VC 0.54 5.8 VC 0.55 6.4 VC 0.56 10.0 VC 0.51)geom_boxplot繪製基本的箱線圖使用ToothGrowth數據集,dose變量為分類橫坐標,對len變量做箱線圖