點擊上方藍色「宏基因組」關注我們!專業乾貨每日推送!
寫在前面優秀的作品都有三部分曲,如駭客帝國、教父、指環王等。
擴增子系列課程也分為三部曲:
第一部《擴增子圖表解讀》:加速大家對同行文章的解讀能力。
第二部《擴增子分析解讀》:學習數據分析的基本思路和流程。
第三部《擴增子統計繪圖》:對結果進行可視和統計檢驗,達到出版級的圖表結果。
《擴增子統計繪圖》系列文章介紹《擴增子統計繪圖》是之前發布的《擴增子圖表解讀》和《擴增子分析解讀》的進階篇,是在大家可以看懂文獻圖表,並能開展標準擴增子分析的基礎上,進行結果的統計與可視化。其章節設計與《擴增子圖表解讀》對應,為八節課八種常用圖形(箱線圖、散點圖、熱圖、曼哈頓圖、火山圖、維恩圖、三元圖和網絡圖),基本滿足文章常用的圖片種類需求。
也適合對公司標準化分析返回結果的進一步統計、可視化及美化,達到出版級別,衝擊高分文章。
本部分練習所需文件位於百度網盤,連結:http://pan.baidu.com/s/1hs1PXcw 密碼:y33d。
繪製Alpha多樣性線箱圖繪圖和統計全部為R語言,建議複製代碼,在Rstuido中運行,並設置工作目錄為存儲之前分析結果文件的result目錄。
# 運行前,請在Rstudio中菜單欄選擇「Session - Set work directory -- Choose directory」,彈窗選擇之前分析目錄中的result文件夾# 安裝相關軟體包,如果末安裝改為TRUE運行即可安裝if (FALSE){ source("https://bioconductor.org/biocLite.R") biocLite(c("ggplot2"))}# 加載相關軟體包library("ggplot2") # load related packages# 讀入實驗設計和Alpha多樣性值design = read.table("design.txt", header=T, row.names= 1, sep="\t") alpha = read.table("alpha.txt", header=T, row.names= 1, sep="\t")# 以Observed OTU為例進行可視化和統計分析,其它指數將observed_otus替換為shannon, chao1, PD_whole_tree即可計算# 合併Alpha指數與實驗設計index = cbind(alpha, design[match(rownames(alpha), rownames(design)), ]) # 繪圖代碼、預覽、保存PDFp = ggplot(index, aes(x=genotype, y=observed_otus, color=genotype))+ geom_boxplot(alpha=1, outlier.size=0, size=0.7, width=0.5, fill="transparent") + geom_jitter( position=position_jitter(0.17), size=1, alpha=0.7)+ labs(x="Groups", y="observed_otus index")pggsave(paste("alpha_observed_otus.pdf", sep=""), p, width = 5, height = 3)# 統計組間是否顯著差異# anova對指數與分組統計observed_otus_stats <- aov(observed_otus ~ genotype, data = index)# 使用TukeyHSD對組間進行檢驗,效正pvalueTukey_HSD_observed_otus <- TukeyHSD(observed_otus_stats, ordered = FALSE, conf.level = 0.95)# 結果中提取需要的結果Tukey_HSD_observed_otus_table <- as.data.frame(Tukey_HSD_observed_otus$genotype)# 預覽結果Tukey_HSD_observed_otus_table# 保存結果到文件,按Pvaule值由小到大排序write.table(Tukey_HSD_observed_otus_table[order(Tukey_HSD_observed_otus_table$p, decreasing=FALSE), ], file="alpha_observed_otus_stats.txt",append = FALSE, quote = FALSE, sep="\t",eol = "\n", na = "NA", dec = ".", row.names = TRUE,col.names = TRUE)
Observed OTU多樣性箱線圖
詳細的圖片講解,可參考1箱線圖:Alpha多樣性,老闆再也不操心我的文獻閱讀
各組間的統計結果如下:主要看最後一列p adj(Adjust P-value)是否顯著,本文數據不顯著
diff lwr upr p adjOE-KO -7.52380952380952 -24.480725165752 9.43310611813294 0.515429907536906WT-KO -6.11111111111111 -21.9728532782553 9.75063105603303 0.604309699204896WT-OE 1.4126984126984 -15.5442172292441 18.3696140546409 0.976169656924344
其它箱線圖繪製教程推薦閱讀並實際操作陳同博士寫的文章:
R語言學習 - 箱線圖(小提琴圖、抖動圖、區域散點圖)
R語言學習 - 箱線圖一步法
http://mp.weixin.qq.com/s/5PkLAQ0yOxyGfl9MAH7veQ
http://mp.weixin.qq.com/s/Zvmht0kOyOf02P8jQNjaOw
http://mp.weixin.qq.com/s/8w6jV9MtJZ4h3ATaPP_Rsw
http://mp.weixin.qq.com/s/MJWyUzeBZ7WJQhpAGX6Fgg
想了解更多宏基因組、16S分析相關文章,
快關注「宏基因組」公眾號,乾貨第一時間推送。
系統學習生物信息,快關注「生信寶典」,
那裡有幾千志同道合的小夥伴一起學習。