微生物群落基於KEGG預測功能的豐度分布圖繪製

2020-08-04 微生物組
微生物群落基於KEGG預測功能的豐度分布圖繪製

功能預測

在基於16S rRNA擴增子的研究中,因為了解微生物群落功能的需要,我們經常會使用一些軟體工具對16S rRNA擴增子數據進行功能預測,比如PICRUSt2。

這些功能預測的結果大多是基於KEGG資料庫,KEGG是一個整合了基因組、化學和系統功能信息的資料庫。

把從已經完整測序的基因組中得到的基因與更高級別的細胞、物種和生態系統水平的系統功能關聯起來是KEGG資料庫的特色之一。

與其他資料庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關係,這樣可以使研究者能夠對其關注的代謝途徑有更直觀全面的了解。

KEGG GENES資料庫提供關於在基因組計劃中發現的基因和蛋白質的序列信息。

KEGG PATHWAY資料庫包括各種代謝通路、合成通路、膜轉運、信號傳遞、細胞周期以及疾病相關通路等,此外還收集了各種化學分子、酶及以及酶促反應等相關信息。

KEGG Module資料庫是 KEGG 收集的一系列的功能單元,用於基因組注釋和生物學解釋。

KEGG Orthology (KO)系統通過把分子網絡的相關信息連接到基因組中,提供了跨物種注釋流程。

ko:表示通路,這個通路是不分物種的,相當於所有物種某一功能步驟的併集。

KEGG 資料庫包含 8 類生物代謝通路的分析:

  • Global Map

  • Metabolism, Genetic Information Processing

  • Environmental Information Processing

  • Cellular Processes

  • Organismal Systems

  • Human Diseases

  • Drug Development

在每一個大類的代謝通路中,被系統分類為二、三、四層。

第二層目前包括有 39 種子功能;第三層即為其代謝通路圖;第四層為每個代謝通路圖的具體注釋信息

豐度分布圖繪製

使用PICRUSt2等功能預測工具得到的KEGG路徑預測結果同樣是有層級的,當我們想要知道樣本中微生物群落的功能主要涉及哪些路徑時,就需要對這些具有層級的功能預測結果進行繪圖。

一般情況下在圖像中會展示第一和第二層級,因為三、四層級條目過多,在一幅圖中進行展示也看不清,通常會挑選感興趣的特定功能單獨呈現。

繪圖數據

繪圖數據是一個簡單的三列表格,包括第二層級的39個代謝路徑及其對應的第一層級信息,還有就是每個代謝路徑在所有樣本中的平均相對豐度

微生物群落基於KEGG預測功能的豐度分布圖繪製

⚠️因為目的是獲得所有樣本中的主要功能,因此繪圖數據需要提前計算一下每一個代謝路徑在所有樣本中的平均豐度。

圖像繪製

使用ggplot2的分面模式來展示不同代謝路徑所屬的第一層KEGG信息,應用條形圖表示每一個代謝路徑的相對豐度。

首先導入分析數據。

KEGG <- read.table("L2.txt",header = TRUE,sep = "\t")

這裡有一點需要說明,因為KEGG第一層分類中有幾個分類的名字特別長,因此需要處理一下,使其能夠實現自動換行

library(ggplot2)library(reshape2)
swr = function(string, nwrap = 12){
paste(strwrap(string,width = nwrap),collapse = "\n")
}
swr = Vectorize(swr)
KEGG$L1 <- swr(KEGG$L1)

接下來就可以畫圖了。

p <- ggplot(KEGG,aes(Abundance,L2)) +
geom_bar(aes(fill = L1),stat = "identity",width = 0.6) +
xlab("Relative abundance (%)") +
ylab("KEGG Pathway") +
theme(panel.background = element_rect(fill = "white",colour='black'),
panel.grid.major = element_line(color = "grey",linetype = "dotted",size = 0.3),
panel.grid.minor = element_line(color = "grey",linetype = "dotted",size = 0.3),
axis.ticks.length = unit(0.4,"lines"),
axis.ticks = element_line(color='black'),
axis.line = element_line(colour = "black"),
axis.title.x=element_text(colour='black', size=8,face = "bold"),
axis.title.y=element_text(colour='black', size=8),
axis.text.x=element_text(colour='black',size=8,
axis.text.y = element_text(color = "black",size =8),
legend.position = "none",
strip.text.y = element_text(angle =0,size =12,face = "bold")) +
facet_grid(L1~.,space = "free_y",scales = "free_y")

微生物群落基於KEGG預測功能的豐度分布圖繪製

保存圖片就OK了。

ggsave("L2.pdf", p, width = 183, height = 240, units = "mm")

png(filename="L2.png",res=600,height=7200,width=6000)
p
dev.off

PS:有些朋友可能想要把分面的文字放在圖像的左側,使其與代謝路徑的名稱放在一起,但是這個直接用ggplot2可能不行,因此把分面名稱放在左側之後,對其進行文字調整的參數就失效了,之前在群裡也討論過這個問題,據說是ggplot2的一個小bug,以後的更新中可能會修復。

後臺回復「功能預測」獲取示例文件和完整代碼。

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

相關焦點

  • 微生物群落多樣性測序與功能分析
    微生物群落測序是指對微生物群體進行高通量測序,通過分析測序序列的構成分析特定環境中微生物群體的構成情況或基因的組成以及功能。藉助不同環境下微生物群落的構成差異分析我們可以分析微生物與環境因素或宿主之間的關係,尋找標誌性菌群或特定功能的基因。
  • Science Bulletin:絕對豐度的植物根際微生物群落「擴增-選擇」組裝模型
    根際微生物群落「擴增-選擇」組裝新模型:左圖為基於微生物相對量的根際微生物群落「兩步選擇」組裝模型(two-step selection model),右圖為根際微生物群落「擴增-選擇」組裝新模型(Amplification-selection model)。
  • 微生物多樣性PICRUSt2功能預測雲分析來了
    微生物多樣性測序數據主要基於物種層面進行微生物群落分析,而功能預測軟體,可以幫我們預測微生物的潛在功能,近年來,由於PICRUSt等預測軟體的加持,為我們文章增加了不少亮點,在高分文章中屢見不鮮。基於16S rRNA圖譜預測微生物群落功能組成的PICRUSt軟體推出了將近7年,谷歌學術引用2700餘次;儘管PICRUSt在剛推出時非常受歡迎,但由於其所依賴的GreenGene 16S物種注釋資料庫在2013年以後就不再更新,資料庫信息有限,越來越無法滿足研究者的需求。
  • 「花式」微生物群落堆疊圖,你見過幾種?
    堆疊圖之所以能在文章中擁有這麼高的曝光度,原因在於堆疊圖非常直觀、簡潔地展示樣本的群落物種組成組成信息。通常堆疊圖橫軸為各樣本名稱信息,縱軸為物種的相對豐度,每個樣本所有物種組成一個堆疊起來的柱子,柱子中通過顏色區分不同物種(如圖1)。例如在梯度處理或是不同時期的樣本展示中,我們就可以通過堆疊圖一目了然地展示優勢物種的變化情況或是某些病原微生物隨時間的豐度增長狀況。
  • 土壤微生物生物地理學最新綜述
    對微生物群落與土壤功能關係認識的提高有助於在地方和全球尺度上預測生態功能。但是,理解不同微生物與土壤功能的聯繫以及微生物群落驅動生態系統多功能性的潛在機制需要進一步的研究。儘管支持微生物生物多樣性-功能關係的數據不斷增加,但這些研究大多數都是基於觀測數據,對於微生物類群與功能關係的實驗研究較少。
  • 科研 | Ecology:土壤微生物群落的空間和時間更替與原始熱帶森林的功能無關
    導讀土壤微生物群落的空間和時間更替在陸地生態系統中仍然存在很多未解之謎。然而,要將微生物群落納入生態預測和生態系統模型中,關鍵在於確定這些關係以及它們如何在生態系統和微生物譜系中變化。為了研究未受擾動土壤細菌和真菌豐度、多樣性、組成和功能的時間變化,在熱帶雨林中從4個成熟的原生林小區收集土壤,時間跨度為兩年。抽樣設計允許檢測空間(200米以內)和時間(季節和年)的變化。
  • 「花式」微生物群落堆疊圖,你見過幾種?
    通常堆疊圖橫軸為各樣本名稱信息,縱軸為物種的相對豐度,每個樣本所有物種組成一個堆疊起來的柱子,柱子中通過顏色區分不同物種(如圖1)。例如在梯度處理或是不同時期的樣本展示中,我們就可以通過堆疊圖一目了然地展示優勢物種的變化情況或是某些病原微生物隨時間的豐度增長狀況。
  • Science Bulletin:根際微生物群落「擴增-選擇」組裝新模型
    【歡迎您關注--農業環境科學】中國科學院分子植物科學卓越創新中心王二濤研究組及其合作團隊基於微生物絕對豐度提出了植物根際微生物群落「擴增-選擇」組裝的新模型。研究人員基於傳統的微生物相對豐度數據,提出了根際微生物群落的兩步或多步篩選組裝模型,該模型認為:微生物依次在根外土、根際土和根內逐步被篩選,形成植物根際特異的微生物群落。其中變形菌門(Proteobacteria)、擬桿菌門(Bacteroidetes)和放線菌門(Actinobacteria)是根際富集的主要菌群,而酸酐菌門(Acidobacteria)是根際排斥的主要菌群。
  • 研究人員提出根際微生物群落「擴增-選擇」組裝新模型
    基於傳統的微生物相對豐度(the relative abundance,通過高通量測序16S/18S rRNA基因獲得環境樣本中各微生物群落的相對組成)數據,研究人員提出了根際微生物群落的兩步或多步篩選組裝模型(two-step selection model 或者multi-step selection model),該模型認為:微生物依次在根外土(bulk soil)、根際土 (rhizosphere
  • PICRUSt 2——更加強大的菌群功能預測工具
    在16s微生物群落數據分析中,我們一般遵循著從整體到精細、從群落結構差異到功能差異的分析思路。其中,16s研究最常用的是第一類方法,基於預測軟體,獲得群落整體功能分類(pathway等)的大致分布,用於評估潛在的功能分布信息。這種功能分析方法成本低,只要有16s的測序數據就可以開展,不需要額外的數據進行補充。
  • PICRUSt 2——更加強大的菌群功能預測工具
    在16s微生物群落數據分析中,我們一般遵循著從整體到精細、從群落結構差異到功能差異的分析思路。在完成前期樣本整體層面的物種組成、α多樣性、β多樣性等分析之後,通過深入討論樣本中群落的功能,分析不同分組間群落存在的差異功能是一項必不可少的分析工作。功能分析在生物學價值上往往比單純的物種組成分析更加重要,在組間差異區分上功能分析也有獨特的意義。
  • Science Bulletin:上海植生所王二濤組發表基於絕對豐度的植物根際...
    model for quantified rhizosphere microbiota assembly」 的研究論文,該研究基於微生物絕對豐度提出了植物根際微生物群落 「擴增-選擇」 組裝的新模型。 基於微生物相對豐度的研究描述了不同植物物種根際微生物的群落組成及多樣性,但忽略了單位質量或體積中不同微生物群落的絕對豐度(the absolute abundance)。另外基於16S/18S rRNA基因的相對豐度研究忽視了不同細菌/真菌的16S/18S rRNA基因的拷貝數差異。
  • 美格基因|擴增子物種群落分析
    一、物種群落結構分析1、共有及特有OTU統計分析1)OTU 數目統計基於 OTU_table 統計 No. of OTUs,將 OTU 序列數大於 0 的全部記為 1,並對每列數求和,即為每個樣本的OTU 總數。
  • PICRUSt功能預測又被爆出新的問題啦!
    近年來,基於微生物群落組成數據預測功能圖譜的方法也在逐步發展。PICRUSt是其中最具代表性的一個方法,使用的也很廣泛。在本研究中,我們通過比對宏基因組和擴增子通過 PICRUSt預測得到的功能豐度進行差異分析來評估PICRUSt的表現。
  • 西安交大在基於人工智慧的微生物傳感器研究領域獲進展—新聞...
    西安交大在基於人工智慧的微生物傳感器研究領域獲進展
  • 海洋微生物群落的複雜性圖譜被繪製
    海洋微生物群落的複雜性圖譜被繪製 作者:小柯機器人 發布時間:2019/12/14 21:45:44 美國畢格羅海洋科學實驗室Ramunas Stepanauskas研究團隊通過單細胞基因組學對海洋微生物群落的複雜性進行了繪製
  • Nature子刊:微生物系統的功能與功能冗餘
    隨後對不同人類宿主腸道微生物群落的比較表明,不同宿主之間微生物群落的分類組成差異很大,而它們的群落基因含量卻高度保守(變化不大)。同樣,在一項對大型藻類澳洲石蓴(Ulva australis)的細菌群落調查中,群落構建似乎是基於功能基因而不是物種進行的。這些發現表明,不同的微生物組合表現出由環境選擇的相似的群落基因組成譜。
  • 城市環境所微生物群落環境響應研究獲進展
    土壤水分條件是微生物呼吸活性及生態功能實現的重要因素,乾旱或極端淹水均不利於土壤中多數微生物實現最佳能量生產與代謝。土壤從乾旱向淹水的轉變過程會在短時間內發生,微生物活動受到刺激並被抑制。目前,對該過程中潛在微生物的響應機制仍缺乏了解。
  • ​[2021-01003]鹽度是沙漠生態系統中土壤微生物群落的關鍵決定因素
    此外,該區域包括自然鹽度梯度,這可以為研究鹽度對土壤微生物群落的影響提供理想的簡化環境。這項研究的目的是(i)確定沙漠生態系統中微生物群落的多樣性和組成如何隨自然鹽度梯度變化;(ii)研究鹽度如何影響土壤微生物系統型和表型;以及(iii)探索鹽度如何影響土壤微生物群落組裝過程。