Species-level functional profiling of metagenomes and metatranscriptomes
Nature Methods, [IF 26.919], Article, 2018-10-30
DOI: http://dx.doi.org/10.1038/s41592-018-0176-y
第一作者:Eric A. Franzosa, Lauren J. McIver
通訊作者:Curtis Huttenhower
主要單位:哈佛醫學院統計系;哈佛和麻省理工博德(Broad)研究所
其它作者:Gholamali Rahnavard, Luke R. Thompson, Melanie Schirmer, George Weingart, Karen Schwarzberg Lipson, Rob Knight, J. Gregory Caporaso, Nicola Segata
簡介HUMAnN是一款快速宏基因組功能組成定量工具,第一版2012年發表於PLoS computational biology (當年還沒有影響因子,最新17年3.9,歷史最高14年4.6),截止2018年11月1號Google Scholar統計引用557次。
HUMAnN2是HUMAnN1的升級版,可實現快速宏基因組、宏轉錄組的物種和功能定量,同時提供功能通路內物種組成信息,軟體在文章發表前已經在圈內廣泛使用,關於它的使用教程請參閱公眾號之前關於此軟體的教程和相關流程的文章。
有參分析
雖然HUMAnN第一版只發了3分水平的雜誌,是金子自然是要發光的,第二版HUMAnN2於2018年10月30日在線發表於《Nature Method》,影響因子高達26分,絕對是實至名歸。
今天就以Nature Method長達12頁的Article全文的要點進行解讀,帶大家進一步了解該軟體的魅力。
導讀HUMAnN2是一款快速獲得宏基因組、宏轉錄組物種和功能組成的軟體;
與傳統的翻譯比對方法相比,採用分層式算法比對標記基因、泛基因組和蛋白資料庫,速度更快且準確率更高;
結果同時獲得功能通路中具體物種組成,建立起了物種與功能的聯繫,可進一步研究功能組成的貢獻者;
提出貢獻多樣性的概念,使我們從類多樣性角度重新認識微生物組功能組成,以及與物種間的聯繫;
完善的文檔和實戰教程,輕鬆上手實現宏基因組分析與多組學整合。
摘要想要獲得微生物組的功能組成,常用的手段是採用宏基因組或宏轉錄組的手段進行研究。然而這些方法在分析階段非常耗時、產生大量錯誤比對結果,並通常僅獲得群體水平的定量。因此,我們開發了HUMAnN2軟體:採用分層式(tiered)檢索策略,可以在環境和宿主相關群體中快速、準確獲得種水平的功能組成。HUMAnN2採用比對泛基因組的方法鑑定群體的已知物種,並進一步翻譯檢索末分類的序列,最終定量基因家族和通路。與單純的翻譯檢索相比,HUMAnN2獲得的基因家族結果更快、更準確。應用HUMAnN2研究海洋代謝和生態貢獻模式的階梯變異(clinal variation),實現了人類微生物組通路、物種基因組變異與轉錄貢獻和株水平組成的分析。此外,作者引入了貢獻多樣性的概念(contributional diversity),以解釋不同微生物群體類型生態學組裝的模式。
主要圖表圖1. HUMAnN2分層式搜索在同類軟體中準確率最高a. HUMAnN2分層式搜索算法獲得宏組學功能組成概覽。HUMAnN2的輸入文件為宏組學序列,即可以是DNA層面,也可以是RNA層面;第一步採用標記基因檢索已知物種;第二步層級檢索己知物種的泛基因組;第三步翻譯末知物種序列比對至蛋白資料庫;最後計算基因家族和通路的豐度,包括群體和物種層面。
b. 基於人工合成的腸道菌群評估HUMAnN2分層搜索與純翻譯搜索方法間異同。c, d 計算基因家族(c)和通路(d)豐度組成的敏感度、精度和總準確度(1 - Bray-Curtis差異)。HUMAnN2分層搜索各評估指標完勝,非常接近真實情況。
e. HUMAnN2與其它方法在8核CPU條件下比較群體COG定量計算結果。HUMAnN2分層算法在精度和準確率上最優,運行時間和敏感性次優,內存消耗水平中等。
圖2. 人類核心微生物組的貢獻多樣性a. 人類微生物組計劃(HMP)宏基因組的核心代謝通路(點)樣本內和樣本間的貢獻多樣性。星號代表整體個群體背景物種水平的多樣性。樣本分別為自前鼻孔(Anterior nares)、舌背(Tongue dorsum)、糞便(Stool)和陰道後穹隆(Posterior fornix)。橫坐標是樣本內Gini-Simpson方法計算的貢獻多樣性(contributional diversity),縱坐標為基於Bray-Curtis距離計算的樣本間貢獻多樣性;點代表每類樣本中核心通路;顏色為按兩種貢獻多樣性指數對通路進行分類十字分類為四組:紫色代表樣本內貢獻多樣性低(即多樣性簡單)、樣本間貢獻多樣性高(變異程度大,可變);紅色代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性高(可變);藍色為樣本內貢獻多樣性低(簡單)、樣本間貢獻多樣性低(保守);黃色代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性低(保守)。圖中數字顏色與顏色點數量對應。貢獻多樣性的提出,使我們從新的角度來認識微生物組功能組成,以及與物種間的聯繫。
b-e為四種極端多樣性的例子。橫坐標為樣本,縱坐標為通路對應貢獻菌的Log10轉換相對豐度。物種和末分類的分層結果採用線性(比例)標準化為總體的柱高度。
紅色的磷酸泛酸生物合成通路(Phosphopantothenate biosynth., PANTO-PWY)代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性高(可變)的典型。即同一功能通路有很多物種擁有,且在同類樣品間波動非常大。
黃色的嘌呤核糖核苷降解(Purine ribonucleosides
degradation, PWY0-1296)通路代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性低(保守)的典型。即同一功能有很多物種擁有,且在同類樣品間各物種保持穩定的比例。
紫色腺苷核苷酸從頭生物合成(Adenosine ribonucleotides de novo biosynth., PWY-7219)通路代表樣本內貢獻多樣性低(即多樣性簡單)、樣本間貢獻多樣性高(變異程度大,可變)。即同一通路,只由少數幾種菌才擁有的功能,但在樣本間種類變化較大。
藍色戊二醯輔酶降解(Glutaryl-CoA
degradation, PWY-5177)通路代表樣本內貢獻多樣性低(簡單)、樣本間貢獻多樣性低(保守)。即同一通路,只由少數幾種菌才擁有的功能,且在樣本間各種類貢獻比例穩定。
a-e, 45個紅海宏基因組樣本顯示5個KEGG Orthogroups(KOs)與溫度明顯相關。全部採用HUMAnN2分析重新定量,且與原始發表結果相關。f. HUMAnN2和HUMAnN1定量4609個KOs結果的皮爾森相關係數。』GAIW』是亞丁灣中層水(Gulf of Aden Intermediate Water)的縮寫, 它是紅海中冷且營養富集的水團。共45個樣本按深度分組,其中258m歸類為500m樣本組,按緯度著色,藍色代表紅海北部,紅色代表紅海南部。
圖4. HUMAnN2實現宏轉錄組定量和多組學整合a. 78對炎症性腸病(inflammatory bowel disease, IBD)患者個體宏基因組和宏轉錄組的181個核心功能通路樣本內貢獻多樣性的相關分布散點圖,點的顏色為RNA與DNA比值的對數;我們看到DNA層面多樣性更高,因為RNA層面只是可轉錄的部分,多樣性肯定小於DNA。
B. 宏基因組(DNA)和宏轉錄組(RNA)在蔗糖降解(sucrose degradation, PWY-621)通路的物種組成。在DNA層面有非常高的樣本內貢獻多樣性,但在RNA層面樣本內貢獻多樣性很低。而且此樣式在IBD、節段性迴腸炎/克羅恩氏病(Crohn’s disease, CD)、潰瘍性結腸炎(ulcerative colitis, UC), 和非IBD對照中保守存在。每個樣品中此通路的物種貢獻重新標準化為1並使用堆疊柱狀圖展示。
總結HUMAnN2功能分層引入了群體水平多樣性類似的概念——貢獻多樣性,開啟了微生物組功能新的分析角度。群體水平的功能比群體的物種組成更保守,與生態位定義的功能庫一致,並滿足不同的微生物聚集體。功能多樣性增加了另一層含義:一些功能在群體中均勻分布,另一些僅限某些物種。相似的,現代的多組學分析微生物群體,主要分為群體功能潛能(基因組)和功能活性(基因或蛋白表達)。貢獻多樣性提供了一種新的研究手段,如發現廣泛編碼的功能僅由1種或幾種物種主導表達。
HUMAnN2方法打開了宏組學中功能多樣性宏分析的領域,具有如下新發現的潛能:
(i) 新微生物群體的生化與信號;
(ii) 功能的物種來源和貢獻多樣性樣式;
(iii) 種水平精度的功能潛能與活性間的差異。
在人類微生物組中,HUMAnN2提供了驗證與健康相關聯功能的種、株水平假設的機會。為支持這些將來的發現,此方法發布為開源、幫助文檔完善的軟體,提供測試數據和學習材料,並且有活躍的用戶群。網址:http://huttenhower.sph.harvard.edu/humann2
ReferenceHUMAnN軟體第一版引文:Abubucker, Sahar, Nicola Segata, Johannes Goll, Alyxandria M. Schubert, Jacques Izard, Brandi L. Cantarel, Beltran Rodriguez-Mueller et al. 「Metabolic reconstruction for metagenomic data and its application to the human microbiome.」 PLoS computational biology 8, no. 6 (2012): e1002358.
HUMAnN2軟體第二版引文:Franzosa EA, McIver LJ, Rahnavard G, Thompson LR, Schirmer M, Weingart G, Schwarzberg Lipson K, Knight R, Caporaso JG, Segata N, Huttenhower C. Species-level functional profiling of metagenomes and metatranscriptomes. Nat Methods 15: 962-968 (2018).
用戶手冊:https://bitbucket.org/biobakery/humann2/wiki/Home
教程:https://bitbucket.org/biobakery/biobakery/wiki/humann2
軟體中文教程:HUMAnN2:人類微生物組統一代謝網絡分析2
以HUMAnN2為核心的分析流程,推薦:宏基因組有參流程Metagenomics Tutorial (HUMAnN2)
猜你喜歡猜你喜歡10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦
系列教程:微生物組入門 Biostar 微生物組 宏基因組
專業技能:學術圖表 高分文章 生信寶典 不可或缺的人
一文讀懂:宏基因組 寄生蟲益處 進化樹
必備技能:提問 搜索 Endnote
文獻閱讀 熱心腸 SemanticScholar Geenmedical
擴增子分析:圖表解讀 分析流程 統計繪圖
16S功能預測 PICRUSt FAPROTAX Bugbase Tax4Fun
在線工具:16S預測培養基 生信繪圖
科研經驗:雲筆記 雲協作 公眾號
編程模板: Shell R Perl
生物科普: 腸道細菌 人體上的生命 生命大躍進 細胞暗戰 人體奧秘
寫在後面為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍末解決群內討論,問題不私聊,幫助同行。
學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」