Nature子刊:HUMAnN2實現宏基因組和宏轉錄組種水平功能組成分析

2021-01-14 宏基因組


HUMAnN2實現宏基因組和宏轉錄組種水平功能組成分析

Species-level functional profiling of metagenomes and metatranscriptomes

Nature Methods, [IF 26.919],  Article, 2018-10-30

DOI: http://dx.doi.org/10.1038/s41592-018-0176-y

第一作者:Eric A. Franzosa, Lauren J. McIver

通訊作者:Curtis Huttenhower

主要單位:哈佛醫學院統計系;哈佛和麻省理工博德(Broad)研究所

其它作者:Gholamali Rahnavard,  Luke R. Thompson,  Melanie Schirmer,  George Weingart,  Karen Schwarzberg Lipson,  Rob Knight,  J. Gregory Caporaso,  Nicola Segata

簡介

HUMAnN是一款快速宏基因組功能組成定量工具,第一版2012年發表於PLoS computational biology (當年還沒有影響因子,最新17年3.9,歷史最高14年4.6),截止2018年11月1號Google Scholar統計引用557次。

HUMAnN2是HUMAnN1的升級版,可實現快速宏基因組、宏轉錄組的物種和功能定量,同時提供功能通路內物種組成信息,軟體在文章發表前已經在圈內廣泛使用,關於它的使用教程請參閱公眾號之前關於此軟體的教程和相關流程的文章。

有參分析

雖然HUMAnN第一版只發了3分水平的雜誌,是金子自然是要發光的,第二版HUMAnN2於2018年10月30日在線發表於《Nature Method》,影響因子高達26分,絕對是實至名歸。

今天就以Nature Method長達12頁的Article全文的要點進行解讀,帶大家進一步了解該軟體的魅力。

導讀

HUMAnN2是一款快速獲得宏基因組、宏轉錄組物種和功能組成的軟體;

與傳統的翻譯比對方法相比,採用分層式算法比對標記基因、泛基因組和蛋白資料庫,速度更快且準確率更高;

結果同時獲得功能通路中具體物種組成,建立起了物種與功能的聯繫,可進一步研究功能組成的貢獻者;

提出貢獻多樣性的概念,使我們從類多樣性角度重新認識微生物組功能組成,以及與物種間的聯繫;

完善的文檔和實戰教程,輕鬆上手實現宏基因組分析與多組學整合。

摘要

想要獲得微生物組的功能組成,常用的手段是採用宏基因組或宏轉錄組的手段進行研究。然而這些方法在分析階段非常耗時、產生大量錯誤比對結果,並通常僅獲得群體水平的定量。因此,我們開發了HUMAnN2軟體:採用分層式(tiered)檢索策略,可以在環境和宿主相關群體中快速、準確獲得種水平的功能組成。HUMAnN2採用比對泛基因組的方法鑑定群體的已知物種,並進一步翻譯檢索末分類的序列,最終定量基因家族和通路。與單純的翻譯檢索相比,HUMAnN2獲得的基因家族結果更快、更準確。應用HUMAnN2研究海洋代謝和生態貢獻模式的階梯變異(clinal variation),實現了人類微生物組通路、物種基因組變異與轉錄貢獻和株水平組成的分析。此外,作者引入了貢獻多樣性的概念(contributional diversity),以解釋不同微生物群體類型生態學組裝的模式。

主要圖表圖1. HUMAnN2分層式搜索在同類軟體中準確率最高


a. HUMAnN2分層式搜索算法獲得宏組學功能組成概覽。HUMAnN2的輸入文件為宏組學序列,即可以是DNA層面,也可以是RNA層面;第一步採用標記基因檢索已知物種;第二步層級檢索己知物種的泛基因組;第三步翻譯末知物種序列比對至蛋白資料庫;最後計算基因家族和通路的豐度,包括群體和物種層面。

b. 基於人工合成的腸道菌群評估HUMAnN2分層搜索與純翻譯搜索方法間異同。c, d 計算基因家族(c)和通路(d)豐度組成的敏感度、精度和總準確度(1 - Bray-Curtis差異)。HUMAnN2分層搜索各評估指標完勝,非常接近真實情況。

e. HUMAnN2與其它方法在8核CPU條件下比較群體COG定量計算結果。HUMAnN2分層算法在精度和準確率上最優,運行時間和敏感性次優,內存消耗水平中等。

圖2. 人類核心微生物組的貢獻多樣性

a. 人類微生物組計劃(HMP)宏基因組的核心代謝通路(點)樣本內和樣本間的貢獻多樣性。星號代表整體個群體背景物種水平的多樣性。樣本分別為自前鼻孔(Anterior nares)、舌背(Tongue dorsum)、糞便(Stool)和陰道後穹隆(Posterior fornix)。橫坐標是樣本內Gini-Simpson方法計算的貢獻多樣性(contributional diversity),縱坐標為基於Bray-Curtis距離計算的樣本間貢獻多樣性;點代表每類樣本中核心通路;顏色為按兩種貢獻多樣性指數對通路進行分類十字分類為四組:紫色代表樣本內貢獻多樣性低(即多樣性簡單)、樣本間貢獻多樣性高(變異程度大,可變);紅色代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性高(可變);藍色為樣本內貢獻多樣性低(簡單)、樣本間貢獻多樣性低(保守);黃色代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性低(保守)。圖中數字顏色與顏色點數量對應。貢獻多樣性的提出,使我們從新的角度來認識微生物組功能組成,以及與物種間的聯繫。

b-e為四種極端多樣性的例子。橫坐標為樣本,縱坐標為通路對應貢獻菌的Log10轉換相對豐度。物種和末分類的分層結果採用線性(比例)標準化為總體的柱高度。

紅色的磷酸泛酸生物合成通路(Phosphopantothenate biosynth., PANTO-PWY)代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性高(可變)的典型。即同一功能通路有很多物種擁有,且在同類樣品間波動非常大。

黃色的嘌呤核糖核苷降解(Purine ribonucleosides
degradation, PWY0-1296)通路代表樣本內貢獻多樣性高(複雜)、樣本間貢獻多樣性低(保守)的典型。即同一功能有很多物種擁有,且在同類樣品間各物種保持穩定的比例。

紫色腺苷核苷酸從頭生物合成(Adenosine ribonucleotides de novo biosynth.,  PWY-7219)通路代表樣本內貢獻多樣性低(即多樣性簡單)、樣本間貢獻多樣性高(變異程度大,可變)。即同一通路,只由少數幾種菌才擁有的功能,但在樣本間種類變化較大。

藍色戊二醯輔酶降解(Glutaryl-CoA
degradation, PWY-5177)通路代表樣本內貢獻多樣性低(簡單)、樣本間貢獻多樣性低(保守)。即同一通路,只由少數幾種菌才擁有的功能,且在樣本間各種類貢獻比例穩定。

圖3. 海洋浮遊生物界溫躍層相關微生物的酶

a-e, 45個紅海宏基因組樣本顯示5個KEGG Orthogroups(KOs)與溫度明顯相關。全部採用HUMAnN2分析重新定量,且與原始發表結果相關。f. HUMAnN2和HUMAnN1定量4609個KOs結果的皮爾森相關係數。』GAIW』是亞丁灣中層水(Gulf of Aden Intermediate Water)的縮寫, 它是紅海中冷且營養富集的水團。共45個樣本按深度分組,其中258m歸類為500m樣本組,按緯度著色,藍色代表紅海北部,紅色代表紅海南部。

圖4. HUMAnN2實現宏轉錄組定量和多組學整合

a. 78對炎症性腸病(inflammatory bowel disease, IBD)患者個體宏基因組和宏轉錄組的181個核心功能通路樣本內貢獻多樣性的相關分布散點圖,點的顏色為RNA與DNA比值的對數;我們看到DNA層面多樣性更高,因為RNA層面只是可轉錄的部分,多樣性肯定小於DNA。

B. 宏基因組(DNA)和宏轉錄組(RNA)在蔗糖降解(sucrose degradation, PWY-621)通路的物種組成。在DNA層面有非常高的樣本內貢獻多樣性,但在RNA層面樣本內貢獻多樣性很低。而且此樣式在IBD、節段性迴腸炎/克羅恩氏病(Crohn’s disease, CD)、潰瘍性結腸炎(ulcerative colitis, UC), 和非IBD對照中保守存在。每個樣品中此通路的物種貢獻重新標準化為1並使用堆疊柱狀圖展示。

總結

HUMAnN2功能分層引入了群體水平多樣性類似的概念——貢獻多樣性,開啟了微生物組功能新的分析角度。群體水平的功能比群體的物種組成更保守,與生態位定義的功能庫一致,並滿足不同的微生物聚集體。功能多樣性增加了另一層含義:一些功能在群體中均勻分布,另一些僅限某些物種。相似的,現代的多組學分析微生物群體,主要分為群體功能潛能(基因組)和功能活性(基因或蛋白表達)。貢獻多樣性提供了一種新的研究手段,如發現廣泛編碼的功能僅由1種或幾種物種主導表達。

HUMAnN2方法打開了宏組學中功能多樣性宏分析的領域,具有如下新發現的潛能:

(i) 新微生物群體的生化與信號;

(ii) 功能的物種來源和貢獻多樣性樣式;

(iii) 種水平精度的功能潛能與活性間的差異。

在人類微生物組中,HUMAnN2提供了驗證與健康相關聯功能的種、株水平假設的機會。為支持這些將來的發現,此方法發布為開源、幫助文檔完善的軟體,提供測試數據和學習材料,並且有活躍的用戶群。網址:http://huttenhower.sph.harvard.edu/humann2

Reference

HUMAnN軟體第一版引文:Abubucker, Sahar, Nicola Segata, Johannes Goll, Alyxandria M. Schubert, Jacques Izard, Brandi L. Cantarel, Beltran Rodriguez-Mueller et al. 「Metabolic reconstruction for metagenomic data and its application to the human microbiome.」 PLoS computational biology 8, no. 6 (2012): e1002358.

HUMAnN2軟體第二版引文:Franzosa EA, McIver LJ, Rahnavard G, Thompson LR, Schirmer M, Weingart G, Schwarzberg Lipson K, Knight R, Caporaso JG, Segata N, Huttenhower C. Species-level functional profiling of metagenomes and metatranscriptomes. Nat Methods 15: 962-968 (2018).

用戶手冊:https://bitbucket.org/biobakery/humann2/wiki/Home

教程:https://bitbucket.org/biobakery/biobakery/wiki/humann2

軟體中文教程:HUMAnN2:人類微生物組統一代謝網絡分析2

以HUMAnN2為核心的分析流程,推薦:宏基因組有參流程Metagenomics Tutorial (HUMAnN2)

猜你喜歡猜你喜歡

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公眾號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧秘  

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍末解決群內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」

相關焦點

  • 技術貼 | 宏基因組 + 宏轉錄組分析工具:HUMAnN
    宏轉錄組測序數據進行物種分類分析和功能(代謝)分析的多功能軟體【1】一.HUMAnN 第一版 2012 Curtis Huttenhower團隊使用該方法還特意分別做了口腔、糞便宏基因組與宏轉錄組關係的研究【2】。該研究於2014年發表於PNAS,他們發現: 1)冷凍、乙醇、RNAlater三種保存條件中的微生物群落、宏基因組和宏轉錄組高度一致。
  • HUMAnN2:人類微生物組統一代謝網絡分析2
    關於宏基因組常用的有參分析流程,主要是快速獲得物種組成和功能組成,之前分享了今天再介紹來自同一作者的另一個軟體,可以一步完成功能和代謝組成
  • 宏基因組02. HUMAnN2 --宏基因組代謝通路分析
    本系列課程前情回顧宏基因組分析00. 概述和分析環境的部署宏基因組分析01.
  • 2019微生物組—宏基因組分析專題培訓第三期
    宏基因組簡介發展史、常用技術適用範圍、分析思路22宏基因組有參質控FastQC、Trimmomatic、 MultiQC、KneadData質控、parallel並行計算23物種和功能組成MetaPhlAn2物種組成、HUMAnN2功能組成、功能關聯驅動物種24物種和功能差異比較和可視化LEfSe、STAMP、R語言統計25發表前準備圖片排版、數據釋放、代碼整理(可選)26網絡繪製Cytoscape
  • 微生物組學數據分析工具綜述 | 16S+宏基因組+宏病毒組+宏轉錄組
    、鳥槍法打斷全基因組DNA序列的Metagenomics和基於mRNA信息的宏轉錄組方法Meta-transcriptomics。下面來說說大家關注的宏基因組。宏基因組這部分,生信者言李木子童鞋也曾經給大家做過系統梳理和點評:《精選30餘款宏基因組分析軟體,來自老司機的使用經驗總結(上篇)》、《精選30餘款宏基因組分析軟體,來自老司機的使用經驗總結(中篇)》、《精選30餘款宏基因組分析軟體,來自老司機的使用經驗總結(下篇)》、《句句乾貨!一文讀懂宏基因組binning》。
  • 宏基因組bining+宏轉錄組強強聯合
    採用宏基因組genome bining以及宏轉錄組的方法,發現並驗證新物種和新功能。然而,這些微生物的種屬和生理特性在很大程度上是未知的。通過功能宏基因組學的方法,研究者從酸性泥炭地中恢復了7株新的酸桿菌基因組草圖,這些酸桿菌都具有潛在的異化亞硫酸鹽(dsrAB, dsrC, dsrD, dsrN, dsrT, dsrMKJOP)或硫酸鹽呼吸(sat, aprBA, qmoABC和dsr)相關功能基因。
  • 宏基因組生信分析方法
    宏基因組的分析策略主要分為:(1)基於拼接的分析;(2)不基於拼接的分析。又可以分為:(1)物種注釋分析;(2)功能注釋分析;(3)差異物種分析;(4)差異基因分析。可構建多物種基因組,但只有達到足夠覆蓋度的物種才能被較好地組裝。
  • 9文聚焦:宏基因組學與微生物組分析方法和工具
    (綜述)Annual Review of Microbiology——[11]① 鳥槍法宏基因組測序改變了我們檢測和表徵複雜微生物群落多樣性和功能的能力;② 本文介紹了宏基因組學的優點及使用當前可用分析工具所能得出的結論,例如種株解析度的物種和功能組成
  • DNA/RNA-SIP與宏基因組
    在最初開發基於DNA和RNA的SIP之後的幾年中,通常的做法是通過靶向基因分析來表徵標記的種群。此類方法通常涉及基於指紋的分析或對包含16SrRNA基因或功能標記基因擴增子的克隆文庫進行測序。儘管分子指紋技術仍然是快速確認同位素標記的一種有價值的方法,但隨著測序技術的發展,可以利用擴增子、宏基因組或宏轉錄組對DNA-SIP實驗進行研究。不僅可以從宏基因組中推斷微生物群的豐度,而且研究人員可以將單個基因組儲存、組裝並且探索建立有關標記微生物代謝能力的假說。
  • 宏基因組公共數據挖掘基因組集再發Nature
    score(QS*)值大於 50 的中等質量 MAGs(圖2); ④ MAGs 重現:分別用 2 種方法(MetaWRAP 和 co-assembly)重現上述得到的 MAGs,98% 的 MAGs 均得到重現(圖3),說明本研究得到的 MAGs 具有穩定性和可重現性;⑤ 去除非原核生物的 bins,最後獲得 39,891 個精細 MAGs;⑥ 比對資料庫
  • 微生物組學從入門到精通(9) :功能組成快速鑑定-HUMAnN2
    第九節獲取完整視頻,請聯繫客服HUMAnN2簡介HUMAnN2.0是一款基於宏基因組或宏轉錄組測序數據獲得微生物群落功能通路信息的分析流程,旨在描述群落成員及其代謝潛能。工作原理先用metaphlan2(default)處理DNA或RNA的reads,產出物種鑑定結果,然後選擇相對豐度大於0.01%的物種的泛基因組(即某一物種不同菌株的全部基因)進行bowtie2建庫,然後所有樣本的reads 以sensitive mode進行比對並計算豐度。
  • 快速看懂腸道菌群宏基因組測序分析報告
    宏基因組測序通過對微生物基因組隨機打斷,並通過組裝將小片段拼接成較長的序列。因此,在物種鑑定過程中,宏基因組測序具有較高的優勢。Tips:通常情況下,建議同時結合宏基因組測序和16S測序兩種技術手段,可以更高效、更準確地研究微生物群落組成結構、多樣性以及功能情況。
  • 宏基因組技術在婦產科領域的廣泛應用
    今年Nature子刊Nature Communication發表了全面的非冗餘基因目錄揭示人類陰道內廣泛的物種多樣性,通過使用多個數據集,以及多樣本的核酸提取,文庫構建以及宏基因組和宏轉錄組測序,構建人類陰道非冗餘基因目錄(VIRGO),並對其進行分類和注釋。構建蛋白質家族的陰道直系同源群(VOG),並進行生物學分析。
  • 資源分享 | 微生物組分析必備書籍《Microbiome Analysis》
    微生物組分析常見的微生物組分析流程是這樣的:收集樣本(例如,土壤、水、糞便),提取DNA,進行DNA測序,並使用生物信息學工具來描述微生物組的重要特性。迄今為止,微生物多樣性的主要載體是16S rRNA基因,這一直微生物研究的重點手段之一。但是在獲取微生物群落的分類組成的同時,16S rRNA基因測序在揭示功能多樣性的能力上是有限的,需要別的方法來彌補這個缺陷。
  • 美格基因微生物多組學聯合文章刊登ISME!
    本研究利用16S+宏基因組+轉錄組+宏代謝組多組學聯合分析,對慢性阻塞性肺疾病呼吸道微生物群落的功能特徵進行了探究,並揭示了與慢性阻塞性肺疾病發病相關的「菌群-代謝物-宿主靶點」的互作關係,證實了利用公共多組學數據集成分析來研究微生物組-宿主互作關係的可能性。本文第一作者及通訊作者為華南師範大學生命科學學院王璋研究員。
  • 多快好省的宏基因組研究技巧
    )2、對整個群落DNA進行測序,獲取全部微生物基因組進而進行分類和功能分析的策略(鳥槍法宏基因組測序shotgun metagenomics)。不過,對於內存的要求較高,另外受資料庫本身質量影響較大,默認kraken2的參考資料庫只包括了細菌、古菌、病毒和人,還需要添加其他域的參考基因組。但涵蓋的測序參考種仍然有限,對於菌株水平的鑑定受一定影響。
  • Cell子刊新成果:建立人類精子發生過程高精度轉錄組圖譜
    8月30日,這一由中國團隊完成的新研究在國際知名學術期刊《Cell Stem Cell》上在線發表,他們首次從單細胞水平系統闡明了人類精子發生過程中的基因表達調控網絡和細胞命運轉變路徑,繪製了人類精子發生的高精度單細胞轉錄組圖譜,解析了成年男性全部生殖細胞類型及其關鍵的分子標記,並初步探索了將單細胞轉錄組技術用於人類非梗阻性無精症的研究和診斷。
  • Nature子刊:微生物系統的功能與功能冗餘
    c、基於京都基因與基因組百科全書(KEGG)劃分的基因組成;d、自定義的代謝基因組成。每一列代表一個樣本,每一種顏色代表一個基因組。值得注意的是,與相對保守的宏基因組組成相比,鳳梨科植物的微生物分類組成更為多變。穩定的功能組成和多樣分類組成之間的鮮明對比,在之前的研究中已經有所發現,反映了許多功能和系統發育之間的弱相關關係。
  • 南土所褚海燕組綜述微生物組學的技術和方法及其應用
    1998年, 威斯康辛大學的Hand­e­lsman等(1998)首次提出宏基因組的概念, 其研究對象為特定環境中的總DNA。宏轉錄組則興起於宏基因組之後, 它以特定環境中的全部RNA為研究對象, 探究全部基因組的轉錄水平, Leininger等(2006)首次使用454焦磷酸測序技術對複雜微生物群落進行宏轉錄組研究。
  • 宏基因組方法學研究取得進展
    ,已成為研究微生物群落組成、結構及功能最主要的技術手段。這是因為16S rRNA序列在宏基因組拼接時被視為重複序列,或被拼接到一起,或被捨棄,無法建立其與側翼的蛋白編碼基因的連接,導致16S rRNA物種譜信息與功能基因譜信息的割裂。這給環境微生物物種多樣性(尤其是種下多態性)和功能多樣性的研究帶來嚴重障礙。