mSystems:蘇曉泉、徐健等發布全球微生物組結構和功能搜索平臺2.0

2021-02-26 宏基因組

Microbiome Search Engine 2 第二代微生物組搜尋引擎:全球微生物組結構和功能搜索的平臺

Microbiome Search Engine 2: a Platform for Taxonomic and Functional Search of Global Microbiomes on the Whole Microbiome Level

mSystems [6.633]

原文連結:https://doi.org/10.1128/mSystems.00943-20

第一作者:Gongchao Jing, Lu Liu

通訊作者:Jian Xu(徐健), Xiaoquan Su(蘇曉泉)

主要單位:青島大學計算機科學技術學院,中國科學院青島生物能源與過程研究所單細胞中心

摘要

      來自不同環境的宏基因組數據集的數量正在迅速增長。隨之而來的問題也不斷湧現,例如如何快速的訪問某一數據集,以及如何快速的通過對比發現新微生物群落與現有微生物群落之間的關聯等。Microbiome Search Engine 2(MSE 2)是第二代的微生物組搜尋引擎,為解決以上類型的問題提供良好的解決方案。MSE 2可以根據微生物組整體的物種結構或功能,在全球已有的微生物組數據集中搜索高度匹配的樣本。MSE 2由以下三部分組成:(i)不斷更新的微生物組資料庫。該資料庫目前包含來自於798項研究的250,000多個宏基因組和16S rRNA擴增子樣本,每一個樣本的測序數據和元數據都進行了統一化處理;(ii)增強的搜尋引擎。實時級快速搜索,能夠在0.5秒內,從整個資料庫中搜索到與給定的微生物組在整體組成或功能上最相似的樣本;(iii)基於Web的圖形界面。用戶可通過http://mse.ac.cn免費訪問MSE 2。該網站提供了簡單易用的圖形界面,方便用戶快速上手樣本搜索、數據瀏覽等操作,同時也為自定義的搜索提供了教程。如果用戶想對自有的微生物組數據集來構建資料庫並進行搜索,我們在GitHub (https://github.com/qibebt-bioinfo/meta-storms)上也提供了MSE 2搜尋引擎的內核程序。

關鍵詞

擴增子(amplicon),宏基因組(metagenome),微生物組(microbiome),在線服務(online service),搜尋引擎(search engine)

前言

      宏基因組學能夠建立起微生物組與周圍環境之間的動態關聯,已被廣泛應用於探索不同環境中的微生物群落,比如環境狀況的改變 [1,2],疾病發展 [3-7],藥物反應 [8,9]等。隨著取樣策略和測序技術的快速發展,海量的微生物組數據集正在不斷產生,包括16S rRNA基因擴增子測序數據和鳥槍法宏基因組測序(shotgun whole-genome sequencing, WGS)數據。這些數據集既來自於大型的研究項目例如Human Microbiome Project [10]、Earth Microbiome Project [11]、American Gut Project [12], 以及Tara Oceans [13],也來自於小型的研究項目甚至個人。這些數據大都存儲在通用的DNA序列存儲庫(例如NCBI SRA [14])或微生物組特異性資料庫(例如MG-RAST [15]和EBI Metagenomics [16])中。為了有效的對這些數據進行大規模的數據挖掘,目前已經有了幾款使用統一序列處理和標準操作流程(SOP) [17]的分析管理平臺,例如Qiita [18],gcMeta [19]和GMrepo [20]等。這些工具通常都提供基於Taxonomy分類單元(例如物種名稱)、序列片段甚至是類似於結構化查詢語言(SQL)的元數據查詢。但是,當新的微生物組產生後,仍然不能根據其整體尺度上物種或者功能組成的相似性,從現有資料庫中搜索到高度相似的匹配樣本。為了填補這一領域的空缺,前期我們開發了微生物組搜尋引擎Microbiome Search Engine(MSE)[21],並實現了一種基於菌群大數據搜索的多疾病檢測新策略,尤其是在處理多隊列數據、多測序平臺數據和抵抗汙染物的方面表現出了顯著的優勢 [22]。但是,MSE也有它的局限性,即僅支持16s rRNA擴增子測序數據,因此MSE只能針對擴增子OTU(Operational Taxonomy Unit)的相似性進行搜索 [21]。

      Microbiome Search Engine 2(http://mse.ac.cn)是第二代微生物組搜尋引擎。它突破了以上的限制,不僅同時支持16S rRNA擴增子測序數據和鳥槍法宏基因組測序數據作為搜索輸入(圖1a),而且在「物種組成」相似性基礎上,增加了根據微生物組「功能」相似性的搜索。MSE 2包括以下三個主要部分(圖1b):

(i)不斷更新的微生物組資料庫。該資料庫目前包含來自於798項研究的250,000多個WGS宏基因組和16S rRNA擴增子樣本,每一個樣本的測序數據和元數據都進行了統一化處理;

(ii)增強的搜尋引擎。實時級快速搜索,能夠在0.5秒內,從整個資料庫中搜索到與給定的微生物組在整體組成或功能上最相似的樣本;

(iii)基於Web的圖形界面。用戶可通過http://mse.ac.cn免費訪問MSE 2。該網站提供了簡單易用的圖形界面,方便用戶快速上手樣本搜索、數據瀏覽等操作,同時也為自定義的搜索提供了教程。

結果

微生物組資料庫

(i)數據的收集和歸納整理。MSE 2的數據主要來自Qiita [18]、EBI [16]、SRA [14]和MG-RAST [15]這幾個數據倉儲。為了保證微生物組樣本之間的技術可比性和可檢索性,我們對這些樣本進行了統一化的處理:一是在保留原始元數據的基礎上,我們從每項研究和以及其樣本中選擇比較常用的元數據項,將其手工整理成統一的特定格式(表1);二是我們根據序列類型(基於擴增子測序或基於WGS測序;表2),對序列進行了統一的預處理和分析。

(ii)資料庫統計數據。通過對數據的預處理和整合後,共有來自798個項目/研究的250,273個微生物組樣本收錄進了MSE2的資料庫,其中鳥槍法宏基因組測序樣本有14,957個,16S rRNA擴增子測序樣本共有235,334個。從採樣源分布來看(圖2),人體菌群樣本最多(共佔52.8%,其中:腸道,34.2%;皮膚,9.1%;口腔,6.4%,等),接下來依次是來自動物(23.7%)、土壤(6.4%)、室內環境(5.7%)和海洋環境(2.7%)。

(iii)資料庫的組織和管理。所有微生物組樣本被組織成兩個維度(圖3)。對於基於web的數據瀏覽(參考下面的「數據瀏覽和下載」部分),樣本是按照其所屬的研究項目進行組織的,可以通過各種元數據(如棲息地、序列類型、年份等)進行選擇和過濾。對於基於微生物組結構或功能相似性的搜索,樣品會根據多種特徵的組合(例如,OTU,物種,或KO(KEGG Orthology)功能注釋)進行組織,以進行索引和搜索(詳情請參閱下面的「增強的微生物組搜尋引擎」部分)。

增強的微生物組搜尋引擎

(i)全微生物組水平的搜索。MSE 2的搜尋引擎內核由C++編寫,並使用OpenMP技術實現了並行計算和優化。每次搜索,MSE 2都會檢索整個微生物組資料庫,以找到結構或功能相似性最高的最佳匹配樣品。搜索結果包含匹配項的物種組成或功能概況,匹配項與搜索使用的樣本的相似程度及元數據信息(請參見「搜索及結果展示」的部分以了解更多詳細信息)。與先前版本MSE [21]相比,MSE 2除了支持基於16S rRNA OTU,還增加了基於物種名稱和基於代謝功能(KO)的搜索(圖4a)。

(ii)搜索速度和任務調度。得益於兩級索引的搜索策略(圖4b),MSE2的搜索速度要比窮舉搜索快1至2個數量級。為了測試MSE 2的索引效率和搜索速度,我們對整個資料庫執行了基於OTU、基於物種和基於功能的搜索,並將搜索時間與禁用索引的窮舉搜索(窮舉搜索僅用於內部評估,未在MSE 2的線上服務中提供)進行比較。每個過程重複10次,每一次僅對搜索耗時進行記錄和比較(不包括數據上傳時間,可視化時間和Web頁面加載時間,以避免由於系統和網絡延遲引起的潛在偏差)。結果顯示,對於基於OTU,基於物種和基於功能(KO)的搜索,兩級索引策略分別將搜索速度分別提高了193倍、15倍和605倍(圖4c和表3)。針對超過250,000個樣本的全微生物組級搜索的實時響應在0.5 s之內。另外,在線搜索服務遵循基於隊列的任務調度實現的「先到先服務」的原則,從而有效地利用了計算資源。

基於web的圖形化入口

(i)基於Web的用戶界面。MSE2的網址是http://mse.ac.cn,可通過任何Web瀏覽器免費訪問。該網站的後臺程序使用PHP和MySQL編寫,並部署在Linux伺服器上,前端的web程序提供了一個簡單易用的圖形界面(圖5),用於搜索,數據瀏覽以及數據的上傳和下載。用戶可以通過網站上的教程來學習如何調整參數,以實現自定義搜索功能和結果展示。網站的頁面上也會定期發布資料庫更新,系統維護和其他相關信息的通知。用戶還可以在幫助頁上提交問題或錯誤信息,我們將通過電子郵件的方式進行回復。

(ii)搜索及結果展示。MSE 2接受微生物組樣本的OTU、物種或KO功能作為搜索輸入。因此,搜索之前需要將測序序列進行預處理,使之具有與資料庫樣本相同的形式。表2列出了推薦的用於每種序列類型的序列處理軟體,詳細的分析方法可通過在線平臺「搜索」或「幫助」頁面獲得。搜索的第一步,用戶首先要根據搜索輸入的類型從「按OTU搜索」(by OTU),「按物種搜索」(by species)和「按功能搜索」(by function)中進行選擇(圖5b)。 然後,輸入數據可以以文本文件的形式上傳,也可以直接粘貼到網頁的文本框中。用戶還可以指定其他參數,例如最大匹配數(默認為10)和最低相似度(默認為0.6)。在結果頁面(圖5c)中,列出了資料庫中與輸入的樣本最相似的樣本,其中包含資料庫樣本ID,採樣環境和相似性。對於「按功能搜索」,如果匹配結果是基於16S rRNA序列來預測的功能,搜索結果中也會顯示其NSTI(Nearest Sequenced Taxon Index)值,用於表示功能預測的可信度。搜索結果中,每個樣品的ID均連結到其詳細完整元數據(例如,來源研究,採樣地點,序列類型等)的相應頁面。輸入微生物組和其匹配結果的物種或功能組成會以柱狀圖或Krona [23]繪製的動態圖展示出來,方便查看它們之間的聯繫和區別。此外,以上所有搜索結果都可以在結果頁面上進行打包下載,以方便用戶進行後續的meta-analysis和數據挖掘。

(iii)數據瀏覽和下載。MSE2的網站上提供了兩種樣本瀏覽的方式:

      A. 按項目/研究瀏覽。在項目列表頁面,樣本按照項目進行排列,所有的項目會按照項目ID進行排序。單擊項目ID可以進入項目頁面,該頁面包含每個項目的統一化元數據(例如,研究的標題,出版信息等等)(表1),該項目的完整原始元數據,以及訪問該數據原始發布頁的連結。

      B. 按樣本瀏覽。在樣本列表頁面中,所有的樣本會以列表的形式展示並按照樣本號進行排序。用戶可以對樣本列表進行篩選,目前支持的篩選條件有元數據過濾器,環境,序列類型,採樣年份等等。點擊樣本ID還可以查看由Krona [23]繪製的物種組成動態圖。

結論與討論

本文中,我們介紹了Microbiome Search Engine 2(MSE 2),該平臺具有以下兩大特性:(i)海量的數據,該資料庫包含來自於798項研究的25萬個微生物組樣本,並且這些樣本都進行了統一化的處理;(ii)增強的搜尋引擎,能夠進行實時級(每次搜索耗時<< span="">0.5 s)快速搜索,搜索條件也從僅支持OTU信息擴展到了支持物種和功能信息。目前已經有研究證明了基於搜索的策略對於定義微生物組樣本的新穎性 [21]和跨隊列疾病診斷 [22,24]的價值。通過為MES 2和其他相關軟體添加功能相似性這一維度,MSE 2可以加速對不斷擴大的宏基因組數據空間的大規模數據挖掘。

參考文獻

1.       Fierer N, Jackson RB. 2006. The diversity and biogeography of soil bacterial communities. Proc Natl Acad Sci U S A 103:626–631. https://doi.org/ 10.1073/pnas.0507535103.

2.        Steele JA, Countway PD, Xia L, Vigil PD, Beman JM, Kim DY, Chow CE, Sachdeva R, Jones AC, Schwalbach MS, Rose JM, Hewson I, Patel A, Sun F, Caron DA, Fuhrman JA. 2011. Marine bacterial, archaeal and protistan association networks reveal ecological linkages. ISME J 5:1414–1425. https://doi.org/10.1038/ismej.2011.24.

3.       Qin N, Yang F, Li A, Prifti E, Chen Y, Shao L, Guo J, Le Chatelier E, Yao J, Wu L, Zhou J, Ni S, Liu L, Pons N, Batto JM, Kennedy SP, Leonard P, Yuan C, Ding W, Chen Y, Hu X, Zheng B, Qian G, Xu W, Ehrlich SD, Zheng S, Li L. 2014. Alterations of the human gut microbiome in liver cirrhosis. Nature 513:59–64. https://doi.org/10.1038/nature13568.

4.       Halfvarson J, Brislawn CJ, Lamendella R, Vazquez-Baeza Y, Walters WA, Bramer LM, D'Amato M, Bonfiglio F, McDonald D, Gonzalez A, McClure EE, Dunklebarger MF, Knight R, Jansson JK. 2017. Dynamics of the human gut microbiome in inflammatory bowel disease. Nat Microbiol 2:17004. https://doi.org/10.1038/nmicrobiol.2017.4.

5.       Franzosa EA, Sirota-Madi A, Avila-Pacheco J, Fornelos N, Haiser HJ, Reinker S, Vatanen T, Hall AB, Mallick H, McIver LJ, Sauk JS, Wilson RG, Stevens BW, Scott JM, Pierce K, Deik AA, Bullock K, Imhann F, Porter JA, Zhernakova A, Fu J, Weersma RK, Wijmenga C, Clish CB, Vlamakis H, Huttenhower C, Xavier RJ. 2019. Gut microbiome structure and metabolic activity in inflammatory bowel disease. Nat Microbiol 4:293–305. https:// doi.org/10.1038/s41564-018-0306-4.

 6.        Zeller G, Tap J, Voigt AY, Sunagawa S, Kultima JR, Costea PI, Amiot A, Bohm J, Brunetti F, Habermann N, Hercog R, Koch M, Luciani A, Mende DR, Schneider MA, Schrotz-King P, Tournigand C, Tran Van Nhieu J, Yamada T, Zimmermann J, Benes V, Kloor M, Ulrich CM, von Knebel Doeberitz M, Sobhani I, Bork P. 2014. Potential of fecal microbiota for early-stage detection of colorectal cancer. Mol Syst Biol 10:766. https:// doi.org/10.15252/msb.20145645.

7.        Teng F, Yang F, Huang S, Bo CP, Xu ZZ, Amir A, Knight R, Ling JQ, Xu J. 2015. Prediction of early childhood caries via spatial-temporal variations of oral microbiota. Cell Host Microbe 18:296–306. https://doi.org/10 .1016/j.chom.2015.08.005.

 8.        Forslund K, Hildebrand F, Nielsen T, Falony G, Le Chatelier E, Sunagawa S, Prifti E, Vieira-Silva S, Gudmundsdottir V, Pedersen HK, Arumugam M, Kristiansen K, Voigt AY, Vestergaard H, Hercog R, Costea PI, Kultima JR, Li J, Jorgensen T, Levenez F, Dore J, MetaHIT consortium, Nielsen HB, Brunak S, Raes J, Hansen T, Wang J, Ehrlich SD, Bork P, Pedersen O. 2015. Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota. Nature 528:262–266. https://doi.org/10.1038/ nature15766.

 9.        Gopalakrishnan V, Spencer CN, Nezi L, Reuben A, Andrews MC, Karpinets TV, Prieto PA, Vicente D, Hoffman K, Wei SC, Cogdill AP, Zhao L, Hudgens CW, Hutchinson DS, Manzo T, Petaccia de Macedo M, Cotechini T, Kumar T, Chen WS, Reddy SM, Szczepaniak Sloane R, Galloway-Pena J, Jiang H, Chen PL, Shpall EJ, Rezvani K, Alousi AM, Chemaly RF, Shelburne S, Vence LM, Okhuysen PC, Jensen VB, Swennes AG, McAllister F, Marcelo Riquelme Sanchez E, Zhang Y, Le Chatelier E, Zitvogel L, Pons N, AustinBreneman JL, Haydu LE, Burton EM, Gardner JM, Sirmans E, Hu J, Lazar AJ, Tsujikawa T, Diab A, Tawbi H, Glitza IC, et al. 2018. Gut microbiome modulates response to anti-PD-1 immunotherapy in melanoma patients. Science 359:97–103. https://doi.org/10.1126/science.aan4236.

10.       Integrative HMP Research Network Consortium. 2019. The Integrative Human Microbiome Project. Nature 569:641–648. https://doi.org/10 .1038/s41586-019-1238-8.

11.        Thompson LR, Sanders JG, McDonald D, Amir A, Ladau J, Locey KJ, Prill RJ, Tripathi A, Gibbons SM, Ackermann G, Navas-Molina JA, Janssen S, Kopylova E, Vazquez-Baeza Y, Gonzalez A, Morton JT, Mirarab S, Zech Xu Z, Jiang L, Haroon MF, Kanbar J, Zhu Q, Jin Song S, Kosciolek T, Bokulich NA, Lefler J, Brislawn CJ, Humphrey G, Owens SM, Hampton-Marcell J, Berg-Lyons D, McKenzie V, Fierer N, Fuhrman JA, Clauset A, Stevens RL, Shade A, Pollard KS, Goodwin KD, Jansson JK, Gilbert JA, Knight R, Earth Microbiome Project Consortium. 2017. A communal catalogue reveals Earth's multiscale microbial diversity. Nature 551:457–463. https://doi .org/10.1038/nature24621.

12.        McDonald D, Hyde E, Debelius JW, Morton JT, Gonzalez A, Ackermann G, Aksenov AA, Behsaz B, Brennan C, Chen Y, DeRight Goldasich L, Dorrestein PC, Dunn RR, Fahimipour AK, Gaffney J, Gilbert JA, Gogul G, Green JL, Hugenholtz P, Humphrey G, Huttenhower C, Jackson MA, Janssen S, Jeste DV, Jiang L, Kelley ST, Knights D, Kosciolek T, Ladau J, Leach J, Marotz C, Meleshko D, Melnik AV, Metcalf JL, Mohimani H, Montassier E, Navas-Molina J, Nguyen TT, Peddada S, Pevzner P, Pollard KS, Rahnavard G, Robbins-Pianka A, Sangwan N, Shorenstein J, Smarr L, Song SJ, Spector T, Swafford AD, Thackray VG, et al. 2018. American Gut: an open platform for citizen science microbiome research. mSystems 3: e00031-18. https://doi.org/10.1128/mSystems.00031-18.

13.        Bork P, Bowler C, de Vargas C, Gorsky G, Karsenti E, Wincker P. 2015. Tara Oceans. Tara Oceans studies plankton at planetary scale. Introduction. Science 348:873. https://doi.org/10.1126/science.aac5605.

14.        Kodama Y, Shumway M, Leinonen R, International Nucleotide Sequence Database Collaboration. 2012. The Sequence Read Archive: explosive growth of sequencing data. Nucleic Acids Res 40:D54–D56. https://doi .org/10.1093/nar/gkr854.

15.        Wilke A, Bischof J, Gerlach W, Glass E, Harrison T, Keegan KP, Paczian T, Trimble WL, Bagchi S, Grama A, Chaterji S, Meyer F. 2016. The MG-RAST metagenomics database and portal in 2015. Nucleic Acids Res 44: D590–D594. https://doi.org/10.1093/nar/gkv1322.

16.        Mitchell AL, Scheremetjew M, Denise H, Potter S, Tarkowska A, Qureshi M, Salazar GA, Pesseat S, Boland MA, Hunter FMI, Ten Hoopen P, Alako B, Amid C, Wilkinson DJ, Curtis TP, Cochrane G, Finn RD. 2018. EBI Metagenomics in 2017: enriching the analysis of microbial communities, from sequence reads to assemblies. Nucleic Acids Res 46:D726–D735. https:// doi.org/10.1093/nar/gkx967.

17.        Santiago A, Panda S, Mengels G, Martinez X, Azpiroz F, Dore J, Guarner F, Manichanh C. 2014. Processing faecal samples: a step forward for standards in microbial community analysis. BMC Microbiol 14:112. https://doi .org/10.1186/1471-2180-14-112.

18.        Gonzalez A, Navas-Molina JA, Kosciolek T, McDonald D, Vazquez-Baeza Y, Ackermann G, DeReus J, Janssen S, Swafford AD, Orchanian SB, Sanders JG, Shorenstein J, Holste H, Petrus S, Robbins-Pianka A, Brislawn CJ, Wang M, Rideout JR, Bolyen E, Dillon M, Caporaso JG, Dorrestein PC, Knight R. 2018. Qiita: rapid, web-enabled microbiome meta-analysis. Nat Methods 15:796–798. https://doi.org/10.1038/s41592-018-0141-9.

19.        Shi W, Qi H, Sun Q, Fan G, Liu S, Wang J, Zhu B, Liu H, Zhao F, Wang X, Hu X, Li W, Liu J, Tian Y, Wu L, Ma J. 2019. gcMeta: a Global Catalogue of Metagenomics platform to support the archiving, standardization and analysis of microbiome data. Nucleic Acids Res 47:D637–D648. https://doi .org/10.1093/nar/gky1008.

20.        Wu S, Sun C, Li Y, Wang T, Jia L, Lai S, Yang Y, Luo P, Dai D, Yang YQ, Luo Q, Gao NL, Ning K, He LJ, Zhao XM, Chen WH. 2019. GMrepo: a database of curated and consistently annotated human gut metagenomes. Nucleic Acids Res 48:D545–D553. https://doi.org/10.1093/nar/gkz764.

21.        Su X, Jing G, McDonald D, Wang H, Wang Z, Gonzalez A, Sun Z, Huang S, Navas J, Knight R, Xu J. 2018. Identifying and predicting novelty in microbiome studies. mBio 9:e02099-18. https://doi.org/10.1128/mBio .02099-18.

22.        Su X, Jing G, Sun Z, Liu L, Xu Z, McDonald D, Wang Z, Wang H, Gonzalez A, Zhang Y, Huang S, Huttley G, Knight R, Xu J. 2020. Multiple-disease detection and classification across cohorts via microbiome search. mSystems 5:e00150-20. https://doi.org/10.1128/mSystems.00150-20.

23.        Ondov BD, Bergman NH, Phillippy AM. 2011. Interactive metagenomic visualization in a Web browser. BMC Bioinformatics 12:385. https://doi .org/10.1186/1471-2105-12-385.

24.        Su X, Jing G, Zhang Y, Wu S. 2020. Method development for cross-study microbiome data mining: challenges and opportunities. Comput Struct Biotechnol J 18:2075–2080. https://doi.org/10.1016/j.csbj.2020.07.020.

25.       Truong DT, Franzosa EA, Tickle TL, Scholz M, Weingart G, Pasolli E, Tett A, Huttenhower C, Segata N. 2015. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat Methods 12:902–903. https://doi.org/10.1038/ nmeth.3589.

26.        Franzosa EA, McIver LJ, Rahnavard G, Thompson LR, Schirmer M, Weingart G, Lipson KS, Knight R, Caporaso JG, Segata N, Huttenhower C. 2018. Species-level functional profiling of metagenomes and metatranscriptomes. Nat Methods 15:962–968. https://doi.org/10.1038/s41592 -018-0176-y.

27.        Kanehisa M, Goto S, Sato Y, Furumichi M, Tanabe M. 2012. KEGG for integration and interpretation of large-scale molecular data sets. Nucleic Acids Res 40:D109–D114. https://doi.org/10.1093/nar/gkr988.

28.        McDonald D, Price MN, Goodrich J, Nawrocki EP, DeSantis TZ, Probst A, Andersen GL, Knight R, Hugenholtz P. 2012. An improved Greengenes taxonomy with explicit ranks for ecological and evolutionary analyses of bacteria and archaea. ISME J 6:610–618. https://doi.org/10.1038/ismej .2011.139.

29.        Jing G, Sun Z, Wang H, Gong Y, Huang S, Ning K, Xu J, Su X. 2017. ParallelMETA 3: comprehensive taxonomical and functional analysis platform for efficient comparison of microbial communities. Sci Rep 7:40371. https:// doi.org/10.1038/srep40371.

30.        Chen IA, Chu K, Palaniappan K, Pillay M, Ratner A, Huang J, Huntemann M, Varghese N, White JR, Seshadri R, Smirnova T, Kirton E, Jungbluth SP, Woyke T, Eloe-Fadrosh EA, Ivanova NN, Kyrpides NC. 2019. IMG/M v.5.0: an integrated data management and comparative analysis system for microbial genomes and microbiomes. Nucleic Acids Res 47:D666–D677. https://doi.org/10.1093/nar/gky901.

31.        Langille MG, Zaneveld J, Caporaso JG, McDonald D, Knights D, Reyes JA, Clemente JC, Burkepile DE, Vega Thurber RL, Knight R, Beiko RG, Huttenhower C. 2013. Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nat Biotechnol 31:814–821. https://doi.org/10 .1038/nbt.2676.

32.        Douglas GM, Maffei VJ, Zaneveld JR, Yurgel SN, Brown JR, Taylor CM, Huttenhower C, Langille MGI. 2020. PICRUSt2 for prediction of metagenome functions. Nat Biotechnol 38:685–688. https://doi.org/10.1038/ s41587-020-0548-6.

33.        Su X, Wang X, Jing G, Ning K. 2014. GPU-Meta-Storms: computing the structure similarities among massive amount of microbial community samples using GPU. Bioinformatics 30:1031–1033. https://doi.org/10.1093/ bioinformatics/btt736.

34.        Jing G, Zhang Y, Yang M, Liu L, Xu J, Su X. 2020. Dynamic Meta-Storms enables comprehensive taxonomic and phylogenetic comparison of shotgun metagenomes at the species level. Bioinformatics 36:2308–2310. https://doi.org/10.1093/bioinformatics/btz910.

35.        Caporaso JG, Kuczynski J, Stombaugh J, Bittinger K, Bushman FD, Costello EK, Fierer N, Pena AG, Goodrich JK, Gordon JI, Huttley GA, Kelley ST, Knights D, Koenig JE, Ley RE, Lozupone CA, McDonald D, Muegge BD, Pirrung M, Reeder J, Sevinsky JR, Turnbaugh PJ, Walters WA, Widmann J, Yatsunenko T, Zaneveld J, Knight R. 2010. QIIME allows analysis of highthroughput community sequencing data. Nat Methods 7:335–336. https:// doi.org/10.1038/nmeth.f.303.

猜你喜歡

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公眾號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧秘  

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」

點擊閱讀原文,跳轉最新文章目錄閱讀

相關焦點

  • 喜訊 | 我院蘇曉泉教授團隊研發第二代微生物組搜尋引擎MSE 2
    近日,我院蘇曉泉教授團隊研發了第二代微生物組搜尋引擎MSE 2(http://mse.ac.cn),以支撐更全面、更深入、更便捷的菌群大數據挖掘,推動「數據驅動型」的微生態研究和大健康產業應用。該成果於1月20日發表於mSystems(美國微生物學會會刊,SCI IF=6.63)。
  • 科研人員研發出第二代微生物組搜尋引擎MSE 2
    因此,微生物組「大數據」的深度挖掘,是利用菌群實現精準診斷、精準護理與精準營養的重要工具,也是認識生物資源、監控環境健康、維護國家生物安全的新手段。近日,中國科學院青島生物能源與過程研究所單細胞研究中心發布了第二代微生物組搜尋引擎MSE 2(http://mse.ac.cn),以支撐更全面、更深入、更便捷的菌群大數據挖掘。1月20日,相關研究成果發表在mSystems(《美國微生物學會會刊》)上。
  • 青島能源所微生物組大數據分析工具開發獲進展
    由於元基因組數據的複雜性、異質性以及指數級增長的體量,從中深度且快速發掘微生物群落結構和功能上的變化規律,一直是業界的一個重要技術瓶頸。近日,中國科學院青島生物能源與過程研究所單細胞研究中心發表了元基因組高性能計算分析軟體Parallel-META 3,能夠深入、全面、快速地將數量龐大的未知微生物組進行結構與功能解析,從而剖析疾病或生態災害下微生物組的變化規律(如圖)。
  • 研究人員開發出基於微生物組大數據的疾病檢測方法
    中國科學院青島生物能源與過程研究所單細胞中心發明了基於菌群大數據搜索的疾病檢測方法,為此共性問題提供了原創的解決方案。該工作於3月17日在線發表於mSystems(美國微生物學會會刊)。作為與生俱來、無處不在的「小夥伴」,微生物組與人體、環境的健康有著千絲萬縷的關聯。同時,菌群檢測具有非侵入性、可量化、可預警等優勢。
  • 基於菌群大數據搜索的新疾病檢測方法開發成功—新聞—科學網
    中科院青島生物能源與過程研究所單細胞中心發明了基於菌群大數據搜索的疾病檢測方法,為此共性問題提供了原創解決方案。該研究成果近日在線發表於《美國微生物學會會刊》。 微生物組與人體、環境的健康有著千絲萬縷的關聯。同時,菌群檢測具有非侵入性、可量化、可預警等優勢。
  • 中國土壤微生物組:進展與展望*
    同時,溫度升高可在一定程度促進土壤微生物組的活性,加速有機質的分解並向大氣中釋放更多的二氧化碳,形成全球升溫的正反饋。此外,全球氣候變化也可能促進植物群落更快地演化,改變凋落物的質量和數量,進而影響地下食物網的結構和功能。土壤微生物組也是氮氧化物排放的重要來源。
  • 中國土壤微生物組:進展與展望|研究
    同時,溫度升高可在一定程度促進土壤微生物組的活性,加速有機質的分解並向大氣中釋放更多的二氧化碳,形成全球升溫的正反饋。此外,全球氣候變化也可能促進植物群落更快地演化,改變凋落物的質量和數量,進而影響地下食物網的結構和功能。土壤微生物組也是氮氧化物排放的重要來源。
  • 全球模式微生物基因組和微生物組測序合作計劃正式啟動
    全球模式微生物基因組和微生物組測序合作計劃正式啟動 來源:中國生物技術信息網   發布者:尹海華   日期:2017-10-12   今日/總瀏覽:1/5866
  • 個人電腦搭建微生物組分析平臺(Win/Mac)
    121個人電腦搭建微生物組分析平臺(Win/Mac)本節作者:劉永鑫 中國科學院遺傳與發育生物學研究所版本1.0.3
  • 121個人電腦搭建微生物組分析平臺(Win/Mac)
    121個人電腦搭建微生物組分析平臺(Win/Mac)本節作者:劉永鑫 中國科學院遺傳與發育生物學研究所版本1.0.3
  • 青島能源所等開發微生物組內部代謝互作示蹤新技術
    在微生物組的內部,不同種類的微生物之間存在著複雜、精妙的相互作用與影響,這一跨物種的細胞間代謝互作網絡是群落功能和進化的基礎。然而由於自然界中絕大部分微生物尚難以培養,而且細胞在純培養狀態往往無法體現其「原位」功能,因此「如何原位考察細胞間代謝互作」一直是微生物組方法學研究的重點與難點之一。
  • 平颱風向:11月16日,亞馬遜搜索功能發生新變化
    2.亞馬遜搜索功能發生新變化亞馬遜前臺搜索功能發生新變化,用戶在搜索某些詞時,會出現與這個詞相關但類型不同的產品圖片。但目前這項功能還未全面完善,搜索部分詞彙不會出現圖片。3.eBay:SpeedPAK11月16日起美歐路向降價eBay發布公告稱,從2020年11月16日起,將分別降低從中國大陸香港地區出口的SpeedPAK和SpeedPAK Mini的美國、歐洲路向的運費價格。
  • 民用機場百科2.0版發布
    版正式發布,在去年11月發布的民用機場百科1.0版基礎上進行了升級改善。相較於1.0版,民用機場百科2.0版小程序的內容更加豐富,新增通用機場信息、團體及企業標準、民航統計公報、機場綜合信息表等內容,以及動態更新的行業要聞,總文字量達到236萬字;功能更強大,新增三大類12項功能,包括熱度類的「最多查看」「最多評論」,資訊類的「最新發布」「行業要聞」,
  • 9文聚焦:宏基因組學與微生物組分析方法和工具
    ,同時強調了宏基因組學數據分析的挑戰;③ 鑑於與模式生物相比,環境細菌功能資料庫的缺乏以及異質環境樣品中宏基因組組裝和定量的技術難度,功能注釋仍面臨重大挑戰;④ 使用多種技術平臺的數據整合將使人們更好地了解如何利用宏基因組技術。
  • Nature子刊:HUMAnN2實現宏基因組和宏轉錄組種水平功能組成分析
    導讀HUMAnN2是一款快速獲得宏基因組、宏轉錄組物種和功能組成的軟體;與傳統的翻譯比對方法相比,採用分層式算法比對標記基因、泛基因組和蛋白資料庫,速度更快且準確率更高;結果同時獲得功能通路中具體物種組成,建立起了物種與功能的聯繫,可進一步研究功能組成的貢獻者;提出貢獻多樣性的概念,使我們從類多樣性角度重新認識微生物組功能組成,以及與物種間的聯繫
  • 宏基因組/微生物組雜誌簡介及2020最新影響因子
    此刊發表有大量本領域的方法、軟體、測評的文章,上圖中的三期封面分別為:18年11月宏基因組建庫組裝方法、19年2月超高速細菌基因組檢索、和19年6月水稻根系微生物組,本平臺均進行了專題報導。此外,我們還報導多篇此雜誌文章如下:自然方法 Nature Methods
  • 微生物和微生物組有區別嗎?本文帶你詳細了解它們的發展史
    該定義代表了微生物群落定義的實質性進步,因為它定義了具有不同特性和功能的微生物群落及其與環境的相互作用,從而形成了特定的生態位。微生物組的常用定義但是,在過去的幾十年中,還發布了許多其他的微生物組定義。
  • 微生物群和微生物組有區別嗎?本文帶你詳細了解它們的前世今生
    該定義代表了微生物群落定義的實質性進步,因為它定義了具有不同特性和功能的微生物群落及其與環境的相互作用,從而形成了特定的生態位。微生物組的常用定義但是,在過去的幾十年中,還發布了許多其他的微生物組定義。
  • HUMAnN2:人類微生物組統一代謝網絡分析2
    關於宏基因組常用的有參分析流程,主要是快速獲得物種組成和功能組成,之前分享了今天再介紹來自同一作者的另一個軟體,可以一步完成功能和代謝組成
  • Nature:何勝洋和辛秀芳組發表植物葉際微生物組穩態機制
    在該研究的基礎上,作者團隊利用擬南芥四突變體mfec (min7 fls2 efr cerk1)在高溼度的條件下顯現出黃化和壞死的病症的特點,通過16S rRNA基因擴增子測序檢測了健康葉片(野生型,Col-0)和不健康葉片(突變體,mfec)葉片總微生物組和葉內微生物組,結果表明,健康葉片和不健康葉片的總微生物組的多樣性沒有顯著差異,但是葉內微生物組的豐度和多樣性均有顯著的變化