mSystems:蘇曉泉、徐健等發布全球微生物組結構和功能搜索平臺2.0

2021-02-28 宏基因組

Microbiome Search Engine 2 第二代微生物組搜尋引擎:全球微生物組結構和功能搜索的平臺

Microbiome Search Engine 2: a Platform for Taxonomic and Functional Search of Global Microbiomes on the Whole Microbiome Level

mSystems [6.633]

原文連結:https://doi.org/10.1128/mSystems.00943-20

第一作者:Gongchao Jing, Lu Liu

通訊作者:Jian Xu(徐健), Xiaoquan Su(蘇曉泉)

主要單位:青島大學計算機科學技術學院,中國科學院青島生物能源與過程研究所單細胞中心

摘要

      來自不同環境的宏基因組數據集的數量正在迅速增長。隨之而來的問題也不斷湧現,例如如何快速的訪問某一數據集,以及如何快速的通過對比發現新微生物群落與現有微生物群落之間的關聯等。Microbiome Search Engine 2(MSE 2)是第二代的微生物組搜尋引擎,為解決以上類型的問題提供良好的解決方案。MSE 2可以根據微生物組整體的物種結構或功能,在全球已有的微生物組數據集中搜索高度匹配的樣本。MSE 2由以下三部分組成:(i)不斷更新的微生物組資料庫。該資料庫目前包含來自於798項研究的250,000多個宏基因組和16S rRNA擴增子樣本,每一個樣本的測序數據和元數據都進行了統一化處理;(ii)增強的搜尋引擎。實時級快速搜索,能夠在0.5秒內,從整個資料庫中搜索到與給定的微生物組在整體組成或功能上最相似的樣本;(iii)基於Web的圖形界面。用戶可通過http://mse.ac.cn免費訪問MSE 2。該網站提供了簡單易用的圖形界面,方便用戶快速上手樣本搜索、數據瀏覽等操作,同時也為自定義的搜索提供了教程。如果用戶想對自有的微生物組數據集來構建資料庫並進行搜索,我們在GitHub (https://github.com/qibebt-bioinfo/meta-storms)上也提供了MSE 2搜尋引擎的內核程序。

關鍵詞

擴增子(amplicon),宏基因組(metagenome),微生物組(microbiome),在線服務(online service),搜尋引擎(search engine)

前言

      宏基因組學能夠建立起微生物組與周圍環境之間的動態關聯,已被廣泛應用於探索不同環境中的微生物群落,比如環境狀況的改變 [1,2],疾病發展 [3-7],藥物反應 [8,9]等。隨著取樣策略和測序技術的快速發展,海量的微生物組數據集正在不斷產生,包括16S rRNA基因擴增子測序數據和鳥槍法宏基因組測序(shotgun whole-genome sequencing, WGS)數據。這些數據集既來自於大型的研究項目例如Human Microbiome Project [10]、Earth Microbiome Project [11]、American Gut Project [12], 以及Tara Oceans [13],也來自於小型的研究項目甚至個人。這些數據大都存儲在通用的DNA序列存儲庫(例如NCBI SRA [14])或微生物組特異性資料庫(例如MG-RAST [15]和EBI Metagenomics [16])中。為了有效的對這些數據進行大規模的數據挖掘,目前已經有了幾款使用統一序列處理和標準操作流程(SOP) [17]的分析管理平臺,例如Qiita [18],gcMeta [19]和GMrepo [20]等。這些工具通常都提供基於Taxonomy分類單元(例如物種名稱)、序列片段甚至是類似於結構化查詢語言(SQL)的元數據查詢。但是,當新的微生物組產生後,仍然不能根據其整體尺度上物種或者功能組成的相似性,從現有資料庫中搜索到高度相似的匹配樣本。為了填補這一領域的空缺,前期我們開發了微生物組搜尋引擎Microbiome Search Engine(MSE)[21],並實現了一種基於菌群大數據搜索的多疾病檢測新策略,尤其是在處理多隊列數據、多測序平臺數據和抵抗汙染物的方面表現出了顯著的優勢 [22]。但是,MSE也有它的局限性,即僅支持16s rRNA擴增子測序數據,因此MSE只能針對擴增子OTU(Operational Taxonomy Unit)的相似性進行搜索 [21]。

      Microbiome Search Engine 2(http://mse.ac.cn)是第二代微生物組搜尋引擎。它突破了以上的限制,不僅同時支持16S rRNA擴增子測序數據和鳥槍法宏基因組測序數據作為搜索輸入(圖1a),而且在「物種組成」相似性基礎上,增加了根據微生物組「功能」相似性的搜索。MSE 2包括以下三個主要部分(圖1b):

(i)不斷更新的微生物組資料庫。該資料庫目前包含來自於798項研究的250,000多個WGS宏基因組和16S rRNA擴增子樣本,每一個樣本的測序數據和元數據都進行了統一化處理;

(ii)增強的搜尋引擎。實時級快速搜索,能夠在0.5秒內,從整個資料庫中搜索到與給定的微生物組在整體組成或功能上最相似的樣本;

(iii)基於Web的圖形界面。用戶可通過http://mse.ac.cn免費訪問MSE 2。該網站提供了簡單易用的圖形界面,方便用戶快速上手樣本搜索、數據瀏覽等操作,同時也為自定義的搜索提供了教程。

結果

微生物組資料庫

(i)數據的收集和歸納整理。MSE 2的數據主要來自Qiita [18]、EBI [16]、SRA [14]和MG-RAST [15]這幾個數據倉儲。為了保證微生物組樣本之間的技術可比性和可檢索性,我們對這些樣本進行了統一化的處理:一是在保留原始元數據的基礎上,我們從每項研究和以及其樣本中選擇比較常用的元數據項,將其手工整理成統一的特定格式(表1);二是我們根據序列類型(基於擴增子測序或基於WGS測序;表2),對序列進行了統一的預處理和分析。

(ii)資料庫統計數據。通過對數據的預處理和整合後,共有來自798個項目/研究的250,273個微生物組樣本收錄進了MSE2的資料庫,其中鳥槍法宏基因組測序樣本有14,957個,16S rRNA擴增子測序樣本共有235,334個。從採樣源分布來看(圖2),人體菌群樣本最多(共佔52.8%,其中:腸道,34.2%;皮膚,9.1%;口腔,6.4%,等),接下來依次是來自動物(23.7%)、土壤(6.4%)、室內環境(5.7%)和海洋環境(2.7%)。

(iii)資料庫的組織和管理。所有微生物組樣本被組織成兩個維度(圖3)。對於基於web的數據瀏覽(參考下面的「數據瀏覽和下載」部分),樣本是按照其所屬的研究項目進行組織的,可以通過各種元數據(如棲息地、序列類型、年份等)進行選擇和過濾。對於基於微生物組結構或功能相似性的搜索,樣品會根據多種特徵的組合(例如,OTU,物種,或KO(KEGG Orthology)功能注釋)進行組織,以進行索引和搜索(詳情請參閱下面的「增強的微生物組搜尋引擎」部分)。

增強的微生物組搜尋引擎

(i)全微生物組水平的搜索。MSE 2的搜尋引擎內核由C++編寫,並使用OpenMP技術實現了並行計算和優化。每次搜索,MSE 2都會檢索整個微生物組資料庫,以找到結構或功能相似性最高的最佳匹配樣品。搜索結果包含匹配項的物種組成或功能概況,匹配項與搜索使用的樣本的相似程度及元數據信息(請參見「搜索及結果展示」的部分以了解更多詳細信息)。與先前版本MSE [21]相比,MSE 2除了支持基於16S rRNA OTU,還增加了基於物種名稱和基於代謝功能(KO)的搜索(圖4a)。

(ii)搜索速度和任務調度。得益於兩級索引的搜索策略(圖4b),MSE2的搜索速度要比窮舉搜索快1至2個數量級。為了測試MSE 2的索引效率和搜索速度,我們對整個資料庫執行了基於OTU、基於物種和基於功能的搜索,並將搜索時間與禁用索引的窮舉搜索(窮舉搜索僅用於內部評估,未在MSE 2的線上服務中提供)進行比較。每個過程重複10次,每一次僅對搜索耗時進行記錄和比較(不包括數據上傳時間,可視化時間和Web頁面加載時間,以避免由於系統和網絡延遲引起的潛在偏差)。結果顯示,對於基於OTU,基於物種和基於功能(KO)的搜索,兩級索引策略分別將搜索速度分別提高了193倍、15倍和605倍(圖4c和表3)。針對超過250,000個樣本的全微生物組級搜索的實時響應在0.5 s之內。另外,在線搜索服務遵循基於隊列的任務調度實現的「先到先服務」的原則,從而有效地利用了計算資源。

基於web的圖形化入口

(i)基於Web的用戶界面。MSE2的網址是http://mse.ac.cn,可通過任何Web瀏覽器免費訪問。該網站的後臺程序使用PHP和MySQL編寫,並部署在Linux伺服器上,前端的web程序提供了一個簡單易用的圖形界面(圖5),用於搜索,數據瀏覽以及數據的上傳和下載。用戶可以通過網站上的教程來學習如何調整參數,以實現自定義搜索功能和結果展示。網站的頁面上也會定期發布資料庫更新,系統維護和其他相關信息的通知。用戶還可以在幫助頁上提交問題或錯誤信息,我們將通過電子郵件的方式進行回復。

(ii)搜索及結果展示。MSE 2接受微生物組樣本的OTU、物種或KO功能作為搜索輸入。因此,搜索之前需要將測序序列進行預處理,使之具有與資料庫樣本相同的形式。表2列出了推薦的用於每種序列類型的序列處理軟體,詳細的分析方法可通過在線平臺「搜索」或「幫助」頁面獲得。搜索的第一步,用戶首先要根據搜索輸入的類型從「按OTU搜索」(by OTU),「按物種搜索」(by species)和「按功能搜索」(by function)中進行選擇(圖5b)。 然後,輸入數據可以以文本文件的形式上傳,也可以直接粘貼到網頁的文本框中。用戶還可以指定其他參數,例如最大匹配數(默認為10)和最低相似度(默認為0.6)。在結果頁面(圖5c)中,列出了資料庫中與輸入的樣本最相似的樣本,其中包含資料庫樣本ID,採樣環境和相似性。對於「按功能搜索」,如果匹配結果是基於16S rRNA序列來預測的功能,搜索結果中也會顯示其NSTI(Nearest Sequenced Taxon Index)值,用於表示功能預測的可信度。搜索結果中,每個樣品的ID均連結到其詳細完整元數據(例如,來源研究,採樣地點,序列類型等)的相應頁面。輸入微生物組和其匹配結果的物種或功能組成會以柱狀圖或Krona [23]繪製的動態圖展示出來,方便查看它們之間的聯繫和區別。此外,以上所有搜索結果都可以在結果頁面上進行打包下載,以方便用戶進行後續的meta-analysis和數據挖掘。

(iii)數據瀏覽和下載。MSE2的網站上提供了兩種樣本瀏覽的方式:

      A. 按項目/研究瀏覽。在項目列表頁面,樣本按照項目進行排列,所有的項目會按照項目ID進行排序。單擊項目ID可以進入項目頁面,該頁面包含每個項目的統一化元數據(例如,研究的標題,出版信息等等)(表1),該項目的完整原始元數據,以及訪問該數據原始發布頁的連結。

      B. 按樣本瀏覽。在樣本列表頁面中,所有的樣本會以列表的形式展示並按照樣本號進行排序。用戶可以對樣本列表進行篩選,目前支持的篩選條件有元數據過濾器,環境,序列類型,採樣年份等等。點擊樣本ID還可以查看由Krona [23]繪製的物種組成動態圖。

結論與討論

本文中,我們介紹了Microbiome Search Engine 2(MSE 2),該平臺具有以下兩大特性:(i)海量的數據,該資料庫包含來自於798項研究的25萬個微生物組樣本,並且這些樣本都進行了統一化的處理;(ii)增強的搜尋引擎,能夠進行實時級(每次搜索耗時<< span="">0.5 s)快速搜索,搜索條件也從僅支持OTU信息擴展到了支持物種和功能信息。目前已經有研究證明了基於搜索的策略對於定義微生物組樣本的新穎性 [21]和跨隊列疾病診斷 [22,24]的價值。通過為MES 2和其他相關軟體添加功能相似性這一維度,MSE 2可以加速對不斷擴大的宏基因組數據空間的大規模數據挖掘。

參考文獻

1.       Fierer N, Jackson RB. 2006. The diversity and biogeography of soil bacterial communities. Proc Natl Acad Sci U S A 103:626–631. https://doi.org/ 10.1073/pnas.0507535103.

2.        Steele JA, Countway PD, Xia L, Vigil PD, Beman JM, Kim DY, Chow CE, Sachdeva R, Jones AC, Schwalbach MS, Rose JM, Hewson I, Patel A, Sun F, Caron DA, Fuhrman JA. 2011. Marine bacterial, archaeal and protistan association networks reveal ecological linkages. ISME J 5:1414–1425. https://doi.org/10.1038/ismej.2011.24.

3.       Qin N, Yang F, Li A, Prifti E, Chen Y, Shao L, Guo J, Le Chatelier E, Yao J, Wu L, Zhou J, Ni S, Liu L, Pons N, Batto JM, Kennedy SP, Leonard P, Yuan C, Ding W, Chen Y, Hu X, Zheng B, Qian G, Xu W, Ehrlich SD, Zheng S, Li L. 2014. Alterations of the human gut microbiome in liver cirrhosis. Nature 513:59–64. https://doi.org/10.1038/nature13568.

4.       Halfvarson J, Brislawn CJ, Lamendella R, Vazquez-Baeza Y, Walters WA, Bramer LM, D'Amato M, Bonfiglio F, McDonald D, Gonzalez A, McClure EE, Dunklebarger MF, Knight R, Jansson JK. 2017. Dynamics of the human gut microbiome in inflammatory bowel disease. Nat Microbiol 2:17004. https://doi.org/10.1038/nmicrobiol.2017.4.

5.       Franzosa EA, Sirota-Madi A, Avila-Pacheco J, Fornelos N, Haiser HJ, Reinker S, Vatanen T, Hall AB, Mallick H, McIver LJ, Sauk JS, Wilson RG, Stevens BW, Scott JM, Pierce K, Deik AA, Bullock K, Imhann F, Porter JA, Zhernakova A, Fu J, Weersma RK, Wijmenga C, Clish CB, Vlamakis H, Huttenhower C, Xavier RJ. 2019. Gut microbiome structure and metabolic activity in inflammatory bowel disease. Nat Microbiol 4:293–305. https:// doi.org/10.1038/s41564-018-0306-4.

 6.        Zeller G, Tap J, Voigt AY, Sunagawa S, Kultima JR, Costea PI, Amiot A, Bohm J, Brunetti F, Habermann N, Hercog R, Koch M, Luciani A, Mende DR, Schneider MA, Schrotz-King P, Tournigand C, Tran Van Nhieu J, Yamada T, Zimmermann J, Benes V, Kloor M, Ulrich CM, von Knebel Doeberitz M, Sobhani I, Bork P. 2014. Potential of fecal microbiota for early-stage detection of colorectal cancer. Mol Syst Biol 10:766. https:// doi.org/10.15252/msb.20145645.

7.        Teng F, Yang F, Huang S, Bo CP, Xu ZZ, Amir A, Knight R, Ling JQ, Xu J. 2015. Prediction of early childhood caries via spatial-temporal variations of oral microbiota. Cell Host Microbe 18:296–306. https://doi.org/10 .1016/j.chom.2015.08.005.

 8.        Forslund K, Hildebrand F, Nielsen T, Falony G, Le Chatelier E, Sunagawa S, Prifti E, Vieira-Silva S, Gudmundsdottir V, Pedersen HK, Arumugam M, Kristiansen K, Voigt AY, Vestergaard H, Hercog R, Costea PI, Kultima JR, Li J, Jorgensen T, Levenez F, Dore J, MetaHIT consortium, Nielsen HB, Brunak S, Raes J, Hansen T, Wang J, Ehrlich SD, Bork P, Pedersen O. 2015. Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota. Nature 528:262–266. https://doi.org/10.1038/ nature15766.

 9.        Gopalakrishnan V, Spencer CN, Nezi L, Reuben A, Andrews MC, Karpinets TV, Prieto PA, Vicente D, Hoffman K, Wei SC, Cogdill AP, Zhao L, Hudgens CW, Hutchinson DS, Manzo T, Petaccia de Macedo M, Cotechini T, Kumar T, Chen WS, Reddy SM, Szczepaniak Sloane R, Galloway-Pena J, Jiang H, Chen PL, Shpall EJ, Rezvani K, Alousi AM, Chemaly RF, Shelburne S, Vence LM, Okhuysen PC, Jensen VB, Swennes AG, McAllister F, Marcelo Riquelme Sanchez E, Zhang Y, Le Chatelier E, Zitvogel L, Pons N, AustinBreneman JL, Haydu LE, Burton EM, Gardner JM, Sirmans E, Hu J, Lazar AJ, Tsujikawa T, Diab A, Tawbi H, Glitza IC, et al. 2018. Gut microbiome modulates response to anti-PD-1 immunotherapy in melanoma patients. Science 359:97–103. https://doi.org/10.1126/science.aan4236.

10.       Integrative HMP Research Network Consortium. 2019. The Integrative Human Microbiome Project. Nature 569:641–648. https://doi.org/10 .1038/s41586-019-1238-8.

11.        Thompson LR, Sanders JG, McDonald D, Amir A, Ladau J, Locey KJ, Prill RJ, Tripathi A, Gibbons SM, Ackermann G, Navas-Molina JA, Janssen S, Kopylova E, Vazquez-Baeza Y, Gonzalez A, Morton JT, Mirarab S, Zech Xu Z, Jiang L, Haroon MF, Kanbar J, Zhu Q, Jin Song S, Kosciolek T, Bokulich NA, Lefler J, Brislawn CJ, Humphrey G, Owens SM, Hampton-Marcell J, Berg-Lyons D, McKenzie V, Fierer N, Fuhrman JA, Clauset A, Stevens RL, Shade A, Pollard KS, Goodwin KD, Jansson JK, Gilbert JA, Knight R, Earth Microbiome Project Consortium. 2017. A communal catalogue reveals Earth's multiscale microbial diversity. Nature 551:457–463. https://doi .org/10.1038/nature24621.

12.        McDonald D, Hyde E, Debelius JW, Morton JT, Gonzalez A, Ackermann G, Aksenov AA, Behsaz B, Brennan C, Chen Y, DeRight Goldasich L, Dorrestein PC, Dunn RR, Fahimipour AK, Gaffney J, Gilbert JA, Gogul G, Green JL, Hugenholtz P, Humphrey G, Huttenhower C, Jackson MA, Janssen S, Jeste DV, Jiang L, Kelley ST, Knights D, Kosciolek T, Ladau J, Leach J, Marotz C, Meleshko D, Melnik AV, Metcalf JL, Mohimani H, Montassier E, Navas-Molina J, Nguyen TT, Peddada S, Pevzner P, Pollard KS, Rahnavard G, Robbins-Pianka A, Sangwan N, Shorenstein J, Smarr L, Song SJ, Spector T, Swafford AD, Thackray VG, et al. 2018. American Gut: an open platform for citizen science microbiome research. mSystems 3: e00031-18. https://doi.org/10.1128/mSystems.00031-18.

13.        Bork P, Bowler C, de Vargas C, Gorsky G, Karsenti E, Wincker P. 2015. Tara Oceans. Tara Oceans studies plankton at planetary scale. Introduction. Science 348:873. https://doi.org/10.1126/science.aac5605.

14.        Kodama Y, Shumway M, Leinonen R, International Nucleotide Sequence Database Collaboration. 2012. The Sequence Read Archive: explosive growth of sequencing data. Nucleic Acids Res 40:D54–D56. https://doi .org/10.1093/nar/gkr854.

15.        Wilke A, Bischof J, Gerlach W, Glass E, Harrison T, Keegan KP, Paczian T, Trimble WL, Bagchi S, Grama A, Chaterji S, Meyer F. 2016. The MG-RAST metagenomics database and portal in 2015. Nucleic Acids Res 44: D590–D594. https://doi.org/10.1093/nar/gkv1322.

16.        Mitchell AL, Scheremetjew M, Denise H, Potter S, Tarkowska A, Qureshi M, Salazar GA, Pesseat S, Boland MA, Hunter FMI, Ten Hoopen P, Alako B, Amid C, Wilkinson DJ, Curtis TP, Cochrane G, Finn RD. 2018. EBI Metagenomics in 2017: enriching the analysis of microbial communities, from sequence reads to assemblies. Nucleic Acids Res 46:D726–D735. https:// doi.org/10.1093/nar/gkx967.

17.        Santiago A, Panda S, Mengels G, Martinez X, Azpiroz F, Dore J, Guarner F, Manichanh C. 2014. Processing faecal samples: a step forward for standards in microbial community analysis. BMC Microbiol 14:112. https://doi .org/10.1186/1471-2180-14-112.

18.        Gonzalez A, Navas-Molina JA, Kosciolek T, McDonald D, Vazquez-Baeza Y, Ackermann G, DeReus J, Janssen S, Swafford AD, Orchanian SB, Sanders JG, Shorenstein J, Holste H, Petrus S, Robbins-Pianka A, Brislawn CJ, Wang M, Rideout JR, Bolyen E, Dillon M, Caporaso JG, Dorrestein PC, Knight R. 2018. Qiita: rapid, web-enabled microbiome meta-analysis. Nat Methods 15:796–798. https://doi.org/10.1038/s41592-018-0141-9.

19.        Shi W, Qi H, Sun Q, Fan G, Liu S, Wang J, Zhu B, Liu H, Zhao F, Wang X, Hu X, Li W, Liu J, Tian Y, Wu L, Ma J. 2019. gcMeta: a Global Catalogue of Metagenomics platform to support the archiving, standardization and analysis of microbiome data. Nucleic Acids Res 47:D637–D648. https://doi .org/10.1093/nar/gky1008.

20.        Wu S, Sun C, Li Y, Wang T, Jia L, Lai S, Yang Y, Luo P, Dai D, Yang YQ, Luo Q, Gao NL, Ning K, He LJ, Zhao XM, Chen WH. 2019. GMrepo: a database of curated and consistently annotated human gut metagenomes. Nucleic Acids Res 48:D545–D553. https://doi.org/10.1093/nar/gkz764.

21.        Su X, Jing G, McDonald D, Wang H, Wang Z, Gonzalez A, Sun Z, Huang S, Navas J, Knight R, Xu J. 2018. Identifying and predicting novelty in microbiome studies. mBio 9:e02099-18. https://doi.org/10.1128/mBio .02099-18.

22.        Su X, Jing G, Sun Z, Liu L, Xu Z, McDonald D, Wang Z, Wang H, Gonzalez A, Zhang Y, Huang S, Huttley G, Knight R, Xu J. 2020. Multiple-disease detection and classification across cohorts via microbiome search. mSystems 5:e00150-20. https://doi.org/10.1128/mSystems.00150-20.

23.        Ondov BD, Bergman NH, Phillippy AM. 2011. Interactive metagenomic visualization in a Web browser. BMC Bioinformatics 12:385. https://doi .org/10.1186/1471-2105-12-385.

24.        Su X, Jing G, Zhang Y, Wu S. 2020. Method development for cross-study microbiome data mining: challenges and opportunities. Comput Struct Biotechnol J 18:2075–2080. https://doi.org/10.1016/j.csbj.2020.07.020.

25.       Truong DT, Franzosa EA, Tickle TL, Scholz M, Weingart G, Pasolli E, Tett A, Huttenhower C, Segata N. 2015. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat Methods 12:902–903. https://doi.org/10.1038/ nmeth.3589.

26.        Franzosa EA, McIver LJ, Rahnavard G, Thompson LR, Schirmer M, Weingart G, Lipson KS, Knight R, Caporaso JG, Segata N, Huttenhower C. 2018. Species-level functional profiling of metagenomes and metatranscriptomes. Nat Methods 15:962–968. https://doi.org/10.1038/s41592 -018-0176-y.

27.        Kanehisa M, Goto S, Sato Y, Furumichi M, Tanabe M. 2012. KEGG for integration and interpretation of large-scale molecular data sets. Nucleic Acids Res 40:D109–D114. https://doi.org/10.1093/nar/gkr988.

28.        McDonald D, Price MN, Goodrich J, Nawrocki EP, DeSantis TZ, Probst A, Andersen GL, Knight R, Hugenholtz P. 2012. An improved Greengenes taxonomy with explicit ranks for ecological and evolutionary analyses of bacteria and archaea. ISME J 6:610–618. https://doi.org/10.1038/ismej .2011.139.

29.        Jing G, Sun Z, Wang H, Gong Y, Huang S, Ning K, Xu J, Su X. 2017. ParallelMETA 3: comprehensive taxonomical and functional analysis platform for efficient comparison of microbial communities. Sci Rep 7:40371. https:// doi.org/10.1038/srep40371.

30.        Chen IA, Chu K, Palaniappan K, Pillay M, Ratner A, Huang J, Huntemann M, Varghese N, White JR, Seshadri R, Smirnova T, Kirton E, Jungbluth SP, Woyke T, Eloe-Fadrosh EA, Ivanova NN, Kyrpides NC. 2019. IMG/M v.5.0: an integrated data management and comparative analysis system for microbial genomes and microbiomes. Nucleic Acids Res 47:D666–D677. https://doi.org/10.1093/nar/gky901.

31.        Langille MG, Zaneveld J, Caporaso JG, McDonald D, Knights D, Reyes JA, Clemente JC, Burkepile DE, Vega Thurber RL, Knight R, Beiko RG, Huttenhower C. 2013. Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nat Biotechnol 31:814–821. https://doi.org/10 .1038/nbt.2676.

32.        Douglas GM, Maffei VJ, Zaneveld JR, Yurgel SN, Brown JR, Taylor CM, Huttenhower C, Langille MGI. 2020. PICRUSt2 for prediction of metagenome functions. Nat Biotechnol 38:685–688. https://doi.org/10.1038/ s41587-020-0548-6.

33.        Su X, Wang X, Jing G, Ning K. 2014. GPU-Meta-Storms: computing the structure similarities among massive amount of microbial community samples using GPU. Bioinformatics 30:1031–1033. https://doi.org/10.1093/ bioinformatics/btt736.

34.        Jing G, Zhang Y, Yang M, Liu L, Xu J, Su X. 2020. Dynamic Meta-Storms enables comprehensive taxonomic and phylogenetic comparison of shotgun metagenomes at the species level. Bioinformatics 36:2308–2310. https://doi.org/10.1093/bioinformatics/btz910.

35.        Caporaso JG, Kuczynski J, Stombaugh J, Bittinger K, Bushman FD, Costello EK, Fierer N, Pena AG, Goodrich JK, Gordon JI, Huttley GA, Kelley ST, Knights D, Koenig JE, Ley RE, Lozupone CA, McDonald D, Muegge BD, Pirrung M, Reeder J, Sevinsky JR, Turnbaugh PJ, Walters WA, Widmann J, Yatsunenko T, Zaneveld J, Knight R. 2010. QIIME allows analysis of highthroughput community sequencing data. Nat Methods 7:335–336. https:// doi.org/10.1038/nmeth.f.303.

猜你喜歡

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公眾號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧秘  

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」

點擊閱讀原文,跳轉最新文章目錄閱讀

相關焦點

  • 國家微生物中心精品課:徐健 單細胞技術在微生物組研究中的應用
    國家微生物科學數據中心特別邀請我國微生物組學技術及大數據領域十位名師,推出網絡系列精品課程,本期邀請中科院青島生物能源與過程研究所徐健研究員分享《單細胞技術在微生物組研究中的應用》。本課程從菌群單細胞分析歷史研究,單細胞分析機遇和挑戰等角度講解單細胞技術在微生物組研究中的應用,包括解析拉曼光譜,拉曼組推斷細胞表型/功能。歡迎大家登陸國家微生物科學數據中心網站(http://nmdc.cn/video)觀看學習。
  • 中國土壤微生物組:進展與展望|研究
    此外,全球氣候變化也可能促進植物群落更快地演化,改變凋落物的質量和數量,進而影響地下食物網的結構和功能。土壤微生物組也是氮氧化物排放的重要來源。據估算,全球每年氮肥投入量高達上億噸,絕大部分氮肥以銨態氮的形式進入土壤後,必須在微生物的作用下才能完成氮循環維繫地球生態系統的可持續發展。而這一過程中會產生大量的氧化亞氮和一氧化氮等溫室氣體並影響氣候變化。
  • NAR:MicrobiomeAnalyst微生物組分析師——統計、可視化和元分析微生物組數據的網頁工具
    微生物組數據分析分為四大類:1. 物種組成taxonomic profiling - 群體組成特徵,基於生態的方法有Alpha多樣性(樣本內多樣性),Beta多樣性(樣本間多樣性);2. 功能組成functional profiling - 分配基因為不同的功能組(如代謝通路或生物過程),以理解功能潛能;3.
  • 個人電腦搭建微生物組分析平臺(Win/Mac)
    121個人電腦搭建微生物組分析平臺(Win/Mac)本節作者:劉永鑫 中國科學院遺傳與發育生物學研究所版本1.0.3
  • 121個人電腦搭建微生物組分析平臺(Win/Mac)
    121個人電腦搭建微生物組分析平臺(Win/Mac)本節作者:劉永鑫 中國科學院遺傳與發育生物學研究所版本1.0.3
  • 微生物群和微生物組有區別嗎?本文帶你詳細了解它們的前世今生
    該定義代表了微生物群落定義的實質性進步,因為它定義了具有不同特性和功能的微生物群落及其與環境的相互作用,從而形成了特定的生態位。微生物組的常用定義但是,在過去的幾十年中,還發布了許多其他的微生物組定義。
  • 健康的人類微生物組
    即使某個特定的群落結構提供了所有必要的核心功能,但如果沒有這種適應性,就不能長期保證核心功能。因此,微生物組對壓力和幹擾的抵抗力及其之後恢復健康功能的能力是表徵健康微生物組的潛在特性之一。一項針對2型糖尿病的大型中國研究很快貢獻了145個腸道宏基因組,其中大約一半來自非糖尿病對照組。此後,MetaHIT協會繼續發布來自歐洲成年人的新的腸道宏基因組。人類微生物組群項目(HMP)和人類腸道宏基因組學(MetaHIT)倡議是第一個定義健康人體微生物組組成和功能的大型微生物組項目。這些努力為了解宿主相關微生物群落的生理和功能特性提供了基礎。
  • 宏基因組/微生物組雜誌簡介及2020最新影響因子
    此刊發表有大量本領域的方法、軟體、測評的文章,上圖中的三期封面分別為:18年11月宏基因組建庫組裝方法、19年2月超高速細菌基因組檢索、和19年6月水稻根系微生物組,本平臺均進行了專題報導。此外,我們還報導多篇此雜誌文章如下:自然方法 Nature Methods
  • Nature:何勝洋和辛秀芳組發表植物葉際微生物組穩態機制
    在該研究的基礎上,作者團隊利用擬南芥四突變體mfec (min7 fls2 efr cerk1)在高溼度的條件下顯現出黃化和壞死的病症的特點,通過16S rRNA基因擴增子測序檢測了健康葉片(野生型,Col-0)和不健康葉片(突變體,mfec)葉片總微生物組和葉內微生物組,結果表明,健康葉片和不健康葉片的總微生物組的多樣性沒有顯著差異,但是葉內微生物組的豐度和多樣性均有顯著的變化
  • [視頻]雅虎發布iOS版Flickr 3.0 新增高清視頻和圖像搜索功能
    周四的時候,雅虎發布了全新改版後的iOS版Flickr 3.0應用,而為了提升與Instagram的競爭力,新版還引入了高清視頻和圖像搜索功能
  • Nature綜述:Rob Knight帶你分析微生物組數據(2020版)
    物種分類標記基因方法採用廣泛關注的單拷貝基因,如【MetaPhlAn2一條命令獲得宏基因組物種組成】和TIPP。此外HUMAnN2:人類微生物組統一代謝網絡分析2可進一步注釋基因和代謝通路。如果有物種和功能注釋兩種需求,使用MEGAN同時獲得兩類功能也是推薦的。因為每個讀長是獨立處理的,所以基於讀長的方法對於處理土壤微生物組的大數據集更高效的。
  • 245熱圖展示微生物組的物種和功能豐度或有無、距離矩陣
    圖表結果:圖中展示了人工重組的菌在接種後,也可以形成豐度各異的微生物群體,並與自然條件下很多組成結構保持一致。圖表結論或規律:受水楊酸調控差異表達的菌,可以在人工重組實驗中得到驗證。圖片優點:配色採用紅白藍,比較嚴肅;圖中添加了聚類信息、分組信息和菌分類信息,極大的增加了圖片的信息豐富度和可讀性。例2.
  • 信息處理生產力工具 虎博搜索App 2.0升級內容詳解
    近日,虎博科技旗下旗艦產品虎博搜索細分了工作與休閒的不同使用場景,針對PC端和手機端的不同使用體驗,正式推出App 2.0版本,新增7*24小時快訊及行研智能提取功能,大幅提升了產品的易用性和智能化程度,進一步提高行業研究人員的信息獲取效率。
  • MPB:張雲增、王年等-​柑橘根際和根表微生物組樣品的收集及核酸提取方法
    在線文檔(https://kdocs.cn/l/cL8RRqHIL)大眾評審頁面登記姓名、單位和行號索引的修改建議。修改意見的徵集截止時間為推文發布後的72小時,文章將會結合有建設性的修改意見進一步修改後獲得DOI在線發表,同時根據貢獻程度列為審稿人或致謝。感謝廣大同行提出寶貴意見。
  • Etsy使用Goolge Gloud提升搜索功能的進化,平臺銷售額激增2.6億美元
    分享平臺實操乾貨,搜羅全球營銷零售趨勢,讓你base in China 也能睜眼看世界。
  • 小說精品屋 - plus v2.0.2 發布,小說爬蟲/原創網站
    小說精品屋-plus v2.0.2版本發布了,主要改進包括:更新
  • 日常飲食調節小腸微生物組-上皮-免疫穩態和腸炎
    日常飲食調節小腸微生物組-上皮-免疫穩態和腸炎 作者:小柯機器人 發布時間:2020/9/4 17:42:16 以色列魏茨曼科學研究所Eran Elinav和Hagit Shapiro研究組的最新研究表明,日常飲食調節小腸(SI
  • Nature子刊:教你零基礎開展微生物組數據分析和可視化
    (ii) 鳥槍法宏基因組學,以了解微生物組的功能潛力,(ii) 宏轉錄組學,通過基因表達譜來測量其功能活性,目前幾個能通過處理原始下機數據得到特徵豐度表,例如:QIIME,mothur,UPARSE, DADA2,One Codex,Kraken,MetaPhlAn;特徵豐度表和樣本相關信息(元數據)是下遊統計分析和功能解釋的關鍵。
  • 中國微生物組研究如何自強
    而近日,美國白宮以總統名義發布「國家微生物組計劃」之舉使得「微生物」在神秘之外,平添了攸關國家科技競爭力的更深層含義。 6月2日,本報記者就「中國微生物研究自強之路」話題,專訪了中科院微生物研究所黃力、朱寶利兩位研究員及清華大學生命科學學院微生物學和生物材料專家陳國強教授。
  • NBT:Rob Knight團隊發表微生物組數據降維新方法
    然而,由於微生物組測序數據集的性質,利用這種類型的實驗設計存在多個挑戰。探索微生物組測序數據的一種常用方法是對距離矩陣進行降維(例如,主坐標分析(PCoA)),該矩陣描述了樣本之間的關係,從而可以觀察到整個數據集的整體差異。但是,當應用於重複測量時,此方法並未考慮固有的時間或空間相關性結構。