簡單粗暴,微生物生態研究中常用資料庫簡介

2021-01-18 生信圈

 微生物生態(MicrobialEcology),又名環境微生物(Environmental Microbiology),是研究微生物之間及其與環境之間相互關係的學科。從生物角度,其研究對象主要有:
➤真核微生物(Eukaryotes,如原生生物、真菌等)
➤原核微生物(Prokaryotes,細菌和古菌)
➤病毒(Viruses)[1]。

隨著高通量測序的發展,我們可以很容易地從環境中獲得大量微生物marker基因序列,如原核的16S rDNA序列,真核的18S rDNA序列、ITS(ribosomalinternal transcribed spacer)序列等。拿到序列後,面臨的一個重要問題就是:選擇什麼資料庫進行比對才能得到較好的分類鑑定結果呢?其實針對每一類生物的主要marker序列都有相應的資料庫以方便比對鑑定。今天盧瑟菌就和大家簡單聊一下微生物生態研究中那些個常用的marker基因序列資料庫。   



RDP                        


簡介:

RDP資料庫全稱「RibosomalDatabase Project」,該資料庫提供質控、比對、注釋的細菌、古菌16S rRNA基因真菌28S rRNA基因序列。目前其資料庫最新版本為RDP Release 11.5,於2016年9月30日更新。更新後的資料庫包含3,356,809條比對、注釋的原核16S rRNA基因序列和125,525條真菌28S rRNA基因序列。

RDP是目前較常用的rRNA基因高通量測序後作為比對、注釋的參考資料庫。此外,還可用於平時菌種鑑定時,對少量rRNA基因測序後的物種進行分類鑑定,此時主要用其Classifier功能(http://rdp.cme.msu.edu/classifier/classifier.jsp),可非常方便地確定某條rRNA基因序列從門到屬/種水平的分類信息並給出各水平相應的置信度。


主頁:

    http://rdp.cme.msu.edu/index.jsp


 


SILVA


簡介:

SILVA一詞起源於拉丁文silva(意為forest),它是一個包含三域微生物(細菌、古菌、真核)rRNA基因序列的綜合資料庫,其資料庫涵蓋了原核和真核微生物的小亞基rRNA基因序列(簡稱SSU,即16S18SrRNA)和大亞基rRNA基因序列(簡稱LSU,即23S28SrRNA)。目前其最新資料庫版本為SILVA SSU andLSU databases 128,更新時間為2016年9月29日,最新版本資料庫包含的數據信息見下表1所示。

1 SILVA SSU andLSU databases 128資料庫基本參數信息


SSU參考序列

SSU非冗餘參考序列

LSU總序列

LSU參考序列

版本

128

128

128

128

總序列

1,922,213

645,151

735,238

154,297

細菌

1,719,541

552,377

176,194

130,965

古菌

64,390

24,315

1528

1271

真核

140,020

68,996

557,769

22,105

可培養

36,747

36,747

24,664

8232

模式株

22,334

22,334

5809

4675


因為SILVA資料庫更新比較及時,因此是目前rRNA基因高通量測序後最常選用的參考資料庫之一。此外,與RDP類似,SILVA也可被用於平時菌種鑑定時,對少量rRNA基因測序後的物種進行分類鑑定,此時主要用其SINA Alignment Service功能(https://www.arb-silva.de/aligner/),可非常方便地確定某條rRNA基因序列從門到屬/種水平的分類信息並給出各分類水平相應的置信度。


主頁:

   https://www.arb-silva.de/


 


Greengenes


簡介:

Greengenes是專門針對細菌、古菌16S rRNA基因的資料庫,相比前面提到的RDP和SILVA資料庫,該資料庫更新速度較慢,目前更新停留在2013年5月更新的gg_13_5版本(可在該網址下載:http://greengenes.secondgenome.com/downloads/database/13_5),目前較常用於16S rRNA基因高通量測序後進行嵌合體去除的參比資料庫。目前,比較火的一個分析——PICRUST,即根據16S rRNA高通量測序結果預測微生物群落功能的分析,也是基於gg_13_5資料庫開發的,因此,想做PICRUST分析也必須依託Greengenes的gg_13_5資料庫進行比對。


主頁:
http://greengenes.lbl.gov/


 

EzBioCloud


簡介:
EzBioCloud是與Greengenes資料庫類似,也是專門針對細菌、古菌16SrRNA基因的資料庫,但其特點是以可培養的細菌、古菌16S rRNA基因序列為主。該資料庫對與2016年10月1日進行了網站更新,其中最常用的功能是通過與該資料庫比對,確定某16S rRNA基因序列對應物種在資料庫中的近緣可培養/模式種,此時用到的是資料庫的Identify功能(http://www.ezbiocloud.net/identify),網站要求應用該功能時需要先通過郵箱註冊後方可使用。相比上面提到的RDP、SILVA和Greengenes來說,該資料庫較少用於16S高通量測序後的參比資料庫。


主頁:

   http://www.ezbiocloud.net/dashboard


  


簡介:

PR2(ProtistRibosomal Reference database)資料庫是專門針對真核微生物小亞基SSU rRNA(即18SrRNA)基因的資料庫。該資料庫主要由核編碼的原生生物序列構成,但為方便分析18S的高通量測序數據,資料庫也包含了後生生物、陸地植物、大型真菌和真核細胞器(線粒體、質體等)的SSU序列。內含子和嵌合體序列已被去除。現PR2主頁因技術故障無法登陸,但是資料庫一直在更新,最新數據可在https://figshare.com/articles/PR2_rRNA_gene_database/3803709下載。


3 PR2資料庫(v.1)中在Super-Group物種分類水平上注釋的18S rRNA基因序列數

 



簡介:

PhytoREF資料庫是專門針對質體(plastid)中16SrRNA基因的資料庫。所有陸地、淡水、海洋中的含質體生物16S rRNA基因序列都囊括在該資料庫內,包括陸地植物、海洋和淡水大型和微型藻類等的質體


主頁:http://phytoref.org/ (不知何原因,目前該網站無法登陸,所以沒圖



簡介:

浮遊有孔蟲界(planktonic Foraminifera /Rhizaria)是一類在海洋中廣泛存在的浮遊原生生物,其在海洋碳循環中起重要作用,且其化石可用以生物年代地層和古氣候重建。PFR2是專門針對浮遊有孔蟲界18SrRNA基因的資料庫。目前更新版本為1.0,於2015年1月20日釋放,包含3322條高質量的浮遊有孔蟲界18S rRNA基因序列。


主頁:

    http://pfr2.sb-roscoff.fr/



UNITE


簡介:

ITS(ribosomalinternal transcribed spacer核糖體基因內轉錄間隔區)是最常用的真菌鑑定及多樣性檢測的marker基因,UNITE資料庫就是專門針對真菌ITS序列的資料庫。UNITE常被用於ITS序列高通量測序後對真菌進行分類注釋的比對資料庫,目前資料庫已經更新至版本7.1,更新時間為2016年11月20日,包含8180條高質量ITS參考序列,下載地址為:https://unite.ut.ee/repository.php。當然,UNITE網站也可對單挑ITS序列進行進行在線分類鑑定(https://unite.ut.ee/analysis.php)。


主頁:

   https://unite.ut.ee/


 


ITS2


簡介:

位於真核生物5.8S和28S rRNA基因之間的ITS2基因常被用於鑑定真核微生物的marker序列。ITS2資料庫就是專門針對真核微生物ITS2序列的資料庫


主頁:

    http://its2.bioapps.biozentrum.uni-wuerzburg.de/




簡介:

FunGene(Functional Gene)是RDP延伸的一個針對微生物功能基因序列的資料庫。其按照功能分為抗生素抗性(Antibiotic resistances)、植物致病基因(Plant Pathogenicity)、生物地球化學循環(Biogeochemical cycles)、系統進化markerPhylogenetic markers)、生物降解(Biodegradation)、金屬循環(Metal Cycling)及其他(Other等七類功能基因。每類都包含幾到上百種功能marker基因,可被用於功能marker基因高通量測序後的比對及功能基因引物設計等。


主頁:

    http://fungene.cme.msu.edu/


 

 

上述只是幾個比較常用的資料庫,除此之外還有很多新出的,好用的資料庫(當然還有我們的最愛NCBI Blast)   

[1]https://en.wikipedia.org/wiki/Microbial_ecology#cite_note-BartonNorthup2011-2

[2]Cole J R, Wang Q, Fish J A, et al. Ribosomal Database Project: data andtools for high throughput rRNA analysis[J]. Nucleic acids research, 2013:gkt1244.

[3]Quast C, Pruesse E, Yilmaz P, et al. The SILVA ribosomal RNA gene databaseproject: improved data processing and web-based tools[J]. Nucleic acidsresearch, 2013, 41(D1): D590-D596.

[4]Kim O S, Cho Y J, Lee K, et al. Introducing EzTaxon-e: a prokaryotic 16S rRNAgene sequence database with phylotypes that represent uncultured species[J].International journal of systematic and evolutionary microbiology, 2012, 62(3):716-721.

[5]DeSantis T Z, Hugenholtz P, Larsen N, et al. Greengenes, a chimera-checked 16SrRNA gene database and workbench compatible with ARB[J]. Applied andenvironmental microbiology, 2006, 72(7): 5069-5072.

[6]Kõljalg U, Nilsson R H, Abarenkov K, et al. Towards a unified paradigm forsequence‐basedidentification of fungi[J]. Molecular ecology, 2013, 22(21): 5271-5277.

[7]Guillou L, Bachar D, Audic S, et al. The Protist Ribosomal Reference database(PR2): a catalog of unicellular eukaryote small sub-unit rRNA sequences withcurated taxonomy[J]. Nucleic acids research, 2012: gks1160.

[8]Koetschan C, Hackl T, Müller T, et al. ITS2 database IV: interactive taxonsampling for internal transcribed spacer 2 based phylogenies[J]. MolecularPhylogenetics and Evolution, 2012, 63(3): 585-588.

[9]Decelle J, Romac S, Stern R F, et al. PhytoREF: a reference database of theplastidial 16S rRNA gene of photosynthetic eukaryotes with curated taxonomy[J].Molecular ecology resources, 2015, 15(6): 1435-1445.

[10]Morard R, Darling K F, Mahé F, et al. PFR2: a curated database of planktonicforaminifera 18S ribosomal DNA as a resource for studies of plankton ecology,biogeography and evolution[J]. Molecular ecology resources, 2015, 15(6):1472-1485.

[11]Hulo C, De Castro E, Masson P, et al. ViralZone: a knowledge resource tounderstand virus diversity[J]. Nucleic acids research, 2011, 39(suppl 1):D576-D582.

[12]Fish J A, Chai B, Wang Q, et al. FunGene: the functional gene pipeline andrepository[J]. Frontiers in microbiology, 2013, 4: 291.

 

本文轉載自微生物生態,如有侵權請聯繫公眾號刪除

生信圈致力於每天推送生物信息乾貨,讓大家了解生信行業。旨在通過更多的交流促進行業的發展。我們一直在尋找志同道合的夥伴!投稿郵箱:bioinfor_club@163.com

生信圈

相關焦點

  • 腸道微生物常用代謝資料庫簡介
    腸道微生物產生的代謝產物直接與宿主發生相互作用,調控宿主體內的穩態,影響宿主的各種健康問題,例如糖尿病、心臟病,甚至上升到神經系統中,與抑鬱密切相關
  • 人類腸道微生物分離群資料庫建立
    人類腸道微生物分離群資料庫建立 作者:小柯機器人 發布時間:2019/9/3 12:27:42 麻省理工學院和哈佛大學的布羅德研究所E. J. Alm和R. J.
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 微生物研究必知的6個知識點 | 16S專題
    原標題:微生物研究必知的6個知識點 | 16S專題 編者按 敲黑板,劃重點啦~今天起,我們將與大家一起徜徉在微生物研究的海洋,希望可以為大家的微生物研究添磚加瓦。
  • 方法 | 教你如何下載知網中pdf格式的碩博士論文
    內標法測序研究生物炭對大豆土壤細菌群落的影響古菌漫談 | 深古菌門--Bathyarchaeota簡單粗暴!系統發育樹的構建-MEGA篇利用反向穩定同位素標記方法檢測微生物降解有機物的活性蠟狀芽胞桿菌類群(Bacillus cereus group)分類研究利用穩定同位素探針(SIP)揭示不可培養微生物的功能如何用FAPROTAX預測微生物群落功能海洋可培養微生物的鑑定與分類
  • 國家微生物科學數據中心: 打造全球微生物資源核心資料庫
    世界微生物數據中心主任、國家微生物科學數據中心主任馬俊才在接受記者採訪時介紹說,中心的數據內容完整覆蓋微生物資源、微生物及交叉技術方法、研究過程及工程、微生物組學、微生物技術,以及微生物文獻、專利、專家、成果等微生物研究的全生命周期。
  • 環境微生物生態問題集合答疑-總結
    問題總結擴增子研究中批次效應太大,儘量不要多次測樣擴增子分析儘量使用ASV來聚類OTU,認可比較大,比較主流系統發育在組間比較還是要注意,鄧老師作為開發者目前也只是在組內比較。建議做系統發育分析要比對方法之間的適應性,而不是簡單的借用,參考使用。稀有物種是否可靠是作為是否用其來參與系統發育分析的一個評價指標。
  • 研究蛋白質你的資料庫用對了嗎?常用蛋白質資料庫分享
    6.InterPro網址:http://www.ebi.ac.uk/interpro/簡介:蛋白質綜合資料庫,從大量的資料庫中整合而成的包括蛋白質結構域3.Sys-BodyFluid網址:https://omictools.com/sys-bodyfluid-tool簡介:人體體液蛋白組研究資料庫
  • 宏基因組 微生物組 微生物生態領域雜誌簡介及最新影響因子
    期刊簡介:IF(2018): 31.398; 中科院一區;雙周刊;年文章數701篇。期刊簡介:Nature子刊,全稱Multidisciplinary Journal of Microbial Ecology(微生物生態交叉學科雜誌),IF(2018): 9.520; 中科院一區;年文章數346篇。微
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    )》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。
  • 生物晶片在環境微生物研究中的應用
    三 生物晶片在環境微生物研究中的應用(1)基因表達分析基因表達分析可以用於了解微生物在生態環境中的功能活動,mRNA 是轉錄基因表達的中間產物,基因晶片可以通過對mRNA 的檢測來分析基因的表達情況。研究者用基因晶片對枯草芽孢桿菌的孢子形成、生物合成和厭氧生長進行了基因表達分析,這些研究說明了晶片技術可以為研究微生物對生態環境和其他生物的反應提供獨特的方法和信息。
  • 國家微生物中心精品網課:鄧曄 微生物生態與組學大數據分析
    國家微生物科學數據中心特別邀請我國微生物組學技術及大數據領域十位名師,推出網絡系列精品課程,本期邀請中國科學院生態環境研究中心鄧曄研究員分享《微生物生態與組學大數據分析》。本課程從微生物生態的概念、研究內容、微生物生態思維考量微生物組研究、環境微生物領域重點關注的問題,微生物生態科學與應用前沿等不同角度進行講解,包括環境微生物組的檢測技術熱點、宏基因組技術的開發等內容。歡迎大家登陸國家微生物科學數據中心網站(http://nmdc.cn/video)觀看學習。
  • Hadoop大數據生態系統及常用組件簡介
    今天,雲智慧的李林同學就為大家介紹一下Hadoop生態圈一些常用的組件。不是資料庫啊。)         Flume        Flume是Cloudera提供的一個高可用的,高可靠的,分布式的海量日誌採集、 聚合和傳輸的系統,Flume支持在日誌系統中定製各類數據發送方,用於收集數據;同時,Flume提供對數據進行簡單處理,並寫到各種數據接受方(可定製)的能力。
  • 微生物修復(ISSAPGPR原位生態修復技術)河道治理技術的研究
    1、技術原理ISSA PGPR原位生態修復技術是通過將激活PGPR所需的各種營養物質製成生態修復劑,再投放在生態反應池中,建立起「PGPR選擇性激活平臺」,同時把這些營養物質持續提供給水環境中的PGPR微生物,從而使得原來湖水中的PGPR微生物被連續不斷地激活並且快速繁殖,促進生態系統修復。
  • | 超實用的假期資料庫使用方法(下)
    登錄個人VPN帳號,訪問圖書館主頁點擊上方菜單「資源」——「資料庫」在「資源導航」頁面點擊「按學科查看」,即可查詢本學科已購資料庫列表常用資料庫(化學/生物/醫學)ACS Publications (美國化學學會)1.資料庫簡介:
  • 生態中心微生物群落穩定性研究獲進展
    千龍網北京9月30日訊 據中國科學院官網消息,中國科學院生態環境研究中心中科院環境生物技術重點實驗室鄧曄研究組,在微生物群落的穩定性機制研究方面取得進展,為微生物多樣性與生態系統功能關係的理解提供了新見解,研究結果在線發表在Molecular Ecology上。
  • 深海所在馬裡亞納海溝深淵微生物生態角色研究中獲進展
    近日,中國科學院深海科學與工程研究所深海生物學研究室王勇團隊報導了馬裡亞納海溝深淵微生物生態角色研究的新進展。海鬥深淵指深度在6000米以下的深海區域,以低溫和超高靜水壓為典型環境特徵。由於受採樣技術的限制,目前對深淵微生物的研究仍舊極為有限。