《核酸研究》:高質量模式微生物基因組資料庫及分析平臺

2021-01-11 中國生物技術網

近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。

模式菌株(type strains)是在給微生物定名、分類記載和發表時,以純菌狀態所保存的菌種,是微生物分類學的標準參考物質,也是理想的生物技術研究工具,具有重要的科研和產業價值。模式菌株長期以來分散在全球各國超過100餘個保藏中心,是各個保藏中心甚為珍貴的資源。2018年,微生物所牽頭組織發起了全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果。

由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。

gcType資料庫主頁

16770個物種 截止到2020年11月,所有有效發表的原核微生物物種信息及其對應的菌株信息

可以直接通過點擊主頁上的數字16770查詢這些物種名稱所對應的模式菌株編號(strain),測序狀態(sequencing status)和測序中心(sequencing center)。也可以通過點擊主頁左邊Data→Valid published species進入到相同的查詢頁面。

如果想查詢這16770個有效發表物種名稱的16s rDNA 基因序列,可以通過點擊主頁左側Data→16S rDNA sequences進行全部的查詢。資料庫還利用打分程序,對多條序列進行了質量評估,為研究人員推薦最佳質量序列。

67351個模式菌株 所有有效發表的原核微生物物種,在全球微生物保藏中心共保藏有67351個模式菌株。

可以直接通過點擊主頁上的數字67351查詢這些模式菌株所對應的物種信息。

也可以按照保藏中心來查詢模式菌株的測序情況,通過點擊主頁左側Data→Type strains by Culture Collection,可以查詢得到86家不同保藏中心的全部模式菌株的數量(type strain (total)),已經測序的模式菌株的數量(type strain (sequenced)和未測序的模式菌株的數量(type strain (un-sequenced))。還可以近一步點擊或者搜索單個保藏中心了解該保藏中心模式菌株的測序情況。

12913個基因組 所有已經完成測序的模式微生物基因組數據

可以直接通過點擊主頁上的數字12913查詢這些基因組數據所對應的物種名稱(species)、模式菌株編號、測序狀態(project status)、基因組大小(genome size)、N50數值、Scaffold數值和GC含量(GC %)。也可以通過點擊主頁左側Data→Type strain genomes進入到相同的查詢頁面。還可以利用過濾工具,按照不同條件選擇目標基因組。

資料庫還利用打分程序,對基因組數據進行了質量評估,為研究人員推薦最佳質量基因組。基因組序列的fasta文件,還可以一鍵批量下載!

1104個自測基因組

世界微生物數據中心(World data center for microorganisms,WDCM)在2018年啟動了全球微生物模式菌株基因組測序計劃(GCM2.0),目標是完成全世界所有模式微生物的基因組測序。已經吸引了來自14個國家超過20個保藏中心的加入。在這裡,有最新發布的自測基因組數據!

通過GCM測序平臺測序的基因組數據

搜索資料庫

通過物種名稱搜索

在搜索框中輸入待搜索的物種名稱,不僅能夠通過GCM資料庫搜索到與物種名稱相關的所有模式菌株編號,GCM項目編號,測序狀態和測序中心的信息。還可以通過點擊物種名稱下面的「LPSN」圖標跳轉到LPSN網站查詢其他相關信息。

以物種名稱Streptomyces rubiginosus 為例的搜索界面

通過菌株編號搜索

在搜索框中輸入待搜索的菌株編號,可以通過GCM資料庫搜索到菌株編號對應的物種名稱(species),GCM項目編號(project ID),測序狀態(sequencing status)和測序中心(sequencing center)的信息。

點擊GCM項目編號,查看對應的測序信息 (Sequencing information)和注釋結果(Annotation results)。也可以直接下載基因組fasta格式的文件。

以GCM項目編號GCM60017754為例的搜索界面

如果需要通過一些關鍵字或者其他特定的篩選條件來搜索需要的信息,可以通過高級搜索來實現。

高級搜索頁面

可以利用16S rRNA基因序列,與生物信息資料庫中的16S rRNA基因序列進行比對,達到對該微生物分類鑑定的目的。將測序獲得的16S rRNA基因序列放在「Input sequence」框中,在「Job title」中填寫菌株編號或者其他名字,點擊「Blast」,就可以搜索出該基因序列所對應的物種名稱(species),一致性(Identities), 序列比對長度(Alignment Length),不匹配數(Mismatches), 缺失或插入(Gap Opens)等信息。

以物種名稱「Acanthopleuribacterpedis」的16S rRNA基因序列為例的搜索頁面

樹形結構瀏覽

點擊主頁左側Search→Tree browser進入樹形結構瀏覽搜索頁面,可以通過NCBI生物分類資料庫(NCBI taxonomy)樹形結構和基因組分類學資料庫(GTDB taxonomy)樹形結構兩種方法在古菌和細菌兩類中瀏覽已經測序過的物種。

以物種名稱「Acidilobussaccharovorans」為例的搜索界面

基因組拼接、注釋和物種鑑定

不知道用什麼工具分析?沒有足夠的計算資源?需要寫代碼太麻煩?在這個平臺裡都可以得到免費的一站式解決方案。

點擊主頁左側Tools→Genome Analysis可以在線進行基因組分析(包括基因組拼接和注釋)。點擊主頁左側Tools→Species Identification可以在線進行物種鑑定,所有的操作都是圖形化界面,只需要選擇參數,上傳序列文件就可以。物種鑑定模塊可以計算ANI,直接用於IJSEM文章發表!

如果是第一次使用這兩個功能,請點擊主頁左側Tools→Manual閱讀流程說明手冊。

在線基因組分析界面

在線物種鑑定界面

免費的新種測序和分析

平臺還可以為用戶提供免費的潛在微生物模式菌株基因組測序和分析,詳情請看模式微生物基因組可以免費測序了~

相關焦點

  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    )》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 全球微生物模式基因組測序計劃獲進展
    全球模式微生物基因組資料庫(Global Catalogueof Type Strain, gcType)整合了16701個有效發表的原核生物的超過13,944個基因組數據(Nucleic Acids Research, 2020),是目前在模式微生物基因組方面數據最全面,功能最完善的數據平臺,為用戶提供一站式的數據管理和基因組注釋、新種鑑定等分析。
  • 全球微生物模式基因組測序計劃取得重要進展
    10月29日,《核酸研究》(Nucleic AcidsResearch)在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。
  • 《核酸研究》發表全球模式微生物基因組測序計劃重要進展
    10月29日,《核酸研究(Nucleic AcidsResearch)》>在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。
  • 模式微生物基因組可以免費測序了
    依託於中國科學院微生物研究所的世界微生物數據中心(WFCC-MIRCEN World Data Centre for Microorganisms, WDCM)在2017年底啟動了全球微生物模式菌株基因組測序計劃(GCM2.0),目前已經有16個國家的25家微生物資源保藏中心的正式加入。
  • 手把手教你提交微生物基因組序列數據
    科學家們往NCBI/EMBL/DDBJ等資料庫提交的核酸序列數據,也可以提交到國家微生物科學數據中心(NMDC)了!包括生物項目數據(BioProject),即生物學研究項目信息進行收集整理的資料庫,可以根據所產生的數據類型來識別一個項目;生物樣本數據(BioSample)為一個中心位置,可與項目庫連結,也可獨立,用於收集病毒、細菌、真菌等微生物的菌株及樣本、微生物環境樣本(元基因組)描述信息;核酸序列數據(NucleotideSeq)收集16S rRNA、rRNA-ITS等特徵基因片段以及其他微生物相關的核酸序列
  • 全球模式微生物基因組和微生物組測序合作計劃正式啟動
    全球模式微生物基因組和微生物組測序合作計劃正式啟動 來源:中國生物技術信息網   發布者:尹海華   日期:2017-10-12   今日/總瀏覽:1/5866
  • 中國海洋大學發布國際首個軟體動物綜合基因組資料庫
    本報訊 10月23日,中國海洋大學海洋生物遺傳學與育種教育部重點實驗室包振民院士團隊在國際資料庫領域頂級期刊《核酸研究》在線發表了國際首個軟體動物綜合基因組資料庫「MolluscDB:系統整合功能和進化組學資源的軟體動物超大類群基因組資料庫」。
  • 中國海洋大學科研團隊發布國際首個軟體動物綜合基因組資料庫
    2020年10月23日,中國海洋大學海洋生物遺傳學與育種教育部重點實驗室包振民院士團隊在國際資料庫領域頂級期刊Nucleic Acids Research(《核酸研究》)在線發表了國際首個軟體動物綜合基因組資料庫「MolluscDB: an integrated functional and evolutionary genomics database for the hyper-diverse
  • 國家級一站式微生物資源鑑定、保藏、測序、數據分析及發布平臺
    目前平臺了整合微生物資源保藏庫、高通量測序平臺、高性能計算和存儲資源,依託中心在菌種資源保藏和標準化菌種庫建設、微生物培養組技術、微生物基因組和元基因組測序技術、大規模數據挖掘技術方面的團隊技術優勢,構建標準化實驗與分析流程、建立自主的微生物資源庫與資料庫、開發生物信息學新方法新工具,挖掘微生物大數據蘊含的價值,服務國內外整體科研需求,現面向微生物領域研究機構、企事業單位開展微生物菌種鑑定與保藏、微生物資源菌種庫
  • 北京基因組所等開發完成基於K-mer的基因組組分分析資料庫
    為此,中國科學院北京基因組研究所基因組科學與信息重點實驗室於軍組和英國倫敦大學學院(UCL)腫瘤研究所王大鵬合作開發了一套基於K-mer算法的基因組組分分析資料庫KGCAK。此項研究於近期發表在Biology Direct 雜誌。
  • 泛基因組資料庫:找到油菜的「好基因」
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。
  • 數據分析:創建統一的公有基因組數據平臺
    基因組學的科研人員正越來越多地使用雲計算服務,谷歌的雲計算服務就是其中之一今年三月基因組學領域的科研工作者們迎來了一件大喜事:美國國立衛生研究院NIH取消了不準將其dbGap資料庫中的基因組信息上傳到雲端的規定。這一規定設立於2007年,它的取消無疑為科研工作者存儲和分析基因組信息提供了便利。
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。 有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?
  • 海大包振民院士團隊發布軟體動物綜合基因組資料庫
    青島日報社/觀海新聞10月30日訊 日前,中國海洋大學海洋生物遺傳學與育種教育部重點實驗室包振民院士團隊取得重要成果,在國際資料庫領域頂級期刊《核酸研究》在線發表了國際首個軟體動物綜合基因組資料庫。構建系統便捷、功能全面的基因組學資料庫在解決這一難題上發揮著重要作用。當前,國際上廣泛使用的大型公共基因組資料庫仍主要聚焦並服務於人類醫學及小鼠、斑馬魚、果蠅等模式生物研究。
  • 植物研究必備!常用資料庫和生物信息學工具,值得收藏
    集成植物基因組學、表型和遺傳學數據的共享型平臺http://harvest.ucr.edu/作物EST序列及相關分子信息數據平臺http://www.gramene.org/ Gramene:用於作物和模式物種的比較功能基因組學分析的綜合平臺
  • 我國建成全球第四個綜合基因組權威資料庫
    人民網北京12月20日電(趙竹青)近日,中國科學院北京基因組研究所生命與健康大數據中心團隊題為「The BIG Data Center: from deposition to integration to translation」(北京基因組研究所生命與健康大數據中心:從存儲到整合
  • 菸草局:中國菸草基因組資料庫(1.0版)開放運行
    3月15日,中國菸草基因組資料庫(1.0版)面向行業開放運行。中國菸草基因組資料庫的開放運行,標誌著菸草基因組計劃重大專項取得了新的進展。    中國菸草基因組資料庫設在國家菸草基因研究中心,由國家菸草基因研究中心負責資料庫管理和維護。