《核酸研究》:高質量模式微生物基因組資料庫及分析平臺

2020-12-24 中國生物技術網

近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。

模式菌株(type strains)是在給微生物定名、分類記載和發表時,以純菌狀態所保存的菌種,是微生物分類學的標準參考物質,也是理想的生物技術研究工具,具有重要的科研和產業價值。模式菌株長期以來分散在全球各國超過100餘個保藏中心,是各個保藏中心甚為珍貴的資源。2018年,微生物所牽頭組織發起了全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果。

由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。

gcType資料庫主頁

16770個物種 截止到2020年11月,所有有效發表的原核微生物物種信息及其對應的菌株信息

可以直接通過點擊主頁上的數字16770查詢這些物種名稱所對應的模式菌株編號(strain),測序狀態(sequencing status)和測序中心(sequencing center)。也可以通過點擊主頁左邊Data→Valid published species進入到相同的查詢頁面。

如果想查詢這16770個有效發表物種名稱的16s rDNA 基因序列,可以通過點擊主頁左側Data→16S rDNA sequences進行全部的查詢。資料庫還利用打分程序,對多條序列進行了質量評估,為研究人員推薦最佳質量序列。

67351個模式菌株 所有有效發表的原核微生物物種,在全球微生物保藏中心共保藏有67351個模式菌株。

可以直接通過點擊主頁上的數字67351查詢這些模式菌株所對應的物種信息。

也可以按照保藏中心來查詢模式菌株的測序情況,通過點擊主頁左側Data→Type strains by Culture Collection,可以查詢得到86家不同保藏中心的全部模式菌株的數量(type strain (total)),已經測序的模式菌株的數量(type strain (sequenced)和未測序的模式菌株的數量(type strain (un-sequenced))。還可以近一步點擊或者搜索單個保藏中心了解該保藏中心模式菌株的測序情況。

12913個基因組 所有已經完成測序的模式微生物基因組數據

可以直接通過點擊主頁上的數字12913查詢這些基因組數據所對應的物種名稱(species)、模式菌株編號、測序狀態(project status)、基因組大小(genome size)、N50數值、Scaffold數值和GC含量(GC %)。也可以通過點擊主頁左側Data→Type strain genomes進入到相同的查詢頁面。還可以利用過濾工具,按照不同條件選擇目標基因組。

資料庫還利用打分程序,對基因組數據進行了質量評估,為研究人員推薦最佳質量基因組。基因組序列的fasta文件,還可以一鍵批量下載!

1104個自測基因組

世界微生物數據中心(World data center for microorganisms,WDCM)在2018年啟動了全球微生物模式菌株基因組測序計劃(GCM2.0),目標是完成全世界所有模式微生物的基因組測序。已經吸引了來自14個國家超過20個保藏中心的加入。在這裡,有最新發布的自測基因組數據!

通過GCM測序平臺測序的基因組數據

搜索資料庫

通過物種名稱搜索

在搜索框中輸入待搜索的物種名稱,不僅能夠通過GCM資料庫搜索到與物種名稱相關的所有模式菌株編號,GCM項目編號,測序狀態和測序中心的信息。還可以通過點擊物種名稱下面的「LPSN」圖標跳轉到LPSN網站查詢其他相關信息。

以物種名稱Streptomyces rubiginosus 為例的搜索界面

通過菌株編號搜索

在搜索框中輸入待搜索的菌株編號,可以通過GCM資料庫搜索到菌株編號對應的物種名稱(species),GCM項目編號(project ID),測序狀態(sequencing status)和測序中心(sequencing center)的信息。

點擊GCM項目編號,查看對應的測序信息 (Sequencing information)和注釋結果(Annotation results)。也可以直接下載基因組fasta格式的文件

以GCM項目編號GCM60017754為例的搜索界面

如果需要通過一些關鍵字或者其他特定的篩選條件來搜索需要的信息,可以通過高級搜索來實現。

高級搜索頁面

可以利用16S rRNA基因序列,與生物信息資料庫中的16S rRNA基因序列進行比對,達到對該微生物分類鑑定的目的。將測序獲得的16S rRNA基因序列放在「Input sequence」框中,在「Job title」中填寫菌株編號或者其他名字,點擊「Blast」,就可以搜索出該基因序列所對應的物種名稱(species),一致性(Identities), 序列比對長度(Alignment Length),不匹配數(Mismatches), 缺失或插入(Gap Opens)等信息。

以物種名稱「Acanthopleuribacterpedis」的16S rRNA基因序列為例的搜索頁面

樹形結構瀏覽

點擊主頁左側Search→Tree browser進入樹形結構瀏覽搜索頁面,可以通過NCBI生物分類資料庫(NCBI taxonomy)樹形結構和基因組分類學資料庫(GTDB taxonomy)樹形結構兩種方法在古菌和細菌兩類中瀏覽已經測序過的物種。

以物種名稱「Acidilobussaccharovorans」為例的搜索界面

基因組拼接、注釋和物種鑑定

不知道用什麼工具分析?沒有足夠的計算資源?需要寫代碼太麻煩?在這個平臺裡都可以得到免費的一站式解決方案。

點擊主頁左側Tools→Genome Analysis可以在線進行基因組分析(包括基因組拼接和注釋)。點擊主頁左側Tools→Species Identification可以在線進行物種鑑定,所有的操作都是圖形化界面,只需要選擇參數,上傳序列文件就可以。物種鑑定模塊可以計算ANI,直接用於IJSEM文章發表!

如果是第一次使用這兩個功能,請點擊主頁左側Tools→Manual閱讀流程說明手冊。

在線基因組分析界面

在線物種鑑定界面

免費的新種測序和分析

平臺還可以為用戶提供免費的潛在微生物模式菌株基因組測序和分析,詳情請看模式微生物基因組可以免費測序了~

相關焦點

  • 首個園藝類作物全基因變異資料庫發布—新聞—科學網
    近日,《園藝研究》(Horticulture Research)在線發表了中國農業科學院柑桔研究所構建完成的柑桔全基因組變異資料庫
  • 分析混合微生物群落內細菌協同代謝關係,「代謝組+」聯合助力!
    美格基因即將推出代謝組業務,運用「代謝組+ 」的多組學策略助力微生物研究,將微生物研究推向更高水平。今天給大家分享一篇多組學聯合助力微生物研究的經典文章,文章運用宏基因組+宏轉錄組+代謝組學解析混合微生物群落內細菌間協同代謝關係,以下文章來源於宏基因組。
  • 上海推出「病毒基因組檢測分析平臺」 疫情期間在線免費向社會開放
    病毒基因組檢測分析平臺。上海科技創新資源數據中心 供圖(抗擊新冠肺炎)上海推出「病毒基因組檢測分析平臺」 疫情期間在線免費向社會開放中新網上海1月8日電 (鄭瑩瑩)據上海科技創新資源數據中心(以下簡稱:數據中心)8日發布的消息,由該中心與中國科學院上海巴斯德研究所聯合打造的「病毒基因組檢測分析平臺」於2021年第一個工作周正式更新上線。
  • 我國科學家構建小麥基因定位與基因組研究平臺
    近日,一個小麥基因定位與基因組研究平臺—WheatGmap構建成功,該平臺由中國農科院作科所小麥基因資源發掘與利用創新團隊牽頭構建。據介紹,這一成果為高效克隆小麥功能基因提供了一個有效的數據利用、分析和共享平臺。相關研究成果在線發表於《分子植物(Molecular Plant)》。WheatGmap頁面。
  • 研究思路|三代宏基因組應用案例解讀(第3期)
    OPERA-MS整合了宏基因組聚類和精確支架算法,基於虛擬腸道微生物組和人工群落數據測序,研究者僅用9×長讀長覆蓋深度組裝出了接近目前最完整的宏基因組,也組裝出低豐度(<1%)物種的高質量基因組。值得一提的是,OPERA-MS還可在亞種水平上獲得基因組結果。將Nanopore測序應用於抗生素治療病人的腸道宏基因組研究,發現長讀長組裝質量較短讀長提升了200倍。
  • 腸道微生物與人體健康研究進展
    北京中醫藥大學,北京 100029[摘要]人類腸道中定居著許多對宿主有益的微生物,包括細菌、病毒、真核生物等,它們在腸道內能與其他微生物及免疫系統相互作用,對人體健康具有重要影響,被稱為「被遺忘的器官」,它們的基因組也被譽為人類的「第二基因組」,與人體的能量代謝及物質代謝有關。
  • 人類腸道微生物群204938個參考基因組的統一目錄
    人類腸道微生物群204938個參考基因組的統一目錄 作者:小柯機器人 發布時間:2020/7/22 14:23:31 歐洲生物信息學研究所(EMBLEBI)Robert D.
  • Cancer Cell基於多層組學整合分析的瀰漫胃癌蛋白基因組圖譜研究
    蛋白基因組(Proteogenomics)是一種多組學分析體系,包括基因組、轉錄組、蛋白組、翻譯後修飾組等,從多組學層面重新定義疾病的分型、挖掘潛在的治療靶點,最終在蛋白水平上發現與腫瘤相關的基因突變、表達變化及關鍵分子調控機制,以進行更精準的用藥指導和藥物開發。
  • 臉紅不宜喝酒、中國人群甲狀腺疾病風險高 全自主中國人群基因研究...
    ,在中科院上海生命科學研究院主辦的《細胞探索》雜誌發表研究結果,首次報導ChinaMAP一期研究對覆蓋全國27個省份和直轄市,8個民族,超過1萬人的高深度全基因組測序數據和表型的系統性分析。上海交通大學醫學院附屬瑞金醫院、國家代謝性疾病臨床醫學研究中心王衛慶教授和畢宇芳是論文的共同通訊作者,曹亞南、李林和徐敏研究員等為共同第一作者。此次發表意味著,通過中國人自己的儀器、平臺、分析方法,對中國人的基因組特徵進行研究,具有前所未有的本土意義。
  • PNAS|口腔微生物的飢餓遊戲
    過往研究發現,大腸桿菌群體在飢餓條件下培養3天開始進入快速死亡期,死亡總數超過99%,隨後進入長期穩定期,在此期間攜帶有利突變如能通過代謝胺基酸作為能源的亞群開始活躍並且成為優勢菌群。同樣的變化規律也適用在複雜的微生物群落中,菌株的相對豐度的變化取決於誰更能適應不斷變化的環境。
  • NSR 重要觀點:微生物暗物質是什麼?
    微生物是地球上最為豐富多樣的細胞生命形式,存在於包括海洋、熱泉、沙漠等各種生境中。目前有超過 99% 的細菌和古菌物種尚未以純培養方式獲得,也就是說我們對於神秘的微生物世界至今也只是窺探到冰山一角。這些只能以免培養方式檢測到的未培養微生物被稱為微生物暗物質(Microbial Dark Matter,MDM)。
  • 為核酸檢測提供標準物質 ——訪2013級科技啟明星上海計量院劉剛
    時至今日,不管是已經廣泛應用的臨床診斷試劑,還是最前沿的框架核酸、生物納米機器人研究,核酸作為分子工具仍然廣受關注。劉剛的博士研究,聚焦於核酸分子在電化學傳感界面的自組裝、構型構象調控和傳感模型設計。這個研究方向既包含了分子構型變化理論預期設計,又需要基於電化學分析裝置、材料,開展實驗結果的探索和驗證。
  • 中科院北京基因組研究所韓大力研究組招聘助理研究員、博士後
    ▎藥明康德內容團隊編輯 課題組簡介 韓大力研究員畢業於中國科學技術大學,2012年獲得中科院遺傳所生物信息學博士學位,之後在美國芝加哥大學進行博士後研究工作,2017年回國加入中科院北京基因組研究所任研究員
  • 高質量蛇瓜基因組首次發布
    本報訊近日,《園藝研究》在線發表了北京市農林科學院蔬菜研究中心(國家蔬菜工程技術研究中心)副研究員左進華團隊與英國諾丁漢大學教授Donald Grierson團隊、美國康奈爾大學BTI研究所教授費章君團隊的研究論文,揭示了蛇瓜基因組及其果實成熟的調控機制。
  • 兩篇Cell子刊文章深度剖析基因組自我調節的新型分子機制
    2020年2月8日 訊 /生物谷BIOON/ --近日,兩篇刊登在國際雜誌Molecular Cell上的研究報告中,來自加州理工學院等機構的科學家們通過研究揭示了基因組自我調節的分子機制。
  • 研究發現:CRISPR可能導致大量重複片段插入基因組 且無法被PCR等...
    研究發現:CRISPR可能導致大量重複片段插入基因組 且無法被PCR等標準方法識別  Evelyn Zhang • 2020
  • 甘肅全力打造全國首個《敦煌文博會研究專題資料庫》
    中國甘肅網5月22日訊5月21日上午,甘肅省文博局與甘肅省委黨校召開了《敦煌文博會研究專題資料庫》建設工作對接會,討論研究專題資料庫建設工作。該資料庫由省文博局與甘肅省委黨校合作建設,是全國黨校系統圖書館「四大專題資料庫」子庫項目之一。