《核酸研究》:高質量模式微生物基因組資料庫及分析平臺

2020-12-18 中國生物技術網

近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。

模式菌株(type strains)是在給微生物定名、分類記載和發表時,以純菌狀態所保存的菌種,是微生物分類學的標準參考物質,也是理想的生物技術研究工具,具有重要的科研和產業價值。模式菌株長期以來分散在全球各國超過100餘個保藏中心,是各個保藏中心甚為珍貴的資源。2018年,微生物所牽頭組織發起了全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果。

由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。

gcType資料庫主頁

16770個物種 截止到2020年11月,所有有效發表的原核微生物物種信息及其對應的菌株信息

可以直接通過點擊主頁上的數字16770查詢這些物種名稱所對應的模式菌株編號(strain),測序狀態(sequencing status)和測序中心(sequencing center)。也可以通過點擊主頁左邊Data→Valid published species進入到相同的查詢頁面。

如果想查詢這16770個有效發表物種名稱的16s rDNA 基因序列,可以通過點擊主頁左側Data→16S rDNA sequences進行全部的查詢。資料庫還利用打分程序,對多條序列進行了質量評估,為研究人員推薦最佳質量序列。

67351個模式菌株 所有有效發表的原核微生物物種,在全球微生物保藏中心共保藏有67351個模式菌株。

可以直接通過點擊主頁上的數字67351查詢這些模式菌株所對應的物種信息。

也可以按照保藏中心來查詢模式菌株的測序情況,通過點擊主頁左側Data→Type strains by Culture Collection,可以查詢得到86家不同保藏中心的全部模式菌株的數量(type strain (total)),已經測序的模式菌株的數量(type strain (sequenced)和未測序的模式菌株的數量(type strain (un-sequenced))。還可以近一步點擊或者搜索單個保藏中心了解該保藏中心模式菌株的測序情況。

12913個基因組 所有已經完成測序的模式微生物基因組數據

可以直接通過點擊主頁上的數字12913查詢這些基因組數據所對應的物種名稱(species)、模式菌株編號、測序狀態(project status)、基因組大小(genome size)、N50數值、Scaffold數值和GC含量(GC %)。也可以通過點擊主頁左側Data→Type strain genomes進入到相同的查詢頁面。還可以利用過濾工具,按照不同條件選擇目標基因組。

資料庫還利用打分程序,對基因組數據進行了質量評估,為研究人員推薦最佳質量基因組。基因組序列的fasta文件,還可以一鍵批量下載!

1104個自測基因組

世界微生物數據中心(World data center for microorganisms,WDCM)在2018年啟動了全球微生物模式菌株基因組測序計劃(GCM2.0),目標是完成全世界所有模式微生物的基因組測序。已經吸引了來自14個國家超過20個保藏中心的加入。在這裡,有最新發布的自測基因組數據!

通過GCM測序平臺測序的基因組數據

搜索資料庫

通過物種名稱搜索

在搜索框中輸入待搜索的物種名稱,不僅能夠通過GCM資料庫搜索到與物種名稱相關的所有模式菌株編號,GCM項目編號,測序狀態和測序中心的信息。還可以通過點擊物種名稱下面的「LPSN」圖標跳轉到LPSN網站查詢其他相關信息。

以物種名稱Streptomyces rubiginosus 為例的搜索界面

通過菌株編號搜索

在搜索框中輸入待搜索的菌株編號,可以通過GCM資料庫搜索到菌株編號對應的物種名稱(species),GCM項目編號(project ID),測序狀態(sequencing status)和測序中心(sequencing center)的信息。

點擊GCM項目編號,查看對應的測序信息 (Sequencing information)和注釋結果(Annotation results)。也可以直接下載基因組fasta格式的文件

以GCM項目編號GCM60017754為例的搜索界面

如果需要通過一些關鍵字或者其他特定的篩選條件來搜索需要的信息,可以通過高級搜索來實現。

高級搜索頁面

可以利用16S rRNA基因序列,與生物信息資料庫中的16S rRNA基因序列進行比對,達到對該微生物分類鑑定的目的。將測序獲得的16S rRNA基因序列放在「Input sequence」框中,在「Job title」中填寫菌株編號或者其他名字,點擊「Blast」,就可以搜索出該基因序列所對應的物種名稱(species),一致性(Identities), 序列比對長度(Alignment Length),不匹配數(Mismatches), 缺失或插入(Gap Opens)等信息。

以物種名稱「Acanthopleuribacterpedis」的16S rRNA基因序列為例的搜索頁面

樹形結構瀏覽

點擊主頁左側Search→Tree browser進入樹形結構瀏覽搜索頁面,可以通過NCBI生物分類資料庫(NCBI taxonomy)樹形結構和基因組分類學資料庫(GTDB taxonomy)樹形結構兩種方法在古菌和細菌兩類中瀏覽已經測序過的物種。

以物種名稱「Acidilobussaccharovorans」為例的搜索界面

基因組拼接、注釋和物種鑑定

不知道用什麼工具分析?沒有足夠的計算資源?需要寫代碼太麻煩?在這個平臺裡都可以得到免費的一站式解決方案。

點擊主頁左側Tools→Genome Analysis可以在線進行基因組分析(包括基因組拼接和注釋)。點擊主頁左側Tools→Species Identification可以在線進行物種鑑定,所有的操作都是圖形化界面,只需要選擇參數,上傳序列文件就可以。物種鑑定模塊可以計算ANI,直接用於IJSEM文章發表!

如果是第一次使用這兩個功能,請點擊主頁左側Tools→Manual閱讀流程說明手冊。

在線基因組分析界面

在線物種鑑定界面

免費的新種測序和分析

平臺還可以為用戶提供免費的潛在微生物模式菌株基因組測序和分析,詳情請看模式微生物基因組可以免費測序了~

相關焦點

  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • Briefings in Bioinformatics:微生物基因組學和功能基因組學相關軟體和資料庫的研究進展
    微生物基因組學和功能基因組學相關軟體和資料庫的研究進展原標題:Recent developments of software and database
  • 三大基礎公共資料庫介紹
    目前生物信息學研究者已經開發了2000多個分子生物學資料庫,幾乎覆蓋了生命科學的各個領域,大致可分為五類:基因組資料庫、核酸序列資料庫、蛋白質序列資料庫、生物大分子(主要是蛋白質)三維結構資料庫以及根據生命科學不同研究領域的實際需要,對基因組、核酸和蛋白序列、蛋白質結構和文獻等數據進行分析、整理、歸納、注釋,構建具有特殊生物學意義和用途的二次資料庫。
  • 宏基因組測序技術在病原微生物檢測中的臨床應用與存在的問題及面臨挑戰
    核酸含量mNGS從根本上講是一種直接核酸檢測方法,通過回收基因組DNA或RNA來鑑定病原微生物,如果標本中不包含病原微生物核酸或核酸含量較低,則可產生假陰性結果,如局限性腦膿腫、一過性感染或低滴度(<100拷貝)感染等。
  • 微生物基因組研究掃盲系列|2
    本系列內容涉及基因組學、高通量測序相關基本概念,基因組分析中常見問題等,每期5-10個FAQ,希望對大家有用。大家有其他相關的問題,可以在後臺留言,我們會盡力在下期為您解答。前期微生物基因組研究掃盲系列連結:微生物基因組研究掃盲系列|1Q1:
  • 第一章 生物資料庫——01
    比如從三大核酸資料庫和基因組資料庫中提取並加工出的果蠅和蠕蟲資料庫,再比如根據蛋白質三維結構資料庫中的結構信息,分析統計出的蛋白質結構分類資料庫 CATH 和 SCOP 等。美國基因組研究所致力 於微生物基因組的研究,也有部分植物基因組項目。它是克萊格·凡特研究所的一部分。自 1995 年成立之初的兩個基因組,至今已擁有超過 700 個基因組,而且還將更多。TIGR 是 NCBI 基因組資源的有力補充,因為它不僅擁有已完成測序的基因組,還有那些測序中的基 因組信息。
  • NCBI微生物基因組批量下載
    親愛的科研同僚們,在曲折的探索道路上是否還在為找不到目標物種的基因組而抓耳撓腮?不要哭,今天小編就為大家提供幾個批量下載某物種或特定物種基因組並獲取基因組預測及注釋信息的方法。二、Batch Entrez微生物基因組批量下載:1、根據登錄號① 將登錄號整理成一個List文件② 登陸網址Batch Entrez(http://www.ncbi.nlm.nih.gov/sites/batchentrez),將準備好的登錄號文件(如下左圖
  • Natue | 地球微生物組的基因組圖集
    在這裡,我們將這種方法應用於從覆蓋地球所有大陸和海洋的不同棲息地收集的超過10,000個基因組,包括來自人類和動物宿主、工程環境以及自然和農業土壤的基因組,以捕捉現存的微生物、代謝和功能潛力。     這個研究集合包括52,515個基因組,代表12,556個新的候選物種級別的分類單位,涵蓋135個門。
  • Cell Research | 華農解析水虻基因組圖譜和腸道微生物組降解規律
    近日,華中農業大學生命科學技術學院張吉斌教授課題組與上海植物生理研究所黃勇平研究員課題組合作,對武漢亮斑扁角水虻純化10代的品系進行了全基因組測序,獲得了高質量水虻基因組圖譜,並對水虻轉化不同有機廢棄物的腸道微生物組進行分析,揭示了水虻能在畜禽糞汙等惡劣環境中高效利用有機廢棄的機制。
  • 【合作文章】花生蛋白基因組研究
    目前,蛋白基因組已成功應用到癌症研究上(CPTAC),探索基因變異事件與致癌機理的關係。此外,蛋白基因組也應用到動物、植物和微生物新基因、小肽、LncRNA表達等方面。 【策略】整個蛋白質基因組研究參照如下流程圖 (Figure 1) 主要分為四個步驟:一 數據收集除了已有的花生蛋白質組、轉錄組數據之外, 本研究還檢索了PRIDE,iProx等公共資料庫,力求收集到儘可能多的花生已發表公共數據,最終收集到超過700萬張譜圖的質譜數據和近
  • 2019微生物組—宏基因組分析專題培訓開課啦!
    背景:國際微生物組、中國微生物組計劃研究對象:人、動物、植物、環境研究方法:培養組學、擴增子、宏基因組、宏轉錄組、宏蛋白組、宏代謝組、宏基因組關聯分析、宏表觀組……宏基因組學的研究熱點:培養組、腸菌與疾病、宏基因組關聯分析(MWAS)、多組學聯合分析……測序發展史與原理樣品製備、實驗重複和測序數據量的選擇宏
  • 科學網—犬科動物資料庫iDog正式上線
    本報訊 近日,由中國科學院昆明動物所與北京基因組所合作開發的犬科動物資料庫iDog正式上線。
  • 進擊的古基因組研究—新聞—科學網
    ,它揭開了有關中國南北方史前人群格局及遷移與混合這一重大學術問題上的若干謎團;兩個月後,該團隊又發布最新發現:通過古基因組研究發現距今約1.1萬年的中國南方未知現代人群,相關研究揭示出中國南方與東南亞人群舊石器時期的遺傳聯繫。
  • 發育研究利器——表觀遺傳之基因組印記
    說起基因組印記(Genomic imprinting),小編的記憶還停留在上學幫師兄查印記基因(imprinted genes)資料庫的時候。
  • Cell子刊發布人體腸道病毒基因組:一份全新噬菌體基線資料庫
    導讀 10月9日,《Cell Host & Microbe》發布一項人類腸道病毒基因組研究。 2003年,人類腸道病毒組的首次宏基因組研究已經揭示,人類腸道中含有大量病毒(超過10^12種)。而且,這些病毒大部分都是複雜、多樣的噬菌體,它們通過捕食細菌和水平基因轉移,在形成微生物群落方面發揮著關鍵作用。
  • DNA分析軟體
    Sequin 13.70S用來向三大核酸資料庫GenBank, EMBL, DDBJ 查詢與提交序列數據。Gene Construction Kit 4.0.3 Demo管理並顯示克隆策略中的分子構建過程,包括分子構建,電泳條帶。另外,還可以質粒作圖(有序列沒序列均可)。
  • FEMS高分綜述:追蹤微生物群落中可移動遺傳元件的實驗方法
    我們不顯示只包含特定屬或針對特定抗生素的抗生素抗性基因的專門資料庫。表S1包含了對抗生素耐藥基因、毒力因子、基因組島、質粒、轉座子和整合子的額外資料庫。表1. 可移動遺傳原件資料庫隨著每個DNA片段序列數據的實時可用,每個分子都可以通過一個名為ARMA的Metrichor軟體與已知資料庫進行相似性篩選。如果這些基因是染色體整合的,長讀長技術可以進一步為這些抗性基因提供基因組背景,允許宿主關聯,並且實時分析讀數以去除背景人類基因組讀數,以增加微生物群落的測序深度。
  • 深海所在馬裡亞納海溝深淵微生物生態角色研究中獲進展
    近日,中國科學院深海科學與工程研究所深海生物學研究室王勇團隊報導了馬裡亞納海溝深淵微生物生態角色研究的新進展。海鬥深淵指深度在6000米以下的深海區域,以低溫和超高靜水壓為典型環境特徵。由於受採樣技術的限制,目前對深淵微生物的研究仍舊極為有限。
  • 秈粳各有緣:泛基因組研究徹底讓兩大米亞種分家
    這個研究成果只是亞洲栽培稻群體的結構和分化研究工作中的一小部分——以中國科學家為主的團隊不僅揭示了亞洲栽培稻種質間存在的大量微細結構變異, 更確定了全球首個近於完整的、高質量的農作物——亞洲栽培稻的泛基因組
  • 植物科學常用資料庫和生物信息學工具,趕緊收藏,遲早用得到
    對於所有開展植物科學相關研究的科研工作者和學生群體而言,各類資料庫和分析平臺的建立和更新維護為植物的組學、功能、進化以及遺傳育種等方面研究提供了豐富的資源,具有重要的理論指導意義和應用價值。通過總結目前已有的植物科學相關的資料庫資源和分析平臺,調查其使用頻率和應用程度,可以為大家更好地開展科研工作提供便利。