《核酸研究》:高質量模式微生物基因組資料庫及分析平臺

2020-12-23 中國生物技術網

近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。

模式菌株(type strains)是在給微生物定名、分類記載和發表時,以純菌狀態所保存的菌種,是微生物分類學的標準參考物質,也是理想的生物技術研究工具,具有重要的科研和產業價值。模式菌株長期以來分散在全球各國超過100餘個保藏中心,是各個保藏中心甚為珍貴的資源。2018年,微生物所牽頭組織發起了全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果。

由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。

gcType資料庫主頁

16770個物種 截止到2020年11月,所有有效發表的原核微生物物種信息及其對應的菌株信息

可以直接通過點擊主頁上的數字16770查詢這些物種名稱所對應的模式菌株編號(strain),測序狀態(sequencing status)和測序中心(sequencing center)。也可以通過點擊主頁左邊Data→Valid published species進入到相同的查詢頁面。

如果想查詢這16770個有效發表物種名稱的16s rDNA 基因序列,可以通過點擊主頁左側Data→16S rDNA sequences進行全部的查詢。資料庫還利用打分程序,對多條序列進行了質量評估,為研究人員推薦最佳質量序列。

67351個模式菌株 所有有效發表的原核微生物物種,在全球微生物保藏中心共保藏有67351個模式菌株。

可以直接通過點擊主頁上的數字67351查詢這些模式菌株所對應的物種信息。

也可以按照保藏中心來查詢模式菌株的測序情況,通過點擊主頁左側Data→Type strains by Culture Collection,可以查詢得到86家不同保藏中心的全部模式菌株的數量(type strain (total)),已經測序的模式菌株的數量(type strain (sequenced)和未測序的模式菌株的數量(type strain (un-sequenced))。還可以近一步點擊或者搜索單個保藏中心了解該保藏中心模式菌株的測序情況。

12913個基因組 所有已經完成測序的模式微生物基因組數據

可以直接通過點擊主頁上的數字12913查詢這些基因組數據所對應的物種名稱(species)、模式菌株編號、測序狀態(project status)、基因組大小(genome size)、N50數值、Scaffold數值和GC含量(GC %)。也可以通過點擊主頁左側Data→Type strain genomes進入到相同的查詢頁面。還可以利用過濾工具,按照不同條件選擇目標基因組。

資料庫還利用打分程序,對基因組數據進行了質量評估,為研究人員推薦最佳質量基因組。基因組序列的fasta文件,還可以一鍵批量下載!

1104個自測基因組

世界微生物數據中心(World data center for microorganisms,WDCM)在2018年啟動了全球微生物模式菌株基因組測序計劃(GCM2.0),目標是完成全世界所有模式微生物的基因組測序。已經吸引了來自14個國家超過20個保藏中心的加入。在這裡,有最新發布的自測基因組數據!

通過GCM測序平臺測序的基因組數據

搜索資料庫

通過物種名稱搜索

在搜索框中輸入待搜索的物種名稱,不僅能夠通過GCM資料庫搜索到與物種名稱相關的所有模式菌株編號,GCM項目編號,測序狀態和測序中心的信息。還可以通過點擊物種名稱下面的「LPSN」圖標跳轉到LPSN網站查詢其他相關信息。

以物種名稱Streptomyces rubiginosus 為例的搜索界面

通過菌株編號搜索

在搜索框中輸入待搜索的菌株編號,可以通過GCM資料庫搜索到菌株編號對應的物種名稱(species),GCM項目編號(project ID),測序狀態(sequencing status)和測序中心(sequencing center)的信息。

點擊GCM項目編號,查看對應的測序信息 (Sequencing information)和注釋結果(Annotation results)。也可以直接下載基因組fasta格式的文件

以GCM項目編號GCM60017754為例的搜索界面

如果需要通過一些關鍵字或者其他特定的篩選條件來搜索需要的信息,可以通過高級搜索來實現。

高級搜索頁面

可以利用16S rRNA基因序列,與生物信息資料庫中的16S rRNA基因序列進行比對,達到對該微生物分類鑑定的目的。將測序獲得的16S rRNA基因序列放在「Input sequence」框中,在「Job title」中填寫菌株編號或者其他名字,點擊「Blast」,就可以搜索出該基因序列所對應的物種名稱(species),一致性(Identities), 序列比對長度(Alignment Length),不匹配數(Mismatches), 缺失或插入(Gap Opens)等信息。

以物種名稱「Acanthopleuribacterpedis」的16S rRNA基因序列為例的搜索頁面

樹形結構瀏覽

點擊主頁左側Search→Tree browser進入樹形結構瀏覽搜索頁面,可以通過NCBI生物分類資料庫(NCBI taxonomy)樹形結構和基因組分類學資料庫(GTDB taxonomy)樹形結構兩種方法在古菌和細菌兩類中瀏覽已經測序過的物種。

以物種名稱「Acidilobussaccharovorans」為例的搜索界面

基因組拼接、注釋和物種鑑定

不知道用什麼工具分析?沒有足夠的計算資源?需要寫代碼太麻煩?在這個平臺裡都可以得到免費的一站式解決方案。

點擊主頁左側Tools→Genome Analysis可以在線進行基因組分析(包括基因組拼接和注釋)。點擊主頁左側Tools→Species Identification可以在線進行物種鑑定,所有的操作都是圖形化界面,只需要選擇參數,上傳序列文件就可以。物種鑑定模塊可以計算ANI,直接用於IJSEM文章發表!

如果是第一次使用這兩個功能,請點擊主頁左側Tools→Manual閱讀流程說明手冊。

在線基因組分析界面

在線物種鑑定界面

免費的新種測序和分析

平臺還可以為用戶提供免費的潛在微生物模式菌株基因組測序和分析,詳情請看模式微生物基因組可以免費測序了~

相關焦點

  • 研究以基因組為中心解析北美白堊紀晚期尖角龍化石中的新型微生物...
    古生物學研究曾頻繁報導,中生代恐龍化石經過約2.5億年~6500萬年仍然出乎意料地保存著膠原蛋白、血管等內源性有機物。但考慮到蛋白質易於降解,且在逾百萬年的時間裡微生物很多已聚居於骨骼中的孔隙內,所以這些內源性的軟組織是否可以殘存在中生代化石骨骼中一直備受爭議。研究人員對蛋白質不穩定性進行了廣泛研究,但恐龍化石骨骼中微生物群的基因組多樣性及其在化石形成學(又稱埋藏學)中的潛在作用仍不明晰。
  • 華中農業大學構建油菜泛基因組資料庫助力油菜遺傳育種研究進入泛...
    研究團隊負責人介紹,參考基因組作為生命科學研究中的「標準地圖」,促進了動植物重要生產和經濟性狀相關的變異位點鑑定、關鍵基因的發掘與應用等研究。然而生物體在長期進化和人工選擇的作用下,同一物種各個株系在遺傳和表型等層面均積累了豐富的變異,單一參考基因組往往無法很好包含物種內豐富的遺傳變異信息。
  • 中國「十大名花」基因組研究的最新進展(上)
    高度多樣性的花、較好的基因組序列使得梅花成為研究木本植物進化的模式材料。研究者對351份梅花和其它3種李屬植物進行重測序(平均測序深度19.3×),研究了梅屬植物的遺傳結構和馴化歷史。結果表明,梅屬植物具有高度混合的群體結構,且具有李屬植物的導入特性。通過泛基因組與GWAS分析,研究者確定了一系列與表型性狀緊密相關的連鎖位點,如MYB108基因與花瓣顏色、柱頭顏色、花萼顏色和花蕾顏色正相關。
  • 科學網—犬科動物資料庫iDog正式上線
    本報訊 近日,由中國科學院昆明動物所與北京基因組所合作開發的犬科動物資料庫iDog正式上線。
  • 小麥功能基因定位及基因組研究平臺建成並成功應用
    近日,中國農業科學院作物科學研究所、四川農業大學小麥研究所/西南作物基因資源發掘與利用國家重點實驗室、成都天成未來科技有限公司合作構建了小麥基因定位與基因組研究平臺-WheatGmap(https://www.wheatgmap.org),相關研究成果在線發表於《Molecular Plant》(分子植物)雜誌上。
  • 科學家構建和解析高質量雉雞基因組序列圖譜—新聞—科學網
    (左)雄性雉雞,(右)雌性雉雞,雉雞外形具有明顯的性別差異     上海交通大學農業與生物學院孟和團隊採用多平臺策略成功地構建了染色體層級的雉雞基因組序列圖譜   研究人員採用第二代高通量測序、第三代單分子測序和Hi-C輔助基因組組裝技術,對家養雉雞進行了從頭測序、組裝和注釋,獲得了染色體層級高質量雉雞參考基因組。所得雉雞基因組大小為0.99 Gb,Contig N50達1.33 Mb,Scaffold N50達59.46 Mb,擁有23058個蛋白編碼基因。
  • 【中國科學報】狙擊「新冠」,中科院微生物所有哪些進展
    本次疫情防控阻擊戰中,微生物所積極響應黨中央和國家的號召,按照中科院的部署,盡全所之力,全力投入。  微生物所的科研攻關團隊,承擔了病毒溯源、變異模式、關鍵蛋白結構解析、抗體和疫苗等方面的研究任務,同時配合中國疾控中心,做好數據信息支撐任務。  因為這次疫情是春節前爆發,大家最近一直在加班,很多老師和同學都沒放假,頂在前線,堅守崗位,科技報國,共克時艱。
  • 「科學網」狙擊「新冠」,中科院微生物所有哪些進展
    本次疫情防控阻擊戰中,微生物所積極響應黨中央和國家的號召,按照中科院的部署,盡全所之力,全力投入。微生物所的科研攻關團隊,承擔了病毒溯源、變異模式、關鍵蛋白結構解析、抗體和疫苗等方面的研究任務,同時配合中國疾控中心,做好數據信息支撐任務。
  • ...出一款名為Genopo的app 其能用來完整分析冠狀病毒的基因組學特性
    2020年10月12日 訊 /生物谷BIOON/ --近日,一項刊登在國際雜誌Communications Biology上的研究報告中,來自雪梨加文醫學研究所等機構的科學家們通過研究開發了一種新型智慧型手機app,其能在不到半小時內對SARS-CoV-2病毒的基因組進行分析。
  • 科學網—高質量核桃基因組圖譜繪製成功
    核桃基因組圖譜   裴東供圖 本報訊 核桃是世界重要的木本油料和珍貴用材樹種,核桃堅果位居世界「四大堅果」之首。 近日,中國林業科學研究院林業研究所聯合上海師範大學、中國科學院計算技術研究所和西藏農牧科學院開展了核桃基因組深入研究,相關成果在線發表於《植物生物技術雜誌》(Plant Biotechnology Journal)。
  • 分析混合微生物群落內細菌協同代謝關係,「代謝組+」聯合助力!
    美格基因即將推出代謝組業務,運用「代謝組+ 」的多組學策略助力微生物研究,將微生物研究推向更高水平。今天給大家分享一篇多組學聯合助力微生物研究的經典文章,文章運用宏基因組+宏轉錄組+代謝組學解析混合微生物群落內細菌間協同代謝關係,以下文章來源於宏基因組。
  • 青島能源所 | 建立微擬球藻NanDeSyn資料庫網站,支撐「綠色重生」國際合作計劃
    微擬球藻作為「光合酵母」模式研究體系的優勢:核基因組為單倍體,且僅有~30M鹼基序列;已經積累了大量的多組學數據,如各種營養/環境下的基因表達譜、轉錄因子等調控元件;已經建立起了高效、靈活、多樣的遺傳操作工具,如過表達、RNAi、CRISPR/Cas9、同源重組、亞細胞定位、大片段敲除等。
  • 利用宏基因組數據組裝巨病毒基因組的優勢與限制
    迅速擴展了對微生物多樣性的認識。圖2.宏基因組的Fadolivirus基因組分析。a:不同濃度病毒顆粒樣本的數據比對結果統計;b:巨病毒MCP分析。同時作者對NCLDV的衣殼蛋白(MCP)進行分析以確認能否從宏基因組數據中獲得更多的病毒相關信息。
  • 省科學院微生物研究所發現古菌新目
    由於有限的純培養物和基因組數據,很多未鑑定的熱原體綱分支的代謝潛能和進化關係仍然未知。在這項研究中,微生物研究所許玫英研究員的科研團隊從廣東省佛山市容桂鎮的一條黑臭河流沉積物的宏基因組中構建出了4個中高質量的熱原體綱古菌基因組,隸屬於先前一個未鑑定的分支UBA10834。
  • 研究發現:「變異細菌」生活在我們的口腔
    研究發現:「變異細菌」生活在我們的口腔 近日,美國哈佛大學等機構的研究人員在發表於《基因組生物學》上的一項新研究中,檢測了人類口腔微生物群,發現口腔某些區域的細菌亞群存在令人印象深刻的變異。
  • 《微生物學報》「微生物大數據資源」專刊邀稿函
    微生物資源在生命與健康、基礎科學前沿、先進生物技術開發中起著至關重要的作用。來源於微生物的大數據資源是微生物資源的重要組成部分。隨著微生物在感染與免疫、綠色農業與可持續發展、生物技術產業、生態與國門安全等領域越來越多的應用,微生物資源及其組學數據呈現爆炸性增長,圍繞微生物大數據平臺的建設與數據的挖掘與開發,使得海量數據得以整理、整合併開放共享。建立微生物戰略生物資源從保存到利用的實物資源庫及信息平臺,對於打通資源的收集保藏-大數據分析-功能評價-技術孕育與應用全鏈條,創新生物資源研發體系至關重要。
  • NC丨密西根大學與喬治亞大學等單位合作發表特用作物-苔麩高質量基因組
    近日,Nature Communications雜誌在線發表了題為「Exceptional subgenome stability and functional divergence in the allotetraploid Ethiopian cereal teff」(衣索比亞異源四倍體作物苔麩優異的亞基因組穩定性及功能分化)的研究論文。
  • 腸道微生物與人體健康研究進展
    北京中醫藥大學,北京 100029[摘要]人類腸道中定居著許多對宿主有益的微生物,包括細菌、病毒、真核生物等,它們在腸道內能與其他微生物及免疫系統相互作用,對人體健康具有重要影響,被稱為「被遺忘的器官」,它們的基因組也被譽為人類的「第二基因組」,與人體的能量代謝及物質代謝有關。
  • 華大基因:血流感染核酸檢測試劑盒於近日完成歐盟CE認證
    來源:澎湃新聞華大基因11月25日晚間,國內基因測序龍頭企業深圳華大基因股份有限公司(下稱「華大基因」,300676)公告披露,其控股子公司深圳華大因源醫藥科技有限公司(下稱「華大因源」)研製的血流感染核酸檢測試劑盒(聯合探針錨定聚合測序法