三代宏基因組測序探究人類腸道中染色體外的可移動基因元件

2020-12-14 安諾基因

目前宏基因組研究主要是通過二代測序來進行研究,隨著三代測序技術的發展,PacBio SMRT測序技術應用場景越來越廣泛。與二代測序方法相比,採用PacBio SMRT長讀長測序技術的三代宏基因組可以減少部分拼接錯誤,提高基因組組裝注釋的準確性和微生物群落鑑定的解析度。接下來就通過一篇文獻跟著小編一起來看下三代宏基因組測序的具體應用吧~

長讀長宏基因組測序探究人類腸道中染色體外的可移動基因元件

發表期刊:Microbiome

發表時間:2019.08

影響因子:10.465

研究單位:東京大學

研究背景

微生物群落的宏基因組主要由細菌染色體和相關的染色體外移動基因元件(eMGEs)組成,如質粒和噬菌體(phages)。由於eMGE之間以及eMGE和染色體之間存在的同源序列,短讀長的從頭組裝易產生明顯偏短的contigs,組裝很難將完整的eMGEs拼接成環,與短讀長從頭組裝比,長讀長的從頭組裝更容易產生更長的contigs。目前還沒有關於人類腸道eMGEs深入的宏基因組學研究,人類腸道eMGEs有待深入研究。

研究思路

研究結果

1. PacBio SMRT對人類糞便樣本進行宏基因組測序

對12名健康的日本成年人的13份糞便樣本的DNA進行了PacBio宏基因組測序。平均每個樣本的數據量為11 GB,平均subreads的長度為8 k。分別使用Falcon和MegaHit進行PacBio和短讀長的從頭組裝,對比兩者結果發現,PacBio提高了組裝效果,N50 contig長度達到~202 kb,而短讀長為~4 kb(圖1a)。根據PacBio contig與相應短讀長contig之間的序列一致性來評估PacBio contig的準確性,5、10、20和≥40測序深度的PacBio contig與短讀長contig的一致性分別為99.4%、99.7%、99.8%和≥99.9%(圖1b)。

圖1 PacBio和Illumina測序組裝數據統計

a. PacBio 和Illumina組裝contig長度統計對比;b. PacBio 和Illumina組裝contig相似性對比

2. PacBio宏基因組數據中的微生物和基因組成

PacBio和MiSeq兩種數據在屬水平上估計的微生物豐度非常相似,皮爾遜相關係數的中位數為~0.99,顯著高於12個個體之間的相關係數(圖2d)。PacBio contig的平均基因長度為847 bp,比短讀長contig的662 bp長,更接近參考基因組中大多數全長基因的957 bp。每個PacBio contig平均鑑定出27.6個基因,是平均每個短讀長contig鑑定出基因數的10倍。

圖2 PacBio和MiSeq數據中微生物豐度的皮爾遜相關係數

3. 從PacBio組裝序列中生成環形的contig

總共生成了82個環形contigs(circular contigs,CCs),其中11個歸類為噬菌體,71個歸類為質粒。其中58種質粒和6種噬菌體為新發現,另外5個噬菌體與已知的crAssphage基因組(NC_024711.1)高度相似。聚類分析表明大部分質粒與厚壁菌和擬桿菌的親緣關係較近(如圖3)。

圖3 71個質粒CCS和114個人類腸道中已知質粒的系統發育進化樹

綠色為厚壁菌,紫色為放線菌,紅色為變形桿菌,藍色為擬桿菌,黃色為其他門,灰色為未知

4. 與crAssphage基因組高度相似的contigs結構

包括NC_024711.1在內的6個crAssphage的基因組編碼89-91個可能的基因,其中61個高度保守,具有≥80%的胺基酸同源性;每個基因組特有的基因數量在0-16個之間,平均每個基因組為6.3個基因,其他保守基因在2-5個之間(圖4)。

圖4 5個crAssphages和NC_024711.1的基因組結構示意圖圖4 5個crAssphages和NC_024711.1的基因組結構示意圖

棕色基因為特有基因,而藍色基因為所有基因組共有基因

5. 使用來自五個國家的413個宏基因組數據集對腸道eMGEs進行量化分析

在來自五個國家的413個腸道宏基因組的數據集(IGCJ)中,許多已鑑定的質粒是高度豐富和普遍存在的。質粒數據顯示,腸道質粒的比例是公共資料庫中的兩倍多。在該宏基因組數據集中,質粒的數量平均是細菌染色體的三倍。宿主預測表明,與微生物豐度無關,類桿菌相關的質粒佔主導地位。

圖5 IGCJ數據集中eMGEs的定量分析

6. 宏基因組數據集中腸質粒功能圖譜

對IGCJ資料庫中相對豐富的315個質粒和249條染色體的功能注釋表明,360個COGs在豐度上存在顯著差異(q值<0.05)。無機離子代謝、防禦機制以及分泌功能在質粒中比染色體相比顯著豐富。相反,染色體中與碳水化合物代謝有關的功能明顯高於質粒。

圖6 質粒和染色體中COG類型的比較

文章小結

本研究展示了從PacBio長讀長宏基因組數據中有效識別完整環形eMGE或contigs。對12份糞便樣品進行組裝,得到82個contigs(2.5 kb-666.7 kb),包括71個質粒和11個噬菌體,其中58個為新質粒和6個為噬菌體,以及5個不同的crAssphage全基因組序列。類桿菌相關的質粒佔主導地位,同時發現了幾種豐富的質粒功能,如無機離子轉運,抗生素耐藥性基因大多存在於低豐度變形桿菌相關的質粒中。長讀長測序的宏基因組學為探索人類腸道中未知的eMGE提供了一種有效的方法,積累的數據為深入了解人類腸道微生物生態提供了重要資源。

作為國內基因組行業知名企業,安諾基因擁有實力強大的測序服務平臺,配備系列先進儀器設備,三代PacBio(7臺Sequel II+10臺Sequel)為您的科研之路保駕護航;三代宏基因組組裝效果更佳,可提高樣本中物種基因的完整度,同時提高注釋的準確度和解析度,注釋到更多的低豐度物種。安諾基因已與中國農業大學、中科院遺傳與發育所、中國海洋大學、中國農業科學院、福建農林大學等多家科研院所開展了深度合作,助力基因組文章發表於Nature、Nature Plants、Nature Communications、Molecular Plant、Communications Biology、The Plant Journal等多個國際高水平期刊。

參考文獻

[1] Suzuki Yoshihiko,NishijimaSuguru,Furuta Yoshikazu et al. Long-read metagenomic exploration ofextrachromosomal mobile genetic elements in the human gut[J]. Microbiome, 2019, 7:119.

相關焦點

  • 基於「三+二」宏基因組測序的抗性基因和可移動元件的精確研究
    今天美格基因的佳作推薦基於「三+二」宏基因組測序策略提出了一套高效組裝宏基因組數據的分析流程,為抗性基因和可移動元件的精確研究提供了可靠方法。優化測序試劑和設備等後進行長序列、短序列的宏基因組測序。2、宏基因組組裝:分別使用組裝流程OPERA-MS(圖1)和其他組裝器進行宏基因組組裝,並對組裝集進行質量評估。3、人工構建GIS20腸道微生物群落及其測序:將20種已知的細菌菌株的DNA混合在一起,菌株DNA的豐度為0.1%到30%,再進行三代測序。
  • Nanopore宏基因組測序揭示汙水處理過程中可移動抗生素抗性基因組
    三代宏基因組本領大,相關文章更同樣層出不窮,今天給大家分享一篇Microbiome上的文獻,看看三代宏基因組是如何在文章中大展身手!三、研究結果1.質粒和ICEs攜帶的ARGs在WWTPs的抗性組中佔主導地位WWTPs的進水、汙泥、出水的抗性組表現在9個環境宏基因組樣本的1791個攜帶ARG的長reads和316個contigs,基於它們的HGT潛力分為2大類:細胞間可移動組和染色體組
  • 美格基因引入Nanopore平臺助力宏基因組三代測序!
    美格基因宏基因組產品升級引入Nanopore平臺助力宏基因組三代測序新增「三+二」宏基因組測序策略,讀長更長、組裝更佳更全面獲取微生物物種的全基因組序列一、產品優勢1、更真實反映菌群實際組成美格基因三代宏基因組採用「三+二」測序策略,三代宏基因組測序策略解決了二代讀長短的限制,能輕鬆覆蓋基因間區或基因特異性區域,長讀長Reads能夠更為精準地鑑定水體、土壤、腸道等生境中微生物的種類,有效提高微生物群落鑑定的解析度,更加真實的反映菌群的實際組成。
  • 快速看懂腸道菌群宏基因組測序分析報告
    是由 Handelsman 等 1998 年提出的新名詞, 其定義為「the genomes of the total microbiota found in nature」 , 即生境中全部微小生物遺傳物質的總和。它包含了可培養的和未可培養的微生物的基因, 目前主要指環境樣品中的細菌和真菌的基因組總和。
  • 【GeneThinkTank】一代和二代基因測序技術5分鐘科普
    其中,Sanger 測序作為 DNA 測序技術的金標準,曾在人類基因組計劃中發揮了關鍵推動作用,在精準醫療快速發展的今天仍是獲得高度準確測序數據的可靠方法。Sanger法核心原理是:由於ddNTP(4種帶有螢光標記的A,C,G,T鹼基)的2』和3』都不含羥基,其在DNA的合成過程中不能形成磷酸二酯鍵,因此可以用來中斷DNA合成反應。
  • 研究思路|三代宏基因組應用案例解讀(第二期)
    隨著新一代高通量測序技術的發展,三代宏基因組測序運用越來越廣泛。美格基因現已推出「三+二」測序服務,三代測序可有效減少部分拼接錯誤,提高基因組組裝準確性和微生物群落鑑定的解析度。以下為大家分享幾篇三代宏基因組應用在土壤樣本中的文獻。
  • Nature方法 | 三代長讀長宏基因組組裝軟體metaFlye
    然而,即使對於最先進的組裝算法而言,組裝複雜的宏基因組數據集的難度依然很大。在本文中,作者介紹了一款名為metaFlye的軟體,可用於長序列數據組裝,以探究細菌的組成和物種內的異質性。首先,使用模擬細菌菌群評價其組裝效果,發現metaFlye的組裝產物具有很好的序列完整性。其次,作者使用長序列測序技術檢測了綿羊的微生物組並使用metaFlye組裝了63個近似完整的細菌基因組的contig。
  • 宏基因組測序(mNGS),風口還是泡沫?
    人類和其他動植物每時每刻都生活在微生物的海洋中,僅在人類身體中,就包含了數目約為人類細胞10倍之多的微生物細胞!當中包括病毒、細菌、真菌及其他微生物。這些獨特的微生物「客人」有安靜沉默的,有打鬧破壞的(病原體),也有善良有益的。為了分辨不同的微生物以揭示其與人體的「關係」,宏基因組學(Metagenomics)被應用於臨床微生物診斷!
  • NAR | GMrepo:人類腸道宏基因組資料庫
    對收錄的樣品進行質控,分類注釋和豐度計算,最後將這些信息網頁可視化,以便用戶查詢和重利用人類腸道微生物數據。目前可查詢的表型包括年齡、性別、國家、BMI和近期抗生素使用情況等,用戶還可以通過 GMrepo 獲得預先計算好的物種豐度、表型內和表型間的流行度以及菌株共現網絡等信息。
  • 三代nanopore宏基因組測序數據分析,北京,11月7-9日
    感謝無數在抗疫保衛戰中辛苦付出的人們,才能讓我們的生產生活逐漸恢復正常。11月7-9日,我們將在北京,聯合北京金果殼生物醫學工程技術有限公司(nanopore官方代理)開啟今年的首場線下培訓班。本期主題圍繞「nanopore宏基因組測序數據分析」,nanopore測序實時,快速,便攜,長度長,高通量等諸多特點,特別適合微生物研究。
  • 華大基因主導完成腸道微生物與Ⅱ型糖尿病的宏基因組關聯分析
    久病可引起多個系統損害,病情嚴重或應激時可發生急性代謝紊亂,如酮症酸中毒等。其病因和發病機制較複雜,目前認為屬多基因、多因素的異質性疾病。人體腸道微生物對維持人類健康發揮著重大作用,並在腸道中保持著動態的平衡。而這種平衡因某些因素被打破而致使腸道菌群發生紊亂時,人體可能就會患上各種疾病。近年越來越多的研究表明Ⅱ型糖尿病可能與腸道菌群存在相關性,但是一直缺少全面系統的研究成果來支持。
  • C位勢不可擋:安諾三代測序助力蜱蟲基因組喜登Cell
    ,隨後,基於PacBio三代測序獲得的67–95X Subreads進行基因組組裝。BUSCO評估大於90%,illumina短reads的覆蓋度也都在96%以上,表明組裝基因組具有較好的完整性和準確度,可用於後續研究。
  • 疫情中發揮重要作用的宏基因組測序,在本季度獲得資本追捧
    在病毒檢測過程中,一種測序技術獲得了市場的廣泛關注,這個技術就是宏基因組測序(mNGS)技術。宏基因組學(Metagenomics),是以特定環境樣品中整個微生物群落基因組作為研究對象,無需分離培養,直接提取環境樣本的 DNA 進行高通量測序。對於臨床而言,mNGS 可以精準的分析患者樣本全部微生物,這一點對於感染性疾病的病原體研究具有極高的應用價值。
  • 宏基因組測序助力新冠病毒檢測
    一個是宏基因組,另外一個是二代測序。宏基因組學(Metagenomics)的概念最初由Jo Handelsman提出,其研究對象是樣品中的微生物群體基因組,通過測序和功能基因篩查來分析和研究微生物的種群結構、進化以及與環境之間的互作。在描述基因組時,經常用到下面這張圖。有基因組之前是釣魚,有基因組之後是網魚。基因組學家們先把魚撈出來,生化學家們再去研究功能。
  • 覃俊傑博士:走向群體化、個體化、精細化的宏基因組研究
    覃俊傑博士:走向群體化、個體化、精細化的宏基因組研究 來源:生物谷   發布者:張薦轅   日期:2016-04-21   今日/總瀏覽:1/5170
  • 多快好省的宏基因組研究技巧
    不過淺宏基因組也有其適用範圍,根據樣品類型的不同,一些樣品可能包含 >99%的人類宿主DNA,這不僅增加了序列成本,而且給測量帶來了不確定性。在許多研究中也會採取在進行宏基因組測序文庫的準備之前去除宿主DNA的方法。但是,在去除宿主DNA後,可能沒有足夠的微生物基因組DNA用於宏基因組測序,這通常需要最少50ng的輸入。
  • 構建完整雙胞胎 腸道菌群基因集---深圳特區報
    深圳特區報訊(記者 聞坤)記者昨日獲悉,由華大基因研究院、深圳國家基因庫、澳門科技大學和倫敦國王學院等機構組成的研究團隊,完成了首個雙胞胎群體的腸道微生物宏基因組鳥槍法測序研究項目,為複雜疾病中腸道菌群的預測、早期診斷、有效幹預提供了重要的參考數據。日前,這一最新成果發表於國際著名雜誌《Cell》旗下的子刊《Cell Systems》。
  • 基因測序「黑科技」 給生命來完整「數位化解讀」
    如果單次測序讀長變長,那麼獲得從頭組裝基因組的難度就會降低。人類基因組長度為30億個鹼基對,而現在單次測序的讀長僅為50—70kb(5萬到7萬個鹼基對的長度),這猶如拼一副45000塊拼圖,其中卻有很多重複相似的「小塊」,很難拼接完整。不僅需要以參考基因組做對比,還要反覆測序。「目前的行業標準是需要30倍的重複測序,以完成整個基因鏈條的拼接。」蔣慧說。
  • 年中喜報|安諾三代測序助力微擬球藻基因組發布~
    其中,安諾基因承擔了該研究中的三代測序、Hi-C輔助組裝等相關實驗和信息分析工作,安諾基因信息分析人員並列為文章共同作者。此前微擬球藻屬中N.gaditana和N.oceanica的基因組進行過Illumina二代測序組裝,基因組大小在28.5 Mb和29.0 Mb之間,基因密度高,內含子含量低,基因間隔短且重複序列少,但是組裝未達到假染色體(pseudochromosomes)水平,不利於開展後續相關基因功能的研究。
  • 基因測序產業,目前成熟了嗎?
    而在基因序列即遺傳信息不變的情況下,蛋白質的表達卻也不盡相同,這是因為機體可通過 DNA甲基化、非編碼基因、染色體重塑等多種方式對轉錄和翻譯過程做出調控,從而調控基因表達的水平,這便是表觀遺傳學的研究範疇。