利用宏基因組數據組裝巨病毒基因組的優勢與限制

2020-12-21 美格基因

科學實驗往往來自人們的奇思妙想,今天給大家分享一個有趣的研究,作者將已知巨病毒顆粒摻入到廢水樣品中,再嘗試通過宏基因組從數據中恢復巨病毒基因組,從而判斷此方式對於巨病毒研究的可靠性和有效性。測試結果到底如何?一起往下看吧!

Advantages and Limits of Metagenomic Assembly and Binning of a Giant Virus

利用宏基因組數據組裝巨病毒基因組的優勢與限制

作者:Frederik Schulz 等

期刊:mSystems

時間:2020.06.23

影響因子:6.519

一、文章摘要

基因組和宏基因組的發展使科研人員可以從環境樣本中得到成千上萬種未經培養的細菌和古菌的基因序列,迅速擴展了對微生物多樣性的認識。宏基因組最近也被證明可用於評估環境病毒的組成和多樣性。巨病毒(NCLDV)的基因組大小可高達數百萬鹼基,並廣泛存在於海洋和陸地的生態系統之中,目前已有研究報導通過宏基因組從環境中成功獲得病毒基因組。說明宏基因組用於病毒基因組研究具有潛在的價值,有助於對病毒生態學和進化史等方面的深入了解。

作者通過將已知巨病毒顆粒摻入到廢水樣品中,通過採取宏基因組的方式嘗試是否能從數據中恢復巨病毒基因組,從而判斷此方式對於巨病毒研究的可靠性和有效性。

二、研究結果

作者將最近分離得到基因組大小為1.595Mb的Fadolivirus分別按照0病毒顆粒/mL(無)、103病毒顆粒/mL(低)、105病毒顆粒/mL(中)和107病毒顆粒/mL(高)摻入到廢水樣品中,並對每個廢水樣品提取得到的DNA進行宏基因組測序,使用metaSPAdes對數據進行組裝然後使用MetaBAT 2進行binning分析,共獲得115個MAG,基於CheckM的分類學將105個MAG注釋為細菌,1個MAG注釋為古菌(圖1.a)。通過比對發現注釋為古菌的MAG與Fadolivirus基因組的相似度超過99.7%,可以確認成功檢測到外源添加的Fadolivirus。該病毒MAG僅在高濃度病毒顆粒樣本中被檢測到,為了測試其他常用binning方法作者採用了MetaBAT 2-dc、MaxBin2、CONCOCT和DAS_Tool對宏基因組組裝結果進行分析,發現獲得與Fadolivirus基因組達到相似度98.3%~99.7%的MAG(表1)。

圖1.宏基因組組裝與binning得到Fadolivirus 的MAG。a:MAG質量情況統計;b:Fadolivirus 的MAG與Fadolivirus 的基因組的比對圖。

表1.不同binning工具的分析結果統計

與Fadolivirus的基因組相似度最高的MAG是由MetaBAT 2分析獲得,大小為1.623Mb,相似度達到99.7%,共有12條contigs,N50為481kb。在該病毒MAG中缺少了Fadolivirus基因組中約為5kb的序列,但存在一個在Fadolivirus基因組中沒有的contig,此外,作者發現在該病毒MAG的8條contigs末端存在高度重複序列(圖1.b)。

為了檢測外源加入的Fadolivirus的檢出限,作者將所有樣本的宏基因組數據比對到Fadolivirus的基因組中,發現在高濃度病毒顆粒樣本中比對到Fadolivirus基因組的數據量是中濃度病毒顆粒樣本的68倍,與低濃度病毒顆粒樣本相比數據量更是高出了4194倍,在沒有外源加入病毒顆粒的樣本中並沒有數據可比對上Fadolivirus基因組(圖2.a)。

圖2.宏基因組的Fadolivirus基因組分析。a:不同濃度病毒顆粒樣本的數據比對結果統計;b:巨病毒MCP分析。

同時作者對NCLDV的衣殼蛋白(MCP)進行分析以確認能否從宏基因組數據中獲得更多的病毒相關信息。從宏基因組數據鑑定得到的MCP與Fadolivirus基因組注釋的MCP以及從NCBI的Nr資料庫收錄的MCP進行比對發現每個樣本僅有1-6個MCP,而且這些MCP的reads覆蓋度很低(圖2.b)。Fadolivirus的MCP僅在高濃度病毒顆粒和中濃度病毒顆粒樣本中發現,且僅能從高濃度病毒顆粒樣本中獲得較為完整的MCP,在中濃度病毒顆粒樣本中獲得了12條屬於Fadolivirus MCP的contigs。

三、總結

本研究突出了宏基因組中提取巨病毒基因組的可能性和局限性,例如需要足夠的數據量、覆蓋度和有效的分析工具。本研究中的測試數據在目前和未來對未培養的巨病毒基因組研究十分重要,有助於擴展對巨病毒遺傳多樣性的認識和推斷他們與宿主的相互作用。

您可能還喜歡:研究思路|三代宏基因組應用案例解讀(第二期)

新品|美格基因重磅推出宏基因組(病原微生物研究)測序產品服務

相關焦點

  • 從宏基因組數據中挖掘、分析和整合病毒信號
    今天分享的生物信息分享工具,VirMiner,一款網頁伺服器,用於宏基因組數據的分析,挖掘、分析和整合病毒信號。一、背景病毒是微生物群落的重要組成部分,有助於其穩態和進化。人體腸道菌群中的病毒群落以噬菌體為主。
  • 利用深度變體自動編碼器改進宏基因組的組裝
    利用深度變體自動編碼器改進宏基因組的組裝 作者:小柯機器人 發布時間:2021/1/5 16:19:03 丹麥哥本哈根大學Simon Rasmussen課題組的最新研究利用深度變體自動編碼器改進了宏基因組的組裝。
  • Nanopore宏基因組測序揭示汙水處理過程中可移動抗生素抗性基因組
    為了驗證基於Nanopore測序的微生物群落分析的準確性,對混合進水的多耐藥培養物進行了Illumina宏基因組測序。結果顯示Illumina測序分類結果在優勢種水平上與Nanopore測序獲得的基本一致。同時,使用宏基因組測序和16S rRNA(V4和V6區)的分類鑑定結果在科(family)水平上觀察到的結果基本一致。
  • 利用單細胞鏈測序和長讀取實現全階段人基因組組裝
    利用單細胞鏈測序和長讀取實現全階段人基因組組裝 作者:小柯機器人 發布時間:2020/12/9 13:07:05 德國杜塞道夫海因裡希·海涅大學Tobias Marschall和美國華盛頓大學Evan E.
  • 醫學院向燁研究組發文揭示複雜有尾病毒組裝成熟分子機制
    文章採用結構生物學手段來揭示噬菌體φ29在組裝成熟過程中如何感知並終止病毒基因組DNA轉運包裝,以及感染過程中病毒是如何釋放其基因組DNA等一系列過程的分子機制。噬菌體φ29是目前研究較為廣泛的有尾非包膜病毒之一。它通過其非收縮性短尾結構侵染並將病毒基因組DNA注入宿主枯草芽孢桿菌(Bacillus subtilis)中。
  • 研究揭示高效從頭基因組組裝工具WENGAN
    研究揭示高效從頭基因組組裝工具WENGAN 作者:小柯機器人 發布時間:2020/12/15 16:18:36 法國裡昂大學Marie-France Sagot、Alex Di Genova研究團隊在研究中取得進展。
  • 科學家開發出評估病毒基因組質量和完整性的新工具
    科學家開發出評估病毒基因組質量和完整性的新工具 作者:小柯機器人 發布時間:2020/12/22 22:27:01 美國勞倫斯伯克利國家實驗室Nikos C.
  • 科學家發現迄今為止最大噬菌體 基因組是普通噬菌體的15倍
    他們一共鑑定出351種不同的巨型噬菌體,它們的基因組都比以單細胞細菌為食的病毒的平均基因組大四倍以上。其中有迄今為止發現的最大噬菌體:它的基因組有73.5萬個鹼基對長,幾乎是普通噬菌體的15倍。這個已知最大的噬菌體基因組比許多細菌的基因組大得多。「我們正在探索地球的微生物群落,有時會出現意想不到的事情。
  • Nat Med:科學家成功利用宏基因組測序技術快速識別人類體液中的病...
    2020年11月16日 訊 /生物谷BIOON/ --近日,一項刊登在國際雜誌Nature Medicine上的研究報告中,來自加利福尼亞大學等機構的科學家們通過研究發現,利用宏基因組測序技術(metagenomic sequencing)或能快速檢測人類體液樣本中的病原體,文章中,研究人員描述了他們如何對多種人群開展宏基因組測序檢測,其中大部分人群都是因病住院的患者
  • Science:發現一種新的巨病毒---Yaravirus,此外,還在動物組織中...
    但是,我們真正知道多少種病毒?另一個研究團隊剛剛發現了數千種新病毒,它們潛藏在數十種動物的組織中。Abrahão說,這些發現說明了我們對病毒「還有很多仍然需要去了解」。Abrahão在搜尋巨病毒(Science, 2017, doi:10.1126/science.aal4657)時發現了這種病毒。巨病毒的大小與細菌相當。
  • 《科學大家》專欄|鎖定「毒源」的利器:基因組時代的病原檢測技術
    這種方法通過對一個病毒的基因片段進行上億次的擴增,使痕量的病毒核酸得以檢測,所以在臨床上得到了比較多的應用。但PCR的方法受制於對病毒序列的依賴,即必須先要知道病毒的基因序列才能設計出PCR的檢測方法。「一錘定音」:宏基因組測序技術近年來,高通量的宏基因組測序技術逐漸得到了應用,並且發揮了重要的作用,特別是在病原體的診斷當中,發揮「一錘定音」的作用。
  • 科學家利用CRISPR剪切冠狀病毒基因組 有效減少病毒...
    科學家利用CRISPR剪切冠狀病毒基因組 有效減少病毒複製  Evelyn Zhang • 2020-03-26 19:40:30 來源:前瞻網
  • 新冠患者復陽,是因為病毒整合到了他們的基因組?
    他表示,雖然別的非逆轉錄病毒,像RNA病毒包括伊波拉,整合到脊椎動物基因組的情況之前也曾報導過,但是新冠病毒基因整合到病人基因組的機率很小,也未必會有生物學和病理意義。「真若有整合到人體基因組的情況,根據整合位點的不同,有可能對正常細胞功能和外源病毒感染都會有影響。無論如何,這方面需要更深入的研究。」
  • 病毒學國家重點實驗室主任藍柯|2020年中成果總結
    致力於腫瘤病毒感染與致瘤的機制研究,利用具有潛伏特徵的卡波氏肉瘤相關皰疹病毒(KSHV)以及慢性持續性感染特徵的B型肝炎病毒(HBV)作為模式病原,深入研究病毒和宿主相互作用及感染致病機制,發展有效的抗病毒治療策略。
  • 巴西全新神秘病毒,90%基因無法識別,構成病毒新譜系
    基因組幾乎全新的病毒雅拉病毒由 80 納米的小顆粒組成, 形狀上並不大,但當觀察它的基因組時,卻又是如此獨特。與其他分離的阿米巴病毒不同的是,雅拉病毒攜帶了大量以前沒有描述過的基因。研究人員發現 90% 以上的雅拉病毒基因從未被描述過,成為了所謂的孤兒基因。
  • 研究人員破解新冠病毒基因組特徵 或源自蝙蝠
    4月28日,據外媒報導,一組西方計算機科學家和生物學家通過使用機器學習,為29個不同的COVID-19 DNA序列確定了潛在的基因組特徵。這一新的數據發現工具將使研究人員能夠在短短幾分鐘內快速輕鬆地對一種致命病毒(如COVID-19)進行分類,這一過程和速度對於在大流行期間進行戰略規劃和調動醫療需求具有重要意義。同時,這項研究也支持了COVID-19起源於蝙蝠的科學假說,即Betacoronavirus屬,Sarbecovirus亞屬。
  • 蘭州大學學者利用比較基因組學解析盲鼴鼠物種形成模式和適應機制
    蘭州大學學者利用比較基因組學解析盲鼴鼠物種形成模式和適應機制 2020-12-14 09:52 來源:澎湃新聞·澎湃號·政務