科學實驗往往來自人們的奇思妙想,今天給大家分享一個有趣的研究,作者將已知巨病毒顆粒摻入到廢水樣品中,再嘗試通過宏基因組從數據中恢復巨病毒基因組,從而判斷此方式對於巨病毒研究的可靠性和有效性。測試結果到底如何?一起往下看吧!
Advantages and Limits of Metagenomic Assembly and Binning of a Giant Virus
利用宏基因組數據組裝巨病毒基因組的優勢與限制
作者:Frederik Schulz 等
期刊:mSystems
時間:2020.06.23
影響因子:6.519
一、文章摘要
基因組和宏基因組的發展使科研人員可以從環境樣本中得到成千上萬種未經培養的細菌和古菌的基因序列,迅速擴展了對微生物多樣性的認識。宏基因組最近也被證明可用於評估環境病毒的組成和多樣性。巨病毒(NCLDV)的基因組大小可高達數百萬鹼基,並廣泛存在於海洋和陸地的生態系統之中,目前已有研究報導通過宏基因組從環境中成功獲得病毒基因組。說明宏基因組用於病毒基因組研究具有潛在的價值,有助於對病毒生態學和進化史等方面的深入了解。
作者通過將已知巨病毒顆粒摻入到廢水樣品中,通過採取宏基因組的方式嘗試是否能從數據中恢復巨病毒基因組,從而判斷此方式對於巨病毒研究的可靠性和有效性。
二、研究結果
作者將最近分離得到基因組大小為1.595Mb的Fadolivirus分別按照0病毒顆粒/mL(無)、103病毒顆粒/mL(低)、105病毒顆粒/mL(中)和107病毒顆粒/mL(高)摻入到廢水樣品中,並對每個廢水樣品提取得到的DNA進行宏基因組測序,使用metaSPAdes對數據進行組裝然後使用MetaBAT 2進行binning分析,共獲得115個MAG,基於CheckM的分類學將105個MAG注釋為細菌,1個MAG注釋為古菌(圖1.a)。通過比對發現注釋為古菌的MAG與Fadolivirus基因組的相似度超過99.7%,可以確認成功檢測到外源添加的Fadolivirus。該病毒MAG僅在高濃度病毒顆粒樣本中被檢測到,為了測試其他常用binning方法作者採用了MetaBAT 2-dc、MaxBin2、CONCOCT和DAS_Tool對宏基因組組裝結果進行分析,發現獲得與Fadolivirus基因組達到相似度98.3%~99.7%的MAG(表1)。
圖1.宏基因組組裝與binning得到Fadolivirus 的MAG。a:MAG質量情況統計;b:Fadolivirus 的MAG與Fadolivirus 的基因組的比對圖。
表1.不同binning工具的分析結果統計
與Fadolivirus的基因組相似度最高的MAG是由MetaBAT 2分析獲得,大小為1.623Mb,相似度達到99.7%,共有12條contigs,N50為481kb。在該病毒MAG中缺少了Fadolivirus基因組中約為5kb的序列,但存在一個在Fadolivirus基因組中沒有的contig,此外,作者發現在該病毒MAG的8條contigs末端存在高度重複序列(圖1.b)。
為了檢測外源加入的Fadolivirus的檢出限,作者將所有樣本的宏基因組數據比對到Fadolivirus的基因組中,發現在高濃度病毒顆粒樣本中比對到Fadolivirus基因組的數據量是中濃度病毒顆粒樣本的68倍,與低濃度病毒顆粒樣本相比數據量更是高出了4194倍,在沒有外源加入病毒顆粒的樣本中並沒有數據可比對上Fadolivirus基因組(圖2.a)。
圖2.宏基因組的Fadolivirus基因組分析。a:不同濃度病毒顆粒樣本的數據比對結果統計;b:巨病毒MCP分析。
同時作者對NCLDV的衣殼蛋白(MCP)進行分析以確認能否從宏基因組數據中獲得更多的病毒相關信息。從宏基因組數據鑑定得到的MCP與Fadolivirus基因組注釋的MCP以及從NCBI的Nr資料庫收錄的MCP進行比對發現每個樣本僅有1-6個MCP,而且這些MCP的reads覆蓋度很低(圖2.b)。Fadolivirus的MCP僅在高濃度病毒顆粒和中濃度病毒顆粒樣本中發現,且僅能從高濃度病毒顆粒樣本中獲得較為完整的MCP,在中濃度病毒顆粒樣本中獲得了12條屬於Fadolivirus MCP的contigs。
三、總結
本研究突出了宏基因組中提取巨病毒基因組的可能性和局限性,例如需要足夠的數據量、覆蓋度和有效的分析工具。本研究中的測試數據在目前和未來對未培養的巨病毒基因組研究十分重要,有助於擴展對巨病毒遺傳多樣性的認識和推斷他們與宿主的相互作用。
您可能還喜歡:研究思路|三代宏基因組應用案例解讀(第二期)
新品|美格基因重磅推出宏基因組(病原微生物研究)測序產品服務