病毒組研究的挑戰-相關的新興技術

2020-08-18 微生物組

作者:王碩,南京農業大學碩士在讀,主要研究利用噬菌體防治土傳病害。

周刊主要展示LorMe團隊成員優秀周報,每周定期為您奉上學術盛宴!本期周刊將土壤噬菌體與腸道噬菌體進行類比並為您介紹可能用於土壤噬菌體的新興研究方法。原文於2020年發表在 Trends in Microbiology。

導讀

地球上大約有1031的病毒,其中大部分是噬菌體。環境中的噬菌體呈現高度的多樣性,其形態和基因組均存在很大的差異。通過噬菌體的基本生物學特性對其進行分類,可以幫助我們更清晰地了解噬菌體。目前對噬菌體的分類缺乏統一的標準,需要結合多種特徵對其進行歸類。採用不同的研究方法可以測定不同的噬菌體特性。然而,不同的研究方法具有不同的偏好和局限性,當前的噬菌體研究需要根據實際情況結合多種研究方法。這篇綜述總結了宏基因組學組裝工具和單細胞分析的最新突破,有助於進一步了解噬菌體生物學、多樣性及其與微生物群落的相互作用。

01 土壤噬菌體與人體噬菌體的相似性

人體腸道微生物影響著人體的健康,其數量和組成的變化都會導致人體健康狀況的波動,甚至引發疾病。噬菌體是人體腸道微生物的一部分,在維持人體健康的過程中發揮了關鍵的作用。人體腸道噬菌體呈現高度的多樣性(圖 1),按形態可分為有尾噬菌體、無尾噬菌體等;按核酸類型可分為dsDNA噬菌體、ssDNA噬菌體、dsRNA噬菌體和ssDNA噬菌體。目前有關人體腸道噬菌體的研究已經取得了相當的成績,相關的研究方法可以借鑑到目前研究相對較少的土壤噬菌體中。與人體腸道類似,根際是土壤微生物活動的熱點區域,根際微生物的活動也直接影響著植物的健康。土壤噬菌體也是其中的一部分,可以影響碳、氮等物質的循環和宿主的新陳代謝:影響有關植物生存的方方面面。土壤噬菌體也呈現高度的多樣性,按形態和核酸類型同樣有相似的分類。面對如此複雜多樣的土壤噬菌體,與人體腸道噬菌體相關的新興技術可以借鑑到相關研究中。然而,從樣品收集到測序的整個過程都會影響噬菌體序列的檢測,因此需要根據樣品類型、來源和體積謹慎地選擇處理方法。

圖1 人體腸道中豐富多樣的噬菌體

02 樣品處理與下遊分析

與腸道微生物相似,土壤微生物群落也相當複雜,現有的採樣技術雖然各具優勢,但可能會傾向於提取最豐富的群落成員。通過噬菌體定量方法(例如螢光顯微鏡)可以直接觀察到噬菌體,但是得到的病毒樣顆粒(VLP)的數量可能會低於樣品中的實際數量。擴增病毒核酸是一種處理方法,其中包括:1 )隨機擴增的彈槍文庫(隨機擴增的彈槍文庫(RASL),其中的模板僅限於dsDNA;2 )連結子擴增的彈槍庫(連結子擴增的彈槍庫(LASL),它需要很高的模板濃度;3 )多重置換擴增(多重置換擴增(MDA),傾向於過度擴增環狀單鏈DNA(ssDNA)並且不均勻擴增線性基因組。最近開發的基於流式細胞術的方法可以通過螢光染料標記噬菌體從而把VLP從背景菌群中分離出來,避免未純化的噬菌體基因組序列被分配到細菌和真核DNA。然後根據大小和螢光水平選擇VLP,並使用螢光激發細胞分選法從樣品中除去VLP。儘管此方法仍會導致VLP丟失,並降低了噬菌體檢測的靈敏度,但它顯著減少了背景汙染,並在測序前不需要進行全基因組擴增。由於每種可用的樣品處理方法都有其局限性,因此對描述較少的噬菌體的研究取決於生物信息學方法,該方法具有其自身的一系列優點和挑戰(圖 2)。

圖2 人類微生物群中表徵游離噬菌體的實驗和計算方法

03 當前的工具和病毒資料庫

土壤噬菌體與腸道噬菌體一樣,缺乏通用的標記基因,例如細菌中的16SrRNA,因此很難在混合樣品中進行鑑定。對VLP衍生的DNA或RNA進行彈槍測序是解決宏條形碼(依賴物種或群體特異性標記)問題的一種解決方案。宏基因組學允許對複雜的微生物樣品進行未培養測序(無需使用組群特異性引物),並且可以區分樣品中所含的不同物種。但是,宏基因組數據容易產生較高的背景噪音,會混淆對噬菌體的分類表徵。公共資料庫中可能存在較差、不正確或不足的注釋並且噬菌體序列與參考資料庫之間的同源性有限,為了解決這些問題,病毒學研究需要依靠全新的基因組裝配(即在沒有參考序列的情況下進行序列拼接,對未知基因組序列進行測序,利用生物信息學分析手段,對序列進行拼接、組裝,從而獲得其基因組的圖譜)來從宏基因組中獲得噬菌體基因組。然而,由於噬菌體基因組具有特異性,這種方法面臨很多困難:噬菌體基因組是高度鑲嵌的,其中包括許多重複區域,並且顯示出高度的宏基因組學複雜性和菌株水平多樣性。噬菌體的微觀多樣性(高水平的菌株均勻性和核酸多樣性)也可能使全新的基因組裝配複雜化。蛋白質水平的彙編程序(例如Plass)可以更好地用於噬菌體宏基因組數據,因為它們可以從核苷酸序列預測新蛋白質,增加序列回收率並改善蛋白質功能預測。它們還有助於避免同義單核苷酸多態性的錯配。然而,這些彙編程序不能將組裝的蛋白質序列置於基因組環境中,並且它們不能從序列同一性<95%的相關分類單元中分離同源蛋白質。長時間讀取的測序儀,可以從單個讀取中獲得完整的噬菌體基因組,而無需組裝。但是,長時間讀取的測序儀所需的DNA量,比不經擴增直接從噬菌體樣品中分離出來的DNA量要高几個數量級,而且它們仍然具有較高的讀錯率和操作成本。

04 未知病毒及其發現

不僅腸道中生活著眾多不可培養的微生物,土壤中也是如此。隨著測序技術的進步,每年確定的不可培養噬菌體序列總數遠遠超過噬菌體分離株的數量。因此,在公共資料庫中,大部分噬菌體(≥95%)是不可培養的。大多數噬菌體序列與已知參考序列沒有顯著的同源性,所以依賴資料庫進行分類的方法具有局限性。替代方法之一是按組成對噬菌體序列進行分類,如VirMap數據處理是基於病毒與非病毒序列的比較對重疊群評分。但是,某些檢測到的原噬菌體可能是無功能的,這些原噬菌體僅次於必需基因的缺失或突變。機器學習方法也可用於檢測噬菌體序列,但噬菌體檢測工具的主要缺點是序列僅在數據集中才有效,這可能導致在高置信度得分的噬菌體片段出現錯誤。

05 確定不可培養的噬菌體的宿主範圍

如何確定噬菌體的宿主範圍(即它可以感染的細菌)是一個有爭議的話題。噬菌體感染周期包括六個主要階段:1)將噬菌體吸收到細菌細胞中;2)噬菌體將其DNA噴射到宿主細胞中;3)逃避防禦機制;4)細菌被劫持;5)噬菌體複製並構建新一代噬菌體;6)裂解細菌細胞並釋放。測定宿主範圍的標準方法,例如平板接種法,不僅依賴培養,並且不同方法之間的結果會有所不同,這使得不可培養的噬菌體的宿主範圍很難測定(圖3)。替代方法是使用噬菌體標記或生物信息學豐度輪廓、tRNA或原噬菌體的測定和CRISPR記錄的短噬菌體片段。許多不依賴於培養的方法可用於測量噬菌體宿主範圍。噬菌體標記使用螢光激發細胞分選法來分離附著在細菌細胞上的螢光標記的噬菌體,以用於下遊應用和測序。雖然附著不等於吸收或複製,但它與噬菌體感染周期的第一步聯繫在一起,並且已證明其可以成功預測海洋和人類環境中獨特的宿主-噬菌體配對。

豐度分布圖是通過關聯噬菌體和細菌豐度確定宿主範圍的另一種不依賴培養的方法。雖然在理論上很有希望,但噬菌體與其宿主之間相互作用的基礎是複雜的,往往與直接的相關分析不符,導致準確性較低。也可以使用遺傳標記將噬菌體與其細菌宿主聯繫起來,但很大程度上與噬菌體感染周期的第五步有關。最常用的遺傳標記是:1)水平基因轉移導致噬菌體和細菌之間的遺傳同源性,依賴於全面的資料庫;2)將噬菌體整合入宿主基因組,僅限於溫和噬菌體;3)使用感染噬菌體的CRISPRs記錄,但是只有大約10%的細菌編碼了CRISPR系統;4 )追蹤被認為起源於宿主的噬菌體追蹤被認為起源於宿主的噬菌體tRNA,但這在物種水平上不是特異的,只有7%的已知噬菌體具有tRNA序列。由於這些限制,需要結合機器學習工具和多種遺傳特徵以預測噬菌體的宿主範圍。

圖3 噬菌體宿主範圍分析方法綜述

06 多維數據的統計分析

分析多維數據以闡明物種與環境之間的關係是許多學科當前面臨的挑戰。諸如機器學習之類的計算和統計方法的最新進展已經幫助解決了這個問題。但是,這些方法需要大量觀測數據。如果樣本量小而無法使用機器學習方法,那麼規範方法同樣可以為分析物種與環境之間的關係提供一條有希望的途徑。對於數據和問題而言,方法的適當性可能會因研究而異,並且與所得出的結論相呼應,多種補充統計方法的整合可能會提供最可靠的結論並有助於理清複雜的問題和多維數據。

總結

噬菌體通過與細菌群落的相互作用在環境中起著關鍵作用。測序技術和生物信息學的發展使發現的噬菌體種類迅速擴展。不同的研究方法各有側重,在實際過程中需要根據土壤樣品的特點及研究目的謹慎地進行選擇與組合。同時,我們需要進一步了解土壤中噬菌體的多樣性,並且闡明這些噬菌體的功能。

論文信息

原名:Challenges of Studying the Human Virome – Relevant Emerging Technologies

譯名:人類噬菌體研究的挑戰-相關的新興技術

期刊:Trends in Microbiology(2020)

IF202013.546

發表時間:2020.07.01

通訊作者:Li Deng

通訊作者單位:慕尼黑工業大學

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組 宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

相關焦點

  • 蛋白質組學技術在病毒研究中的應用
    蛋白質組學可以發現與疾病相關的特異性蛋白質,對病變相關蛋白的研究可以為探索病毒本身及其感染機制提供信息,且這些蛋白還可能作為疾病診斷潛在的生物標誌和治療的藥物靶點。,MS),其中質譜技術是蛋白質組學研究中的核心技術。
  • 賽默飛:蛋白質組學技術在病毒感染致病機制的亮點研究
    儀器信息網在密切關注疫情發展態勢的同時,也更加關注病毒感染的致病機理等相關研究進展。近年來,組學研究成為生命科學基礎研究領域的重點,對於病理、毒理學、藥物動力學等具有重要價值,相關高水平學術期刊大量報導了科研人員利用組學技術開展的病毒致病病理學的研究成果,也對於此次疫情的進一步研究具有一定參考意義。
  • 2019年科技領域的新興技術信號
    該報告利用定量的文本挖掘算法,從大量科學出版物中得到了257個新興技術的早期活躍信號,涉及能源、環境、衛生、生物技術和信息通信技術等領域。對新興技術信號進行的早期識別有助於為歐盟的相關政策制定提供科學依據。本報告就其主要內容進行摘編。新興技術的預測是一門學科,它通過一系列成熟的工具和方法將相關的專家和利益相關者匯聚在一起,以收集其對未來的前瞻洞見,從而形成新興技術發展的預測。
  • 劉衝,鄧門佳:新興生物技術發展對大國競爭與全球治理的影響
    與此同時,合成生物技術顯示出巨大潛力,個性化醫療和精準醫學改變傳統的疾病診療模式並推動醫藥產業變革,幹細胞與再生醫學為疾病治療開闢了全新道路,單細胞技術、定向蛋白質組學技術、基因組編輯技術以及光遺傳學技術等新興研究方法推動生命科學向更加精確和實時的方向發展。生物技術和生物經濟的廣闊前景,引發世界主要大國的高度重視。
  • 賽默飛:病毒感染中基於代謝及脂質組學的亮點研究成果
    儀器信息網在密切關注疫情發展態勢的同時,也更加關注病毒感染的致病機理等相關研究進展。近年來,組學研究成為生命科學基礎研究領域的重點,對於病理、毒理學、藥物動力學等具有重要價值,相關高水平學術期刊大量報導了科研人員利用組學技術開展的病毒致病病理學的研究成果,也對於此次疫情的進一步研究具有一定參考意義。
  • 2015年 十大新興技術
    編者按  世界經濟論壇發布了2015年度十大新興技術,飛行機器人、仿人腦晶片等十大突破性的科技進展入選。  此榜單每年發布一次,由世界經濟論壇新興技術跨界理事會選出該年最有潛力解決全球長期挑戰的技術成果,旨在促使人們關注新興技術的潛力及蘊藏的風險。
  • 張繼明:HBV cccDNA研究現狀與挑戰
    隨著生物技術的進步和對HBV cccDNA特性的深入了解,以靶向清除cccDNA為目標的抗病毒藥物的研發日益增多。主要包括:(1)靶向cccDNA的常用基因編輯技術,如鋅指核酸酶)、轉錄激活因子樣效應物核酸酶和成簇規律間隔短回文重複序列(CRISPR)/CRISPR相關(Cas)蛋白9 (CRISPR/Cas9)技術;(2)表觀遺傳學修飾靶向靜默cccDNA,主要包括DNA甲基化和組蛋白修飾等。
  • 基因組與新興生物技術整合研究思路拓展
    從目前的發展狀況來看,在基因組研究中,利用常規研究技術及單一組學研究方法在衝擊頂級文章的過程中,對於技術的新穎性及物種生物學問題挖掘的深入性還是有所欠缺的,因此在組學整合的前提下,可嘗試引用最新分子生物學研究技術,以為衝擊高分文章「添磚加瓦」。
  • 合成生物學:一種兩用技術的機遇和挑戰
    合成生物學作為一種具有顛覆性意義的新興技術,其未來應用前景正越來越多地在工業界和學術界討論。與很多新興技術一樣,合成生物學也具有商用和軍用兩種用途。在商業應用領域,合成生物學市場預計在2018年至2025年期間將以28.2%的複合年增長率增長,並在2025年達到560.449億美元的市場規模。
  • 定量蛋白質組學方法應用於病毒結構、功能及感染機制研究
    SCIEX面向全球提供不同類型的高端質譜平臺和多組學研究方案,能夠在基礎研究、臨床診療和藥物研發的領域助力對於病毒相關的研究與防控。如果能夠對這兩種病毒蛋白層面的差異進行分析,那麼就能夠掌握病毒顆粒侵染偏向的線索。基於iTRAQ試劑的定量蛋白質組學能夠很好的完成相似樣品在蛋白層面的差異比較。在本研究中,研究人員使用不同的iTRAQ試劑(116和117)來標記不同兩種不同的肽段樣品,等量混合後,使用SCIEX高分辨質譜儀進行數據採集。
  • 觀點摘錄 | 新興技術論壇:雲時代的科學第四範式
    2020年浦江創新論壇-新興技術論壇「雲時代的科學第四範式」於10月29日下午在錦江飯店錦江小禮堂舉行。○ 4.新的測序和新的生物信息方式可以幫助科研工作者了解整個微生物群落的情況,相關數據採集量越來越大,總體上的數據複雜度也越來越高。○ 5.人體體系非常複雜,人體中的微生物菌落能起到屏障功能,以刺激或消弱病毒感染,多年來做了很多研究,探尋細菌感染的發病機理,研究結果表明,在一開始感染時就對病菌有充分了解並且進行幹預措施能起到很好的效果。
  • 江蘇省省級戰略性新興產業發展專項資金支持企業在新冠肺炎防控中...
    [ 列印]江蘇省省級戰略性新興產業發展專項資金自2012年設立以來,重點聚焦新一代信息技術、生物技術和新醫藥等十大戰略性新興產業領域,支持了一批研發能力優、產業化帶動作用強的企業和平臺項目加快建設和落地發展,對落實江蘇省十二五、十三五戰略性新興產業規劃、促進戰略性新興產業健康發展發揮了重要作用
  • 新興持久性有機汙染物如何監測和控制?
    本次會議集中討論了用於控制新興汙染物的創新技術。Manaia的抗性基因組研究也支持Vikesland博士的研究結果。她的研究顯示市政汙水中的抗生素抗性能反映當地的醫療情況,並認為要對汙水做好消毒工作,但又不能過於激進,以保護好水生態。
  • ...性新興產業發展專項資金支持企業在新冠肺炎防控中發揮重要作用
    [ 列印]江蘇省省級戰略性新興產業發展專項資金自2012年設立以來,重點聚焦新一代信息技術、生物技術和新醫藥等十大戰略性新興產業領域,支持了一批研發能力優、產業化帶動作用強的企業和平臺項目加快建設和落地發展,對落實江蘇省十二五、十三五戰略性新興產業規劃、促進戰略性新興產業健康發展發揮了重要作用
  • 美智庫:利用新興技術改變情報分析
    導語10月8日,美國戰略與國際研究中心(CSIS)發布文章分析情報機構如何將新興技術整合到全源分析中。文章研究了將新興技術集成到分析過程的優勢,評估了採納新興技術的障礙和限制,探討了技術和分析人員將在哪些領域為決策者提供最大價值,以及構建未來情報機構的意義。
  • 葛毅:人工智慧熱潮下,基因組學研究的機遇和挑戰——生物谷人物專訪
    近幾年來,大數據技術和人工智慧取得了突破性進展,從出行方式、通訊渠道、消費習慣到飲食起居,我們生活的方方面面正被這一波波的新技術重塑改變著。另一方面,我們對於健康管理、疾病預防和治療的傳統認知,正被人類基因組計劃打開的生命科學研究新認知不斷顛覆。究竟是信息技術還是生物技術,是這個時代的主旋律呢?
  • 新興研究到底該怎麼研究
    目前的類腦計算研究尚處於起步階段,國際上還沒有形成公認的技術標準與方案。清華大學一項最新研究成果首次提出「類腦計算完備性」以及軟硬體去耦合的類腦計算系統層次結構,填補了類腦研究完備性理論與相應系統層次結構方面的空白。10月15日,清華大學召開新聞發布會,介紹了這一類腦計算體系結構領域的重要突破。而在成果背後,這一場源自於新興研究領域的科技成果發布會也為我們帶來三點啟示。
  • 全球環境與健康領域的研究熱點,以及我國環境與健康研究面臨的機遇與挑戰
    理論和方法創新是我國環境與健康研究的挑戰和機遇,需要不斷聚集和吸引優秀科學家形成集群優勢持續攻關,探尋環境致病的原因和機理,為我國區域高發疾病環境汙染尋因,以及為相關健康保障技術的研發奠定理論與方法基礎。
  • 觀點摘錄 | 新興技術論壇:雲時代的科學第四範式
    2020年浦江創新論壇-新興技術論壇「雲時代的科學第四範式」於10月29日下午在錦江飯店錦江小禮堂舉行。、化學包括基因組學各方面相互作用,所有的研究過程均會生成大量數據,更需要相互之間的協同效應。生命科學已進入大數據時代,與大數據的概念相似,基因組學範式的第一步即是發現基因與表型的關聯。
  • 2020十大新興技術揭曉
    但在未來新冠疫情仍在蔓延的情況下,技術能幫助我們更快地實現目標嗎?世界經濟論壇和《科學美國人》雜誌本月10日共同發布的一份最新報告——《2020十大新興技術》表明,答案是肯定的。這份報告揭示了2020年十大新興技術——由世界經濟論壇和《科學美國人》雜誌召集的國際專家指導小組從75項技術提名中選出。從電動飛機到可以「看見」拐角處物體的量子傳感器,專家在篩選這十大新興技術時稱,這些技術必須有潛力超越現在,並在將來刺激社會和經濟的進步。