作者:王碩,南京農業大學碩士在讀,主要研究利用噬菌體防治土傳病害。
周刊主要展示LorMe團隊成員優秀周報,每周定期為您奉上學術盛宴!本期周刊將土壤噬菌體與腸道噬菌體進行類比並為您介紹可能用於土壤噬菌體的新興研究方法。原文於2020年發表在 Trends in Microbiology。
導讀
地球上大約有1031的病毒,其中大部分是噬菌體。環境中的噬菌體呈現高度的多樣性,其形態和基因組均存在很大的差異。通過噬菌體的基本生物學特性對其進行分類,可以幫助我們更清晰地了解噬菌體。目前對噬菌體的分類缺乏統一的標準,需要結合多種特徵對其進行歸類。採用不同的研究方法可以測定不同的噬菌體特性。然而,不同的研究方法具有不同的偏好和局限性,當前的噬菌體研究需要根據實際情況結合多種研究方法。這篇綜述總結了宏基因組學組裝工具和單細胞分析的最新突破,有助於進一步了解噬菌體生物學、多樣性及其與微生物群落的相互作用。
01 土壤噬菌體與人體噬菌體的相似性
人體腸道微生物影響著人體的健康,其數量和組成的變化都會導致人體健康狀況的波動,甚至引發疾病。噬菌體是人體腸道微生物的一部分,在維持人體健康的過程中發揮了關鍵的作用。人體腸道噬菌體呈現高度的多樣性(圖 1),按形態可分為有尾噬菌體、無尾噬菌體等;按核酸類型可分為dsDNA噬菌體、ssDNA噬菌體、dsRNA噬菌體和ssDNA噬菌體。目前有關人體腸道噬菌體的研究已經取得了相當的成績,相關的研究方法可以借鑑到目前研究相對較少的土壤噬菌體中。與人體腸道類似,根際是土壤微生物活動的熱點區域,根際微生物的活動也直接影響著植物的健康。土壤噬菌體也是其中的一部分,可以影響碳、氮等物質的循環和宿主的新陳代謝:影響有關植物生存的方方面面。土壤噬菌體也呈現高度的多樣性,按形態和核酸類型同樣有相似的分類。面對如此複雜多樣的土壤噬菌體,與人體腸道噬菌體相關的新興技術可以借鑑到相關研究中。然而,從樣品收集到測序的整個過程都會影響噬菌體序列的檢測,因此需要根據樣品類型、來源和體積謹慎地選擇處理方法。
圖1 人體腸道中豐富多樣的噬菌體
02 樣品處理與下遊分析
與腸道微生物相似,土壤微生物群落也相當複雜,現有的採樣技術雖然各具優勢,但可能會傾向於提取最豐富的群落成員。通過噬菌體定量方法(例如螢光顯微鏡)可以直接觀察到噬菌體,但是得到的病毒樣顆粒(VLP)的數量可能會低於樣品中的實際數量。擴增病毒核酸是一種處理方法,其中包括:1 )隨機擴增的彈槍文庫(隨機擴增的彈槍文庫(RASL),其中的模板僅限於dsDNA;2 )連結子擴增的彈槍庫(連結子擴增的彈槍庫(LASL),它需要很高的模板濃度;3 )多重置換擴增(多重置換擴增(MDA),傾向於過度擴增環狀單鏈DNA(ssDNA)並且不均勻擴增線性基因組。最近開發的基於流式細胞術的方法可以通過螢光染料標記噬菌體從而把VLP從背景菌群中分離出來,避免未純化的噬菌體基因組序列被分配到細菌和真核DNA。然後根據大小和螢光水平選擇VLP,並使用螢光激發細胞分選法從樣品中除去VLP。儘管此方法仍會導致VLP丟失,並降低了噬菌體檢測的靈敏度,但它顯著減少了背景汙染,並在測序前不需要進行全基因組擴增。由於每種可用的樣品處理方法都有其局限性,因此對描述較少的噬菌體的研究取決於生物信息學方法,該方法具有其自身的一系列優點和挑戰(圖 2)。
圖2 人類微生物群中表徵游離噬菌體的實驗和計算方法
03 當前的工具和病毒資料庫
土壤噬菌體與腸道噬菌體一樣,缺乏通用的標記基因,例如細菌中的16SrRNA,因此很難在混合樣品中進行鑑定。對VLP衍生的DNA或RNA進行彈槍測序是解決宏條形碼(依賴物種或群體特異性標記)問題的一種解決方案。宏基因組學允許對複雜的微生物樣品進行未培養測序(無需使用組群特異性引物),並且可以區分樣品中所含的不同物種。但是,宏基因組數據容易產生較高的背景噪音,會混淆對噬菌體的分類表徵。公共資料庫中可能存在較差、不正確或不足的注釋並且噬菌體序列與參考資料庫之間的同源性有限,為了解決這些問題,病毒學研究需要依靠全新的基因組裝配(即在沒有參考序列的情況下進行序列拼接,對未知基因組序列進行測序,利用生物信息學分析手段,對序列進行拼接、組裝,從而獲得其基因組的圖譜)來從宏基因組中獲得噬菌體基因組。然而,由於噬菌體基因組具有特異性,這種方法面臨很多困難:噬菌體基因組是高度鑲嵌的,其中包括許多重複區域,並且顯示出高度的宏基因組學複雜性和菌株水平多樣性。噬菌體的微觀多樣性(高水平的菌株均勻性和核酸多樣性)也可能使全新的基因組裝配複雜化。蛋白質水平的彙編程序(例如Plass)可以更好地用於噬菌體宏基因組數據,因為它們可以從核苷酸序列預測新蛋白質,增加序列回收率並改善蛋白質功能預測。它們還有助於避免同義單核苷酸多態性的錯配。然而,這些彙編程序不能將組裝的蛋白質序列置於基因組環境中,並且它們不能從序列同一性<95%的相關分類單元中分離同源蛋白質。長時間讀取的測序儀,可以從單個讀取中獲得完整的噬菌體基因組,而無需組裝。但是,長時間讀取的測序儀所需的DNA量,比不經擴增直接從噬菌體樣品中分離出來的DNA量要高几個數量級,而且它們仍然具有較高的讀錯率和操作成本。
04 未知病毒及其發現
不僅腸道中生活著眾多不可培養的微生物,土壤中也是如此。隨著測序技術的進步,每年確定的不可培養噬菌體序列總數遠遠超過噬菌體分離株的數量。因此,在公共資料庫中,大部分噬菌體(≥95%)是不可培養的。大多數噬菌體序列與已知參考序列沒有顯著的同源性,所以依賴資料庫進行分類的方法具有局限性。替代方法之一是按組成對噬菌體序列進行分類,如VirMap數據處理是基於病毒與非病毒序列的比較對重疊群評分。但是,某些檢測到的原噬菌體可能是無功能的,這些原噬菌體僅次於必需基因的缺失或突變。機器學習方法也可用於檢測噬菌體序列,但噬菌體檢測工具的主要缺點是序列僅在數據集中才有效,這可能導致在高置信度得分的噬菌體片段出現錯誤。
05 確定不可培養的噬菌體的宿主範圍
如何確定噬菌體的宿主範圍(即它可以感染的細菌)是一個有爭議的話題。噬菌體感染周期包括六個主要階段:1)將噬菌體吸收到細菌細胞中;2)噬菌體將其DNA噴射到宿主細胞中;3)逃避防禦機制;4)細菌被劫持;5)噬菌體複製並構建新一代噬菌體;6)裂解細菌細胞並釋放。測定宿主範圍的標準方法,例如平板接種法,不僅依賴培養,並且不同方法之間的結果會有所不同,這使得不可培養的噬菌體的宿主範圍很難測定(圖3)。替代方法是使用噬菌體標記或生物信息學豐度輪廓、tRNA或原噬菌體的測定和CRISPR記錄的短噬菌體片段。許多不依賴於培養的方法可用於測量噬菌體宿主範圍。噬菌體標記使用螢光激發細胞分選法來分離附著在細菌細胞上的螢光標記的噬菌體,以用於下遊應用和測序。雖然附著不等於吸收或複製,但它與噬菌體感染周期的第一步聯繫在一起,並且已證明其可以成功預測海洋和人類環境中獨特的宿主-噬菌體配對。
豐度分布圖是通過關聯噬菌體和細菌豐度確定宿主範圍的另一種不依賴培養的方法。雖然在理論上很有希望,但噬菌體與其宿主之間相互作用的基礎是複雜的,往往與直接的相關分析不符,導致準確性較低。也可以使用遺傳標記將噬菌體與其細菌宿主聯繫起來,但很大程度上與噬菌體感染周期的第五步有關。最常用的遺傳標記是:1)水平基因轉移導致噬菌體和細菌之間的遺傳同源性,依賴於全面的資料庫;2)將噬菌體整合入宿主基因組,僅限於溫和噬菌體;3)使用感染噬菌體的CRISPRs記錄,但是只有大約10%的細菌編碼了CRISPR系統;4 )追蹤被認為起源於宿主的噬菌體追蹤被認為起源於宿主的噬菌體tRNA,但這在物種水平上不是特異的,只有7%的已知噬菌體具有tRNA序列。由於這些限制,需要結合機器學習工具和多種遺傳特徵以預測噬菌體的宿主範圍。
圖3 噬菌體宿主範圍分析方法綜述
06 多維數據的統計分析
分析多維數據以闡明物種與環境之間的關係是許多學科當前面臨的挑戰。諸如機器學習之類的計算和統計方法的最新進展已經幫助解決了這個問題。但是,這些方法需要大量觀測數據。如果樣本量小而無法使用機器學習方法,那麼規範方法同樣可以為分析物種與環境之間的關係提供一條有希望的途徑。對於數據和問題而言,方法的適當性可能會因研究而異,並且與所得出的結論相呼應,多種補充統計方法的整合可能會提供最可靠的結論並有助於理清複雜的問題和多維數據。
總結
噬菌體通過與細菌群落的相互作用在環境中起著關鍵作用。測序技術和生物信息學的發展使發現的噬菌體種類迅速擴展。不同的研究方法各有側重,在實際過程中需要根據土壤樣品的特點及研究目的謹慎地進行選擇與組合。同時,我們需要進一步了解土壤中噬菌體的多樣性,並且闡明這些噬菌體的功能。
論文信息
原名:Challenges of Studying the Human Virome – Relevant Emerging Technologies
譯名:人類噬菌體研究的挑戰-相關的新興技術
期刊:Trends in Microbiology(2020)
IF2020:13.546
發表時間:2020.07.01
通訊作者:Li Deng
通訊作者單位:慕尼黑工業大學
10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦
系列教程:微生物組入門 Biostar 微生物組 宏基因組
專業技能:學術圖表 高分文章 生信寶典 不可或缺的人