2020年一月,Nature Method發文將「Single-cell multimodal omics」也就是單細胞多組學技術評選為2019年的年度方法,理由是單細胞多組學的測量為逐個獲得細胞的整體視圖提供了可能。這也是繼2013年將單細胞測序本身當選為年度方法之後,單細胞技術再獲殊榮。今天我們依據Nature Method的文章對單細胞多組學做一個系統的介紹。
一,單細胞多組學技術的誕生
單細胞測序技術的進步使人們能夠以前所未有的解析度和規模研究多細胞生物的基因調控程序。單細胞多組學工具的開發則是邁向了解生物系統內部工作的又一重大步驟。單細胞技術發展的最初努力集中在單細胞RNA測序上,它可以剖析轉錄組異質性,揭示給定複雜組織中以前未知的細胞類型或細胞狀態。研究人員很快意識到,單鏈RNA-seq與另一種生物分子特徵的結合,如蛋白質圖譜,提供的信息不僅僅是其組成部分的總和。例如,在測序前使用非破壞性方法,就可以將表面蛋白質表達水平與細胞轉錄組聯繫起來,從而可以聯合分析RNA和蛋白質水平。使用物理分離的細胞組分提供了一種並行測量的方法,例如,細胞溶質中的mRNA和核基因組,通過將轉錄組與來自相同細胞的基因組聯繫起來進行細胞基因分型。最近,單細胞多組學測量的浪潮已經不僅僅局限在了以轉錄組為中心。例如,最近的一項研究報導了in situ HI-C和單細胞全基因組亞硫酸氫鹽測序的整合,用於在單細胞中同時分析染色體構象和DNA甲基化情況,表現了分析細胞多組學特異性的能力提升(Nature Methods,16, 991–993,2019)。
從同一個細胞內的多個組學收集數據的能力使得以前具有挑戰性的生物學問題得以解決。例如,基因表達和細胞表面蛋白的同時測量使我們能夠更好地分辨保留細微轉錄組差異的細胞亞群。染色質結構的光學重建(ORCA)與多重RNA標記相結合,使得單細胞中的脫氧核糖核酸摺疊和基因表達可視化,從而提供了果蠅胚胎中三維染色質重塑的視圖(Nature,568,49–54,2019)。此外,單細胞測序技術與基於CRISPR的編輯能力相結合,為開發系統的單細胞譜系追蹤提供了令人興奮的方向。
二,主要的單細胞多組學的方向
上圖是現有的單細胞技術的一個小結,我們可以發現,目前的單細胞技術已經涵蓋了基因組,轉錄組(mRNA, lncRNA),表觀遺傳(甲基化組與染色質可接近性)等幾乎全部的組學,那麼單細胞多組學技術就是有機的將上面兩個或者更多的單細胞技術進行組合,並對方法做一些適應性的改進,使其能在同一個細胞中完成。所以,總結出了現有的單細胞多組學技術如下圖。
目前單細胞多組學正在向著兩個主要的方向進行發展,第一個方向是少而深度的測序方式,一次一個細胞的多組學分析允許以相對高的基因組覆蓋率和定量精度對單個細胞進行深入剖析,如圖中的G&T-seq、scMT-seq等等。然而,每次實驗僅分析數十至數百個細胞的能力和每個細胞的高成本是相當有限的,特別是在組織樣本的異質性複雜的情況下(例如大腦),需要分析大量細胞以獲得正常和疾病條件下細胞組成的準確視圖。為了解決這一限制,已經開發了幾種方法來一次對來自數千或更多細胞的不同形式進行高通量單細胞分析。使用基於液滴的方法,Perturb-seq和CRISP-seq對基於CRISPR的轉錄幹擾進行高通量單細胞RNA測序(scRNA-seq),每個單細胞作為個體報告者對遺傳幹擾作出反應。這些豐富的表型數據被用於重建分子迴路,能夠將幹擾反應與混雜效應分開。類似地,基於C1微流體平臺的微擾技術(Perturb-ATAC-seq)測量CRISPR微擾期間染色質狀態的變化。細胞間染色質狀態變異被用來構建動態調節迴路,並揭示在細胞命運決定過程中起作用的調節因子。
三,單細胞多組學的未來展望
儘管單細胞多組學技術取得了巨大進展,但仍存在許多挑戰。一次一個細胞的多組學分析提供了非常全面的細胞分子特徵,使其成為分析由有限數量細胞組成的生物樣品(例如,哺乳動物早期胚胎)的理想選擇。然而,由於相對有限的通量以及較高的單個細胞成本,這些方法對於複雜異質樣品的大規模分析和組織內稀有細胞類型的鑑定(例如,組織常駐祖細胞的研究或組織水平細胞圖譜分析)是昂貴的。另一方面,高通量單細胞多組學分析的一個關鍵限制是數據稀疏。當前方法對單個細胞表觀基因組和轉錄組的覆蓋仍然很低:很難區分技術噪聲和細胞間的差異。儘管實驗程序的優化在未來可能縮小誤差,但可能需要全新的生物化學或策略來完全克服這一限制。
對單細胞轉錄組和蛋白質組進行聯合分析也是至關重要的。這將對轉錄組和蛋白質豐度之間的關係以及不同細胞類型或狀態以及不同發育和/或疾病條件下的動態關係提供關鍵的線索。RNA和蛋白質是非常不同的分子形式,在這一階段,將它們轉化成一種能夠以「全組學」的方式一起捕獲的統一形式是一項重大的技術挑戰。並行探測二維圖譜需要高通量的單細胞蛋白質組學方法,但這種方法尚未建立。
此外單細胞多組學技術帶來了全新的數據結構,相比於單細胞測序的Tenor類型的數據結構,單細胞多組學則是更為複雜的複合張量(Multiplex Tensor),這對新的分析工具提出了要求。
總之,單細胞多組學方法極大地擴展了我們的視野,描繪了在不同生物系統中運行的複雜分子和細胞網絡。今後通單細胞多組學技術過增加覆蓋率、增加額外信息層或增強檢測的可擴展性能將進一步增強研究者對細胞全面了解的能力。