在之前的筆記推送中,我們已經能通過 NGS,在一次實驗中測序出多條 DNA 序列,甚至達到「加量不加價」,但是這些實驗都需要一定數量級的核酸分子才能進行測序。而在法醫痕檢等的特殊領域中,化驗人員往往只能提取到極少量甚至更少的核酸分子。那麼,如何從極少的樣本,甚至僅從一個細胞中,得出全基因組的序列信息,就成為了科學家下一個要解決的問題。
第十期原視頻以往的擴增方法,無論是 PCR 還是 RPA,都帶有隨機性。也就是說,不同擴增片段的擴增效率多少會存在差異。同時,隨著擴增循環數的增加,這些差異會呈現出指數放大的效果,造成嚴重的測序覆蓋不均勻——極少數區段的 DNA 被大量擴增,呈現極高的測序深度,但是大多數區段內只有很低的覆蓋,甚至沒有。這樣我們就無法準確地獲得低擴增區段的基因序列。
全基因組覆蓋常規用大量 DNA 進行建庫的方法,因為打斷、補平、加 A、加接頭等一長串的操作,每一步都會有 DNA 片段的損失。結果就是初始 DNA 中很大一部分會被浪費掉,而沒有形成有效的文庫分子。
而單細胞測序要求幾乎所有的原始基因組片段都得到有效擴增,
「上述程度的浪費是難以接受的。」
擴增效率以早期的 HiSeq 測序儀為例,大約每上機 2 萬個文庫分子,才會有 1 個文庫分子,能夠在測序的 Flowcell 表面生成簇,並且被測序測到。剩下的大多數文庫分子,在上機的時候是被水衝走的。
所以,單細胞基因組擴增的方法,還要有較高的擴增效率。至少要有上萬倍到幾十萬倍的擴增效率,才能保證在全基因組測序時,大部分的片段都被測序測到。
解決方案——WGADOP-PCRDOP-PCR[1](Degenerate Oligonucleotide–Primed Polymerase Chain Reaction),中文可譯為簡併寡核苷酸引物 PCR,引物的 3'端含 6bp 的隨機序列,可以隨機地和基因組 DNA 結合,從而實現對全基因組的擴增。作為最早的「全基因組擴增」(Whole Gemome Amplification,WGA)技術之一,跟隨在 PEP-PCR 之後出現於 1992 年。
原理[2]特點因為 PCR 的指數擴增特性,不同序列之間任何小差異都將以指數方式擴大,因而導致擴增出的基因組覆蓋度較低。儘管如此,在 1mb 的水平上,DOP-PCR 仍適合對染色體的 CNV 進行定量。
MDAMDA[3](Multiple Displacement Amplification),中文可譯為多重置換擴增,於 2001 年公開。其方法核心是用 φ29DNA 聚合酶進行直接的擴增,可擴增產生 50~100kb 的 DNA 片段。
原理[2]🔎Phi29 DNA Polymerase
從 Bacillus subtilis 噬菌體 phi29 中克隆出的 DNA 聚合酶基因,利用基因重組技術,由大腸桿菌表達並純化分離後獲得。這是一種具有較高連續合成能力以及鏈置換能力的 DNA 聚合酶,具有 3'-5'外切酶和校正活性,且保真度高。
特點φ29 DNA 聚合酶的高效率及高保真性,使得 MDA 法在對 SNV 的分析,以及構建大片段文庫上有著顯著優勢。
MDA 法依然是指數擴增,因此依然存在 PCR 反應的序列偏好性,然而,和 DOP-PCR 不同的是,這種偏好性是隨機的,從而為 CNV 帶來不可抑制的噪音。
MALBACMALBAC[4](Multiple Annealing and Looping–Based Amplification Cycles),中文稱為多重退火循環擴增法,2012 年由北大謝曉亮教授(封面圖)發表,其擬線性的擴增過程降低了指數擴增的序列偏好性。
原理擴增引物
擴增引物的 5'端有 27 個鹼基的通用序列,這些通用序列會作為未來 PCR 擴增引物的結合序列。擴增引物的 3'端有 8 個隨機序列的鹼基,這 8 個鹼基可以隨機地雜交到基因組 DNA 的互補序列上。
聚合酶
這裡使用的也是具有鏈置換功能的 Bst DNA 聚合酶(示意圖灰色橢圓),
🔎將 Bacillus stearothermophilus 中的聚合酶基因,保留了 5'Æ3'聚合酶(pol)的片段,但是去除 5'Æ3'外切酶(exo)基因片段而成的 Large Fragment,具有熱穩定性。
其所謂的「鏈置換」指的是:
把之前已經合成好的 DNA 鏈解開,再形成自己的新鏈,新合成的鏈把一條舊的單鏈替換掉,所以叫鏈置換。這個特點能夠把每個循環所能合成的 DNA 新鏈的數量提高最多上百倍,能有效解決全基因組覆蓋及其效率的問題。
第一個循環,得到一批 5'端有通用擴增序列的 DNA 片段。
第二個循環,所產生的擴增產物中,大部分是 5'端有通用序列,而 3'端,有與通用序列互補的序列的片段。
58 度退火
為什麼要選擇 58 度呢?因為這個溫度能讓完整擴增的產物兩端發生鏈內雜交,使 3'端序列不會和游離引物雜交,杜絕完整擴增產物的自我指數擴增。可以看到,完整產物有
特點更好的均一性,能帶來更低的等位基因敲除率。
這是 MALBAC 論文中所給出的 Lorenz 曲線,圖像越接近對角線,覆蓋越均一。大量細胞測序,其均一性固然好,而 MALBAC 則是目前單細胞 WGA 中均一度最高的方法。
雖然依然存在一定的序列偏好性,但和 MDA 不同,MALBAC 的這種偏好性在不同的細胞之間是可復現的,因此可以通過對參考細胞標準化降噪後,進行 CNV 的分析。
同樣以原論文中給出的覆蓋深度圖,用三種方法測腫瘤細胞 SW480 樣本的 CNV,與使用大量細胞測序做對照(綠線為 CNVs),MALBAC 經算法處理後仍能得出較一致的結果,而 MDA 做出的結果由於隨機的偏好性而非常模糊。
但可重複的序列偏好性,也可能會使基因組上低擴增的區域在擴增過程中丟失。
Bst 聚合酶保真性略低於 φ29 聚合酶,可能會在第一個循環就引入鹼基錯誤,因此 MALBAC 在檢測 SNV 時將會出現更多的假陽性。
MDA 和 MALBAC 各有優劣,實際上在不同的文獻中,研究者也會根據研究目的的不同,採取不同的方式對基因組進行擴增,以滿足研究的需要。
🔎DOP-PCR 近年也有通過更換聚合酶和引物來改進的 iDOP-PCR 技術,相比 MALBAC 降低了等位基因缺失率,基因組覆蓋率也有所提升,但目前並未有大規模商用的報導。
臨床應用CNV單細胞測序目前最主要的應用是在胚胎植入前進行基因拷貝數變異檢測。在有習慣性流產的夫婦當中,最常見的病因就是染色體的平衡易位,也就是 A 染色體的一段移到了 B 染色體上,而絕大多數攜帶者日常生活不會有異常。
其最通用解決方案是做第三代試管嬰兒。人工授精後,在受精卵分裂到 8 細胞時,通過顯微操作,抓取一個細胞進行測序,篩選出正常的受精卵再植入母親子宮。
腫瘤相關最後按照國際慣例,簡述單細胞測序在腫瘤研究上的應用。
亞克隆異質性的單細胞研究。
新輔助化療前後乳腺癌患者縱向樣本的單細胞 DNA 測序就顯示抗生素基因型預先存在並通過化療被選擇。
🔎Casasent, A. K., Schalck, A., Gao, R., Sei, E., Long, A., Pangburn, W., ... & Navin, N. E. (2018). Multiclonal invasion in breast tumors identified by topographic single cell sequencing. Cell, 172(1-2), 205-217.
診斷分型。
對多位肺癌患者 CTC 進行測序,發現其表現出 CNV 具有高度一致性。提示 CNV 與腫瘤的轉移密切相關,為以後根據 CNV 對腫瘤進行診斷分型和治療提供了可能。
🔎Guo, X., Zhang, Y., Zheng, L., Zheng, C., Song, J., Zhang, Q., ... & Gao, R. (2018). Global characterization of T cells in non-small-cell lung cancer by single-cell sequencing. Nature medicine, _4(7), 978-985.
腫瘤微環境研究。
通過對數以千計的健康與癌變肺細胞的研究,揭示了肺癌微環境的複雜,創建了史上第一個完整的肺癌細胞圖譜,為後續對肺癌治療的深度研究奠定了基礎。
🔎Lambrechts, D., Wauters, E., Boeckx, B., Aibar, S., Nittner, D., Burton, O., ... & Weynand, B. (2018). Phenotype molding of stromal cells in the lung tumor microenvironment. Nature medicine, 24(8), 1277-1289.
References[1]Carter, N. P., Bebb, C. E., Nordenskjo, M., Ponder, B. A., & Tunnacliffe, A. (1992). Degenerate oligonucleotide-primed PCR: general amplification of target DNA by a single degenerate primer. Genomics, 13(3), 718-725.: https://doi.org/10.1016/0888-7543(92)90147-K
[2]Huang, L., Ma, F., Chapman, A., Lu, S., & Xie, X. S. (2015). Single-cell whole-genome amplification and sequencing: methodology and applications. Annual review of genomics and human genetics, 16, 79-102.: https://doi.org/10.1146/annurev-genom-090413-025352
[3]Dean, F. B., Nelson, J. R., Giesler, T. L., & Lasken, R. S. (2001). Rapid amplification of plasmid and phage DNA using phi29 DNA polymerase and multiply-primed rolling circle amplification. Genome research, 11(6), 1095-1099.: https://doi.org/10.1101/gr.180501
[4]Zong, C., Lu, S., Chapman, A. R., & Xie, X. S. (2012). Genome-wide detection of single-nucleotide and copy-number variations of a single human cell. Science, 338(6114), 1622-1626.: https://doi.org/10.1126/science.1229164
[5]Credit: 編輯/Andy
審校/羅鵬部分內容基於綜述[2]編寫,特此致謝!
排版由mdnice.com強力驅動