準確和靈敏地檢測罕見突變,對於CRISPR基因組編輯技術的安全應用和癌症的早期診斷等一系列研究具有重要意義。雖然現有的高通量測序技術已經有了長足的進步,但是目前由於建庫和測序過程中導致的錯誤還是在所難免,所以難以檢測到大量樣品中的罕見突變【1】。尤其對於罕見的複雜結構變異,還沒有有效的檢測和定量的方法。納米孔測序(Nanopore sequencing)的長讀長優勢,有利於檢測複雜的結構變異,但由於其自身的高錯誤率(~8%),很難用於罕見突變檢測。近期研究表明CRISPR/Cas9基因編輯除了會在目標位點導致小範圍的DNA序列突變,也有可能會產生長達數千鹼基的DNA刪除或其它結構變異【2】。這類之前未被重視的複雜的大範圍變異引發了對CRISPR/Cas9基因編輯安全性的質疑。但由於其發生的頻率通常較低且範圍廣,不容易被短讀長的二代測序檢測到,針對此類突變的研究一度陷入僵局。
2020年8月25日,沙烏地阿拉伯阿卜杜拉國王科技大學(KAUST)生物與環境科學工程學院的李墨(Mo Li)教授和北京大學生物醫學前沿創新中心(BIOPIC)、北京未來基因診斷高精尖創新中心(ICG)的黃巖誼教授合作在Genome Biology上發表了題為Long-read individual-molecule sequencing reveals CRISPR-induced genetic heterogeneity in human ESCs的文章【3】。該研究提出了一種基於分子標籤(unique molecular identifier, UMI)的單分子標記技術(targeted Individual DNA Molecule Sequencing, IDMseq),用於定量的檢測樣品中的罕見突變,包括單鹼基突變以及大範圍的複雜的結構變異。
研究團隊利用分子標籤定向的標記樣品中目標基因的原始DNA分子,之後利用PCR的方式擴增標記到的分子用以測序。該技術配套的數據分析算法VAULT(variant analysis with unique molecular identifier for long-read technology)可以從測序結果中發現並提取分子標籤,然後利用分子標籤將測序的數據(read)分組。每個組都代表初始體系中的一個DNA分子,於是可以利用同一個組內的所有數據進行測序糾錯,從而得到高精度的突變結果。該技術廣泛適用於當前的主流高通量測序平臺,包括Illumina, PacBio 和Nanopore。研究表明運用該技術後,高錯誤率的Nanopore測序可以提供媲美Illumina的罕見突變檢測效果,準確的檢測到了預設的1:100、1:1000、1:10000的罕見點突變並正確的報告出該突變的頻率。
研究團隊之後利用該技術檢測CRISPR/Cas9基因編輯引起的突變。團隊通過IDMseq技術對Cas9酶切位點附近的7-8kb範圍進行測序。研究表明,在Cas9編輯後的人多顯能胚胎幹細胞(hESC)中, 2.8-5.4% 的DNA分子存在大刪除突變。發現的最長刪除的距離超過5.5kb。其中很多刪除突變發生在相同的位點,表明可能存在這類突變的熱區。除大範圍的突變外,在基因編輯的區域DNA點突變數量增加了三倍。值得注意的是,這些點突變頻率很低(<1%),因而很難被常規測序方法捕捉到。研究團隊的這一系列發現,增加了對CRISPR/Cas9基因編輯安全性的認識,同時也為後續相關研究提供了方法支撐。
據悉,沙烏地阿拉伯阿卜杜拉國王科技大學(KAUST)生物與環境科學工程學院的畢重偉和王琳(現就職於吉林大學人獸共患病研究所)為本文的共同第一作者。沙烏地阿拉伯阿卜杜拉國王科技大學(KAUST)生物與環境科學工程學院的李墨(Mo Li)教授和北京大學的黃巖誼教授為本文的共同通訊作者。此研究也得到了阿卜杜拉國王科技大學計算生物學研究中心的高欣教授的支持。
原文連結:
https://doi.org/10.1186/s13059-020-02143-8
參考文獻:
1.Salk, J., Schmitt, M. & Loeb, L. Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations.Nat Rev Genet19, 269–285 (2018). https://doi.org/10.1038/nrg.2017.117
2. Kosicki, M., Tomberg, K. & Bradley, A. Repair of double-strand breaks induced by CRISPR–Cas9 leads to large deletions and complex rearrangements.Nat Biotechnol36, 765–771 (2018). https://doi.org/10.1038/nbt.4192
3. Bi, C., Wang, L., Yuan, B. et al. Long-read individual-molecule sequencing reveals CRISPR-induced genetic heterogeneity in human ESCs.Genome Biol21, 213 (2020). https://doi.org/10.1186/s13059-020-02143-8
來源:BioArt