論文標題:Harnessing accurate non-homologous end joining for efficient precise deletion in CRISPR/Cas9-mediated genome editing
期刊:Genome Biology
作者:Tao Guo, Yi-Li Feng, Jing-Jing Xiao, Qian Liu, Xiu-Na Sun,Ji-Feng Xiang, Na Kong, Si-Cheng Liu, Guo-Qiao Chen, Yue Wang, Meng-Meng Dong, Zhen Cai, Hui Lin, Xiu-Jun Cai and An-Yong Xie
發表時間:2018/10/19
數字識別碼:10.1186/s13059-018-1518-x
原文連結:https://genomebiology.biomedcentral.com/articles/10.1186/s13059-018-1518-x?utm_source=WeChat&utm_medium=Website_linksSocial_media_organic&utm_content=CelZha-MixedBrand-multijournal-Multidisciplinary-China&utm_campaign=ORG_AWA_CZH_BMCWechat_dailyposts_blogs
微信連結:https://mp.weixin.qq.com/s/r5wl6JdZ9xaPVKWt99Nn1w
CRISPR基因編輯技術主要是通過細胞內DNA雙鏈斷裂(Double strand breaks,DSB)的定點誘導及隨後的修復來實現,其中可利用的一條主要修復途徑是非同源末端連接(non-homologous end joining,NHEJ)。由於CRISPR/Cas9介導的常規基因敲除效率高,且依賴於突變型NHEJ,修復CRISPR/Cas9誘導的DSB的NHEJ常被認為是易錯的。然而,Cas9誘導的DSB主要是平末端,不需要額外的末端加工就可以直接相連,浙江大學醫學院附屬邵逸夫醫院及轉化醫學研究院謝安勇研究組推測,CRISPR/Cas9誘導的NHEJ修復應該是偏向精準型的,而且這個偏向性或許可以幫助提高CRISPR/Cas9基因編輯的效率及精準度。儘管作者先前的研究已顯示,可直接相連的DNA末端,包括Cas9 誘導產生的平末端,可以通過精準型NHEJ高效修復[1,2],但研究只局限於個別基因組位點,還未在多個位點上進行系統驗證及分析,其中的規律也不明了。
為解決這個問題,該研究組設計了配對sgRNA靶向小鼠和人基因組的71個位點,引導Cas9在這些靶點上誘導兩個鄰近的DSB。這兩個臨近的DSB可以同時或分別產生:同時產生的DSB歸類於Group I,只產生第一個DSB的為Group II,只產生第二個DSB的為Group III,兩個DSB分別產生的為Group IV(圖1a)。這些類型的DSB被NHEJ修復之後,通過靶點序列PCR擴增子深度測序,結合研究組開發的生信分析軟體,可以計算不同類型修復產物頻率,鑑定修復特徵。在Group I DSB的修復中,無論NHEJ是精準型還是突變型,都將導致間隔序列丟失,因此通過分析接口序列可以將精準型NHEJ從突變型中區分開來。 結果顯示,70個基因組位點總基因編輯效率(即NHEJ修復頻率)平均約為35.8%,其中大約60%為Group I NHEJ產物,而Group I NHEJ產物中精準型NHEJ比例平均約50%(圖1b),並且在很多位點上精準型NHEJ甚至超過80%。以上結果表明,修復Cas9產生的DSB的NHEJ途徑偏向精準型NHEJ。正因為配對Cas9-sgRNA策略可以區分精準型NHEJ和突變型NHEJ,該方法還可以取代常用的NHEJ報告系統,用於定量分析細胞內和動物體內的NHEJ,而且更方便、更靈活。
圖1. 配對Cas9-sgRNA技術在71個內源基因組位點的NHEJ分析。a. 配對Cas9-sgRNA誘導的NHEJ產物(基因組編輯)示意圖。b. 70個基因組位點的總編輯效率、Group I NHEJ效率及精準型NHEJ效率。額外的1個位點只能計算精準型NHEJ效率而未被包括在內。
課題組還注意到,在所分析的70個位點中,有的位點精準型NHEJ頻率極低,甚至不超過20%(圖1b),這樣的現象通常被認為是受末端加工導致核苷酸丟失(即刪除)影響所致。然而,分析顯示,在修復Cas9誘導的DSB時,低頻精準型NHEJ主要伴隨的是高頻核苷酸插入,而且這些核苷酸不是隨機的,而基本都是由模板序列決定的核苷酸插入,稱模板化插入(templated insertions,TI)(圖2a)。先前的研究已表明,Cas9的RuvC和HNH核酸酶結構域通常在PAM(protospacer adjacent motif)前第3位鹼基切割,產生平末端,但RuvC有時在第4位或第5位鹼基切割,產生帶1個 或2 個核苷酸(nucleotides,nt)外伸端的5』粘性末端[3]。此時,由於Group I DSB的兩個5』粘性末端有極小的互補概率,細胞難以通過精準型NHEJ修復,而是通過DNA聚合酶將粘性末端補平,在連接時就會產生+1核苷酸或+2核苷酸的模板化插入[4]。這些模板化插入的頻率與精準型NHEJ發生頻率成負相關,即精準型NHEJ的效率越低,模板化插入比例越高(圖2b)。也因為這個原因,配對Cas9-sgRNA策略所得出的精準型NHEJ頻率低估了修復Cas9誘導的單個DSB的精準型NHEJ效率。
圖2. 71個基因組位點模板化插入對精準型NHEJ效率的影響。a. +1 nt插入效率與+1 nt模板化插入效率幾乎完全正相關。b. +1 nt和+2 nt模板化插入效率與精準型NHEJ效率呈負相關。
那麼,是否可以通過避免模板化插入提高精準型NHEJ的效率呢?根據模板化插入產生的原理,配對Cas9-sgRNA在靶點上的特定定位應該可以避免模板化插入。Cas9-sgRNA在靶點上的定位由PAM決定,PAM 基序既可以在Watson鏈(即W)上,也可以在Crick鏈(即C)上。因此,配對Cas9-sgRNA在靶點上的位置可以排列出四種組合:W/W、W/C、C/W和C/C(圖3a)。如果Cas9產生的DSB是平末端,修復產物不會有高頻的模板化插入;只有當Cas9產生5』外伸端時通過DNA聚合酶補平才會產生模板化插入。然而,在W/C位置組合中,前後兩個DNA末端的5』外伸端補平後相當於Cas9切割產生的平末端,可以預測修復完成後不會有額外的模板化插入,而其它三種組合(W/W、C/W和C/C)則會產生(圖3a)。結果正如預期,通過對71個基因組位點的分析,配對Cas9-sgRNA為W/C位置時,幾乎檢測不到模板化插入(圖3b),而且精準型NHEJ效率最高(圖3c)。這一結果提示在使用配對Cas9-sgRNA基因編輯技術時,儘可能選擇「W/C」位置組合以期獲得最高效率的精準型NHEJ修復事件。
圖3. 配對Cas9-sgRNA的PAM組合對精準型NHEJ的影響。a. 根據配對Cas9-sgRNA在靶點上的PAM位置產生的四種組合。b. 配對Cas9-sgRNA的PAM組合對模板化插入產生的影響。W/C組合幾乎不產生模板化插入。c. 配對Cas9-sgRNA的四種PAM組合對精準型NHEJ效率的影響。W/C組合產生更高效的精準型NHEJ。
由於配對Cas9-sgRNA的在靶點上的切割間距可以設置為移碼的3n+1或3n+2鹼基對(n為0或大於0的整數),高效的精準型NHEJ理論上可以幫助提高移碼突變頻率。為了明確配對Cas9-sgRNA策略在基因敲除(即移碼突變)中是否比傳統的CRISPR/Cas9方案更有效,作者將編輯中產生的四種NHEJ產物(即上述的Group I、II、III和IV產物)進行重新歸類和計算,比較這些產物對移碼突變效率的影響。配對Cas9-sgRNA策略(即「Paired」策略)最理想狀態只產生Group I產物(即「Ideal」),而傳統的雙sgRNA基因敲除技術(即「Common」策略)沒有Group I NHEJ,只是Group II、III和IV事件的總和(圖4a)。通過對其中50個產生移碼突變的位點進行分析,作者發現,一旦精準型NHEJ頻率超過29.8%,「Paired」策略比「Common」策略在移碼突變編輯時更有效,而且,精準型NHEJ頻率越高,移碼突變頻率提高的越高,但都低於「Ideal」狀態(圖4b)。考慮到絕大部分位點的精準型NHEJ效率都超過29.8%,可以認為配對Cas9-sgRNA策略總體上比傳統基因敲除技術更有優勢。同時,由於特定長度精準刪除的基因敲除產物將增加,基因敲除的同質性也隨之提高,這有利於挑選等位基因精準移碼突變的細胞克隆。
圖4.配對Cas9-sgRNA技術可以提高基於移碼突變的基因敲除編輯。a. 配對Cas9-sgRNA編輯產物分組示意圖。配對Cas9-sgRNA編輯產物可分成最理想的「Ideal」、傳統策略「Common」和配對策略「Paired」三組。標註的Group I、II、III及IV分布於各組。b. 精準型NHEJ頻率與移碼突變效率正相關。c. 基於精準型NHEJ的「3n+2」鹼基對刪除,而不是「3n+1」鹼基對刪除,在平均水平上可提高移碼突變頻率。
此外,當配對Cas9-sgRNA的切割間距設置為3n+1鹼基對時,高頻的+1核苷酸模板化插入會將3n+1的移碼突變轉變為3n的整碼突變,基因敲除效率會因此受影響。然而,如果配對Cas9-sgRNA的切割間距為3n+2時,即使高頻的+1核苷酸模板化插入也只是將3n+2的移碼突變轉變為3n+1,移碼突變的效率不受影響,配對Cas9-sgRNA基因敲除技術的效果仍優於傳統CRISPR/Cas9基因敲除技術(圖4c)。
基因編輯中也常應用到整碼刪除或整碼突變,比如整碼刪除基因的特定功能區域。既然配對Cas9-sgRNA的切割間距可以設置為3n鹼基對(n為大於0的整數),是否可以利用高效的精準型NHEJ修復實現高效精準的整碼刪除呢?作者於是分析了配對Cas9-sgRNA策略介導的20個整碼突變位點。結果顯示,傳統基因編輯技術(即「Common」技術)將整碼突變效率維持在33%左右,而「Paired」配對策略明顯優於「Common」技術(圖5)。其介導的整碼突變效率還隨著精準型NHEJ頻率的提高而提高(圖5)。其中的主要編輯組分是精準整碼刪除,同質性明顯得以改良,這便於挑選等位基因精準整碼刪除的細胞克隆。
圖5. 配對Cas9-sgRNA技術可以提高整碼突變的編輯效率。
為了提高精準型NHEJ,幫助配對Cas9-sgRNA的基因編輯效果,本文還報導了一個可以提高精準型NHEJ效率的小分子化合物——Plk3的小分子抑制劑GW843682X(圖6a)。通過抑制Plk3介導的末端加工酶CtIP的磷酸化,該抑制劑可以阻礙末端加工,提高精準型NHEJ效率[5]。通常,精準型NHEJ的提高是以犧牲總編輯效率為代價的,有時總體上並不利於精準基因編輯。慶幸的是,GW843682X不僅不降低總編輯效率,反而提高(圖6b)。這為提高配對Cas9-sgRNA的基因編輯效果提供了一個可以化學改良的機會。
圖6. Plk3抑制劑GW843682X可以提高配對Cas9-sgRNA工作效能。a. Plk3抑制劑提高精準型NHEJ效率。b. Plk3抑制劑提高Cas9-sgRNA的總編輯效率。
基於配對Cas9-sgRNA編輯特徵,作者提出相應的基本操作流程及該技術需要遵循的幾個原則(圖7):1)需要從針對特定基因組靶點的多個sgRNA中快速篩選出有效的配對sgRNA;2)該技術適用於基因組DNA短片段刪除,本文所測試的長度主要集中在12-148鹼基對之間;3)配對Cas9-sgRNA 的PAM方向組合儘量選擇W/C以避免高頻的模板化插入;4)移碼突變時配對Cas9-sgRNA切割間距設置為3n+1或3n+2鹼基對(n為0或大於0的整數),但為避免高頻的+1核苷酸模板化插入,儘量選擇3n+2鹼基對;5)整碼突變時配對Cas9-sgRNA切割間距設置為3n鹼基對(n為大於0的整數);6)必要時可以利用Plk3的小分子抑制劑GW843682X提高基因編輯效果。
圖7. 利用配對Cas9-sgRNA編輯策略進行基因編輯的流程圖及需要遵循的原則。
本文中,配對Cas9-sgRNA技術被用於DNA損傷應答因子MDC1的精準移碼刪除(即精準基因敲除)以及53BP1的寡聚結構域(oligomerization domain,OD)和Tudor結構域的精準整碼刪除。作者從中獲取等位基因精準編輯的細胞克隆,分析基因及對應結構域的功能,驗證了配對Cas9-sgRNA基因編輯技術的應用潛力。隨著PAM相容性的拓展,配對Cas9-sgRNA策略可以應用到更多的基因組靶點,應用將更廣泛。
上述研究成果於10月19日於Genome Biology在線發表,題目為「Harnessing accurate non-homologous end joining for efficient precise deletion in CRISPR/Cas9-mediated genome editing」。浙江大學醫學院附屬邵逸夫醫院及轉化醫學研究院謝安勇教授和浙江大學醫學院附屬邵逸夫醫院蔡秀軍教授為本文共同通訊作者,實驗室博士生郭濤和助理研究員馮依力為共同第一作者。該研究由國家自然科學基金委、浙江省自然科學基金委、浙江省科技廳項目基金資助。
點擊閱讀論文(https://genomebiology.biomedcentral.com/articles/10.1186/s13059-018-1518-x?utm_source=WeChat&utm_medium=Website_linksSocial_media_organic&utm_content=CelZha-MixedBrand-multijournal-Multidisciplinary-China&utm_campaign=ORG_AWA_CZH_BMCWechat_dailyposts_blogs)
摘要:
Background
Many applications of CRISPR/Cas9-mediated genome editing require Cas9-induced non-homologous end joining (NHEJ), which was thought to be error prone. However, with directly ligatable ends, Cas9-induced DNA double strand breaks may be repaired preferentially by accurate NHEJ.
Results
In the repair of two adjacent double strand breaks induced by paired Cas9-gRNAs at 71 genome sites, accurate NHEJ accounts for about 50% of NHEJ events. This paired Cas9-gRNA approach underestimates the level of accurate NHEJ due to frequent + 1 templated insertions, which can be avoided by the predefined Watson/Crick orientation of protospacer adjacent motifs (PAMs). The paired Cas9-gRNA strategy also provides a flexible, reporter-less approach for analyzing both accurate and mutagenic NHEJ in cells and in vivo, and it has been validated in cells deficient for XRCC4 and in mouse liver. Due to high frequencies of precise deletions of defined 「3n」-, 「3n + 1」-, or 「3n + 2」-bp length, accurate NHEJ is used to improve the efficiency and homogeneity of gene knockouts and targeted in-frame deletions. Compared to 「3n + 1」-bp, 「3n + 2」-bp can overcome + 1 templated insertions to increase the frequency of out-of-frame mutations. By applying paired Cas9-gRNAs to edit MDC1 and key 53BP1 domains, we are able to generate predicted, precise deletions for functional analysis. Lastly, a Plk3 inhibitor promotes NHEJ with bias towards accurate NHEJ, providing a chemical approach to improve genome editing requiring precise deletions.
Conclusions
NHEJ is inherently accurate in repair of Cas9-induced DNA double strand breaks and can be harnessed to improve CRISPR/Cas9 genome editing requiring precise deletion of a defined length.
閱讀論文全文請訪問:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-018-1518-x?utm_source=WeChat&utm_medium=Website_linksSocial_media_organic&utm_content=CelZha-MixedBrand-multijournal-Multidisciplinary-China&utm_campaign=ORG_AWA_CZH_BMCWechat_dailyposts_blogs
期刊介紹:
Genome Biology(https://genomebiology.biomedcentral.com/,13.2 - 2-year Impact Factor,16.5 - 5-year Impact Factor) publishes outstanding research in all areas of biology and biomedicine studied from a genomic and post-genomic perspective.
來源:科學網