很少有科學技術發現能像CRISPR基因編輯技術這樣,在一夜之間改變了整個生命學科領域的進程。CRISPR基因編輯技術可以說是百年不遇的顛覆性技術之一,打個比方,就相當於人類從泥板刻字的年代突然飛躍到了使用Word編輯的年代。因此,一經發現就引來全球的強勢圍觀,且研發熱度不減。
CRISPR技術的全稱為規律成簇的間隔短回文重複相關蛋白技術(Clustered regularly interspaced short palindromic repeats, CRISPR)。2012年,美國Doudna教授和德國Charpentier教授共同在Science上發表文章,闡述了 CRISPR/Cas9 的體外重構技術。2013年首次實現對人類細胞的基因編輯。隨後,基因編輯技術被快速的應用於多種動物、植物和微生物。
1. CRISPR-Cas9技術的工作原理
首先,我們需要知道什麼是CRISPR?CRISPR序列其實一開始是從細菌裡發現的一組生物分子。最初在1987 年, 日本科學家在研究細菌DNA結構時,發現大腸桿菌 DNA 中會存在一段重複序列,之後的時間裡有人也發現了這些重複序列 , 並且在2002年將這些重複序列命名為CRISPR 序列。這段序列的功能探索持續了20 年,直到 2007 年首次證實了該序列的功能是用於細菌免疫病毒感染。
CRISPR 防禦系統是如何工作呢? 當細菌首次感染病毒時,會將病毒 DNA 切下來一小段,並且插進自身基因中,為了標記這段插入的序列,前後會加一段重複序列結構,這是第一階段適應期。當細菌再次遇到病毒侵襲時, CRISPR 基因指導Cas9蛋白的表達和 sgRNA(small guide RNA,sgRNA) 的組裝,用於識別病毒,這是第二階段表達期。其中,Cas9蛋白,是一個非特異性CRISPR結合核酸內切酶,負責剪切刪除掉這些病毒DNA;sgRNA是一個短的合成RNA,由一段結合Cas9必需的scaffold序列和特定的約20nt的空載(spacer)或靶向(targeting)序列(靶位點)組成,其中靶向序列決定了用於修飾的基因靶標。因此我們只需改變gRNA上的靶向序列即可改變Cas9的基因靶標。如果和之前記錄的病毒 DNA 一樣, Cas9 蛋白在sgRNA 的引導下結合靶標 DNA,並且進行所需要的切割 , 這是第三階段幹擾期 。簡而言之 ,CRISPR/Cas9 技術通過 sgRNA與靶標 DNA 中相對保守的 PAM 序列的上遊基因互補配對,再經Cas9 蛋白對靶標基因進行切割 (圖 1)。這種特異性的天然獲得性免疫機理,稱為 CRISPR 防禦系統。
圖1 CRISPR/Cas9 基因編輯技術
切割DNA形成雙鏈缺口 (Double stranded break,DSB),然後進行目的修復,從而達到修改基因片段的目的。修復缺口的機制有兩種,一種是內源性的非同源末端連接 (Non-homologous end-joining,NHEJ),這是細胞自身的隨機修復機制,缺點是容易引起隨機插入和缺失,造成移碼突變,進而影響靶基因的功能。另一種是同源重組修復(Homology-directed repair,HDR),即在有同源片段的條件下,外源的目的基因能通過同源重組整合入靶基因,降低了錯誤率,但缺點是在細胞中的同源重組修復效率低,約為0.1%~5%,且局限於有絲分裂細胞,限制HDR修復的應用。因此,精準修復單鹼基突變是一大難題。
但我們都知道,單核苷酸變異不僅會導致大約2/3人類遺傳病的發生,也是許多動植物重要性狀變異的遺傳基礎,這是我們繞不開,必須要攻克的難題。過去,我們使用傳統誘變、單鹼基突變篩選技術(如TILLING)來實現鹼基突變,但這些技術都需要進行基因組規模的篩選,不僅耗時、耗力,而且鑑定到的點突變數目和種類有限。
但是,但是,但是,單鹼基編輯技術(base editing,BE) 還是被聰明的科學家們創新性的開發了出來!美國哈佛大學David Liu(劉如謙)實驗開發的單鹼基編輯器就是為此而生的。David Liu實驗室開發了三種不同的鹼基編輯器,分別是胞嘧啶鹼基編輯器(CBE)、腺嘌呤鹼基編輯器(ABE)和先導編輯器(Prime Editor),這些鹼基編輯器在工作時不依賴DSB的產生,也不需要供體DNA的參與。
2. 胞嘧啶鹼基編輯器
2016年4月,美國哈佛大學David Liu(劉如謙)實驗室在Nature雜誌上第一次發表了不需要DNA雙鏈斷裂也不需要同源模板即可進行單鹼基轉換的基因編輯技術—鹼基編輯器BE技術,並一口氣給出了三代升級版,即BE1.0、BE2.0 和BE3.0。
工作原理如下(圖2):在CRISPR/Cas9 技術的基礎上,將sgRNA 和融合蛋白組合到一起。其中,融合蛋白則是由經過改造Cas9蛋白、胞嘧啶脫氨酶和尿嘧啶糖基化酶抑制子三部分構成的複合體。 我們來看看具體的作用:(1)改造的Cas9蛋白,目的是讓它不再切割DNA雙鏈,不產生DBS,但仍能結合到目標DNA序列,那麼使用完好的互補鏈作為模板,DNA上的切口迅速地被HDR途徑修復。 有兩種類型,一種是單鏈DNA切口活性的 nCas9(Cas9 nickase,D10A),另一種是無核酸內切酶活性的 dCas9(Catalytically dead Cas9),可結合靶基因但不切割靶基因,兩種 Cas9 蛋白均不會產生雙鏈斷裂(DBS),那麼使用完好的互補鏈作為模板,DNA上的切口迅速地被HDR途徑修復(2)胞嘧啶脫氨酶,它的作用是將胞嘧啶 (Cytosine, C)脫氨基變為尿嘧啶 (Uracil,U),在 DNA 複製過程中則變為胸腺嘧啶 (Thymine,T),那麼產生的結果就是鹼基C變成了鹼基T;同時,互補鏈上原來與C互補的鳥嘌呤(Guanine,G)將會替換為腺嘌呤(Adenine,A),最終實現了在一定的活性窗口內C到T和G到A的單鹼基精準編輯。(3)尿嘧啶糖基化酶抑制子,它的作用是抑制中間產物 U 的切除,增加了DNA 鏈上 C 變為 T 的效率,那麼結果就是更多的C最終能變為T。
圖2 CBE工作原理
第一代鹼基編輯器BE1(rAPOBEC1-XTEN-dCas9)
David Liu評估了4種胞嘧啶脫氨酶,發現大鼠來源的rAPOBEC1(大鼠胞嘧啶脫氨酶)具有最高的脫氨酶活性。他們通過將rAPOBEC1與dCas9的N末端以及16個殘基的XTEN連接體(作用就是linker序列)融合,組成了第一代鹼基編輯器CBE1(rAPOBEC1-XTEN-dCas9),CBE1表現出大約5個核苷酸的活性窗口(activity window):靶位點4~8。可以在體外實現有效的鹼基編輯(25%~40%),但在哺乳動物細胞內的編輯效率大大下降(0.8%~7.7%)。主要原因是細胞內存在尿嘧啶DNA糖基化酶(UDG),UDG可識別UG錯配,並切割尿嘧啶和磷酸骨架之間的糖苷鍵,通過細胞內的鹼基切除修復途徑(BER)將U逆轉為C。
第二代鹼基編輯器CBE2(APOBEC-XTEN-dCas9-UGI)
第二代鹼基編輯器(BE2)系統除了將胞苷脫氨酶與dCas9連接在一起之外,還將鹼基切除修復抑制劑UGI與dCas9融合在一起,從而將編輯效率提高3倍,最高達到20%左右。對CBE1和CBE2而言,鹼基插入或刪除(insertion or deletion, indel)發生率是非常低的(<0.1%),這是因為它們並不直接切割DNA。
第三代鹼基編輯器CBE3(APOBEC-XTEN-nCas9(D10A)-UGI)
取代了dCas9由Cas9 nickase nCas9(D10A)提供,BE3在非互補DNA鏈上產生切口, BE3使得在非互補鏈DNA的4-8位(從PAM遠端數起)處的胞嘧啶(C)直接和不可逆地轉化為尿嘧啶(U)或胸腺嘧啶(T),並且誘導少得多的不想要的插入或易位。對非編輯鏈的剪切使BE3的編輯效率比CBE2高2~6倍。但是,缺點是能產生複雜的產物,人們已觀察到不想要的C->G或C->A轉換,而不是始終如一的C-> T轉換。
第三代胞嘧啶鹼基編輯器的不同子版本
BE3編輯的活性窗口可覆蓋sgRNA的第4~8位,依據不同的研究目的需要對編輯活性窗口做相應的改變。當需要精準地改變某個特定的鹼基C時,過大的活性窗口會導致窗口內非靶標鹼基C的編輯。David Liu實驗室在BE3的基礎上,通過突變胞嘧啶脫氨酶上與DNA作用的關鍵活性位點,開發了YE1-BE3、YE2-BE3、EE-BE3和YEE-BE3,從而將編輯活性窗口由5nt縮小至1~2nt,但同時對靶標C的編輯效率有所降低。通過對CBE3引入突變來減少脫靶效應,產生了高保真的鹼基編輯器(HF-CBE3).
總之,這些組分能在細菌、酵母、植物、斑馬魚、哺乳動物細胞、小鼠甚至人類胚胎中實現高效和永久的C:G到T:A鹼基對轉換。
時間進入2017年,David Liu實驗室對BE技術做了多方面改進。
第四代鹼基編輯器BE4(APOBEC-XTEN-nCas9(D10A)-2UGI)
雖然第三代鹼基編輯器包含UNG抑制劑UGI,但是添加第二個UGI拷貝可提高鹼基編輯產物的純度。此外, 通過延長APOBEC1-Cas9n和Cas9n-UGI中的接頭長度提高了鹼基編輯產物的純度,這三項改進一起代表了第四代鹼基編輯器(BE4)。與BE3相比,BE4使得C:G和C:A基因編輯產物減少了2.3倍,並且讓indel發生率減少了2.3倍。
為了降低Indels的發生,David Liu實驗室在BE4的基礎上融合了來源於噬菌體Mu的Gam蛋白,構建了BE4-Gam。Gam蛋白可結合於DSB的末端防止其降解,進而阻止了NHEJ修復途徑的發生。
細胞內胞嘧啶鹼基編輯器的表達水平是影響其編輯效率的重要因素,David Liu實驗室在BE4的基礎上通過增加不同數量的核定位信號(NLS)以及使用不同公司優化的密碼子序列等方法構建了BE4max和AncBE4max,這兩種胞嘧啶鹼基編輯器可在各種哺乳動物細胞內進行高效的編輯。
3. 腺嘌呤鹼基編輯器
第五代鹼基編輯器(腺嘌呤)ABE-P1(ecTadA-ecTadA*7.10-nCas9(D10A)
ABE的核心組成元件是nCas9(D10A)和人工定向進化的腺嘌呤脫氨酶。ABE的作用原理與CBE類似,即當融合蛋白在sgRNA的引導下靶向基因組DNA時,腺嘌呤脫氨酶可結合到ssDNA上,將一定範圍內的腺嘌呤(A)脫氨變成肌苷(I),I在DNA水平會被當做G進行讀碼與複製,最終實現AT鹼基對至GC鹼基對的直接替換。ABE的開發打破了CBE僅能編輯C或G的限制,為鹼基之間的相互轉變提供了更多的可能性。相比CBE,ABE不需要抑制烷基腺嘌呤DNA糖基化酶(AAG)的活性(圖3 )。
圖3 ABE工作原理
由於目前已知的腺嘌呤脫氨酶不能以DNA為底物對鹼基A進行脫氨,因此必須對現有的腺嘌呤脫氨酶進行定向改造,這導致ABE的開發比CBE更具有挑戰性。David Liu實驗室選取大腸桿菌的腺嘌呤脫氨酶TadA為改造對象,將隨機突變的TadA融合dCas9構建隨機突變庫,通過ABE恢復氯黴素、卡那黴素、壯觀黴素等抗性基因的功能,結合易錯PCR、DNA重排等定向進化策略,進行相應的抗生素篩選,先後經過7輪進化與改造後,成功篩選到了能直接作用於ssDNA的腺嘌呤脫氨酶,在人類細胞中建立了目前效率最高且應用最廣的ABE版本ABE7.10(ecTadA-ecTadA*-nCas9)。
ABE7.10將nCas9與野生型腺嘌呤脫氨酶ecTadA和經過定向進化的腺嘌呤脫氨酶ecTadA*二聚體融合,在人類細胞中編輯效率約為50%,編輯活性窗口可覆蓋sgRNA的第4~9位。
無論在哺乳動物還是植物等生物中,ABE7.10均可保證高精度的鹼基替換和較少的Indels發生,因此對ABE7.10的優化主要表現在提高編輯效率、擴大編輯活性窗口和擴大編輯範圍。
第六代鹼基編輯器(腺嘌呤)ABE-P1升級版
David Liu實驗室在ABE7.10的基礎上通過融合不同數量的NLS以及使用不同公司優化的密碼子序列構建了ABEmax,提高了對鹼基A的替換效率。隨後,David Liu實驗室對ABEmax進行改造,構建了CP1012-ABEmax、CP1028-ABEmax、CP1041-ABEmax和CP1249-ABEmax,這些版本的編輯器在保證編輯效率與ABEmax相當的同時,在一定程度上將4~9位的編輯活性窗口拓展為4~12位。
4. 先導編輯器(Prime Editor,PE)
CBE和ABE組合使用可以有效地進行4種鹼基轉換(C→T, G→A, A→G, T→C),然而對另外8種鹼基轉換(C→A, C→G, G→C, G→T, A→C, A→T, T→A, T→G)以及鹼基的插入和缺失,依然缺乏有效的研究工具。
為了解決這個問題,2019年10月21日,David R. Liu團隊再一次在Nature雜誌發表題為:Search-and-replace genome editing without double-strand breaks or donor DNA的研究論文。開發出了先導編輯器(Prime Editor, PE),一種能夠搜索和替換(鹼基)的基因編輯器,在不依賴DSB和供體DNA的條件下便可有效實現所有12種鹼基轉換,此外還能有效實現多鹼基的精準插入(最多可插入44bp)和刪除(最多刪除80bp)。
Nature 雜誌評論這一技術是「超精確的新型基因編輯工具」, Science 雜誌評論它是「超越CRISPR」的重大突破,哈佛大學教授,CRISPR先驅喬治·丘奇(George Church)盛讚這一成果:「朝著正確方向邁出的一大步」。
PE(圖4)以CRISPR/Cas9系統為基礎,首先是改造sgRNA,在其3'末端增加一段RNA序列,獲得的RNA被稱作pegRNA;其次是將nCas9(H840A)與逆轉錄酶融合,獲得新的融合蛋白 。pegRNA的3』端序列有雙重角色,一段序列作為引物結合位點(PBS),與斷裂的靶DNA鏈3』末端互補以起始逆轉錄過程,另一端序列則是逆轉錄的模板(RT模板),其上攜帶有目標點突變或插入缺失突變以實現精準的基因編輯。
圖4 PE的組成
PE的工作原理(圖5):首先是在pegRNA的引導下,nCas9切斷含PAM的靶DNA鏈,斷裂的靶DNA鏈與pegRNA的3』末端PBS序列互補並結合,之後逆轉錄酶發揮功能,沿逆轉錄模板序列開始逆轉錄反應。反應結束後DNA鏈的切口處會形成處在動態平衡中的5』 flap和3』 flap結構,其中3』 flap結構的DNA鏈攜帶有目標突變,而5』flap結構的DNA鏈則無任何突變。細胞內5』flap結構易被結構特異性內切酶識別並切除,之後經DNA連接和修復便實現了精準的基因編輯。用科學網博客上的話講就是:在優化後的先導編輯中,新DNA有較高概率撬動原有序列,通過細胞自帶的鹼基修復機制連接到基因組上。而原有序列則成了多餘,被修復機制去除。至此,基因編輯功能實現,其所利用是計策可以用一個成語來概括:「鵲巢鳩佔」。
圖5 PE工作原理
先導編輯器PE1、PE2、PE3和PE3b
David Liu實驗室首先將野生型的鼠白血病病毒(M-MLV)逆轉錄酶與nCas9融合,構建出第一代先導編輯器PE1。PE1在293T細胞中的點突變效率為0.7~5.5%, 鹼基插入/刪除的效率為4~17%。隨後他們通過優化M-MLV逆轉錄酶(D200N + L603W + T330P + T306K + W313F),改善了熱穩定性,逆轉錄連續性以及DNA:RNA結合緊密性,提高了編輯效率,建立了PE2系統,其點突變效率和鹼基的增刪效率較PE1有兩倍以上的提高。
PE1/2系統只編輯雙鏈DNA的一條鏈,另一條非編輯鏈需進一步的DNA修復以完成精準編輯。理論上,通過nCas9切斷非編輯鏈可以有效提高該鏈的修復效率,為此David Liu實驗室在PE2的基礎上,在pegRNA下遊50bp附近,引入另一條與pegRNA方向相反的sgRNA,達到分別切割非互補鏈的目的,建立PE3系統,進一步提高了編輯效率。PE3和PE3b的編輯效率較PE2提升了將近3倍,在293T細胞中的最高編輯效率可達78%。當然,由於使用了兩條sgRNA,PE3和PE3b的引入Indels的風險也隨之提高,這是PE3未來需要加以改進的不足之處。
5. 單鹼基編輯技術在植物領域中的進展
2017年,CBE基因編輯技術被運用到植物中,實現了對三大重要農作物小麥,水稻和玉米的性狀改良。中科院的高彩霞團隊、中科院上海植物逆境生物學研究中心的朱健康團隊和中國農業科學院作物研究所的夏蘭琴都分別報導了運用單鹼基編輯系統對水稻基因進行單鹼基編輯。高彩霞團隊構建了密碼子優化的 rAPOBEC1-XTEN-dCas9n-UGI 和 rAPOBEC1-XTEN-dCas9 -UGI 兩種融合蛋白,通過針對三大農作物共 7 個基因位點進行單鹼基編輯實驗,結果發現選用 Cas9n 可以獲得較高的單鹼基編輯效率。研究結果顯示單鹼基編輯效率在 5.0%-32.5%,靶位點處沒有發現核苷酸序列的隨機插入或缺失,而且預測可能的脫靶位點處也沒有發現突變。
2018年,ABE基因編輯技術被運用到植物。朱健康課題組、中國農科院周煥斌課題組高彩霞課題組、韓國的Jin-Soo Kim課題組先後在相差一個月的時間內分別發表文章,四篇文章證實在植物中能同樣實現ABE的精確作用。
而後在2019年,我國科學家楊輝和高彩霞各自獨立發現,在小鼠胚胎和水稻中,早期版本的胞嘧啶剪輯編輯器BE3會在全基因組範圍產生一種低頻率Cas9-非依賴的CG到TA的脫靶突變。可以說脫靶現象的存在,也促使David Liu開發出了PE基因編輯技術。
2020年,高彩霞、朱健康、張勇、夏蘭琴、楊進孝、魏鵬程團隊先後發文將PE系統應用於植物基因組編輯。在這6篇文章中,引導編輯器的各個元件都已經進行了優化嘗試,包括探索pegRNA的sgRNA骨架,PBS和RT模版的長度對引導編輯效率的影響;不同來源的逆轉錄酶,Cas9蛋白對引導編輯效率的影響;篩選系統(或者輔助篩選系統)對引導編輯效率的影響。但是比較遺憾的是這些手段目前來看對引導編輯效率的提升十分有限。總體來說,儘管都能檢測到PE編輯的結果,但植物中PE系統的編輯效率是普遍較低且不穩定的。
另外,2020年1月,高彩霞研究組和李家洋研究組合作將CBE和ABE進行組合,構建了STEME雙鹼基編輯器,並在植物中實現了基因的定向進化和功能篩選。 研究者將胞嘧啶脫氨酶APOBEC3A和腺嘌呤脫氨酶ecTadA-ecTadA7.10同時融合在nCas9(D10A)的N端,並將抑制體內尿嘧啶糖基化酶UDG的活性的UGI以融合或自由表達的形式置於nCas9 (D10A)的C端,共構建了4種形式的雙鹼基編輯器STEME (STEME-1至STEME-4)。STEME雙鹼基編輯器均可以只在一個sgRNA引導下就可以誘導靶位點C>T和A>G的同時突變,顯著增加了靶基因鹼基突變的飽和度及產生突變類型的多樣性。STEME-1在水稻原生質體中C>T誘導效率高達61.61%,C>T和A>G同時突變的效率也高達15.50%。為了提高靶基因的鹼基覆蓋度,研究者進一步利用能夠識別NG PAM的變體Cas9-NG構建了第5個雙鹼基編輯器STEME-NG,發現只需要20個sgRNA就可以對OsACC上編碼56個胺基酸的序列實現近飽和的突變。
綜上,鹼基編輯技術在人類疾病研究、動植物科學基礎研究和育種等方面應用前景廣闊,該技術的進一步優化及改造將推動農業生產,生物醫藥及生命科學等領域的快速發展。短短幾年間,單鹼基編輯系統已經更新換代的多代,每一次的進步都使我們離目標越來越近。