自從2012年CRISPR/Cas9基因組編輯系統被發明以來,它已經被廣泛應用到生物學、醫學、農業畜牧業等多個自然科學的領域中。從今天起,我們就來系統地學習一下這個迄今為止最神奇的基因編輯系統,通過學習,我們也可以把它靈活應用到自己的科研工作中。
從最基本的組成來講,CRISPR基因編輯系統由非特異性核酸內切酶(Cas9、Cpf1或其它的Cas蛋白酶)和一條引導RNA(sgRNA、gRNA)組成。sgRNA的作用是用來引導Cas蛋白酶到達靶標DNA,然後對這個區域進行剪切。隨後細胞會啟動修復機制,在有或沒有修復模板的情況下,對被剪切的DNA的進行基於同源重組(HDR)或非同源重組(NHEJ)的修復。下面,我們來學習一下這兩個最重要的組成部分的具體細節。
圖片來自網絡
一、Cas9及其它可用於CRISPR基因編輯的核酸內切酶
Cas9蛋白的分子量大約是163kDa,10mg/mL的Cas9蛋白相當於61µM左右。Cas蛋白酶有兩個共同的特性:1) 它們必須與gRNA結合後才能對DNA或RNA進行剪切。2) 在靶標DNA上必須存在一個原間隔區相鄰序列(Protospacer Adjacent Motif),也就是PAM序列,這樣Cas蛋白酶才會在gRNA的引導下與靶標DNA結合併進行切割。Cas9所識別的PAM序列為NGG,其中N代表任意鹼基,它正好位於gRNA靶點的下遊,也就是在靶標DNA序列的3』端。而剪切的位點,就在位於PAM序列前面3~4個鹼基的位置。PAM序列是Cas9和其它Cas蛋白酶能夠對DNA進行剪切的必要條件之一,由於Cas9的PAM序列在人類和其它哺乳動物中大量存在,這樣就使Cas9成為最主流的基因編輯工具。但是,在實際應用中,我們還會遇到很多問題,尤其在進行基於HDR的基因編輯中,PAM的位置就顯得尤為重要。它最好位於被編輯區域附近,通常小於10bp的位置。當然,實際情況可能沒有這麼理想,這就要通過經驗或者選擇其它Cas蛋白酶來解決實際問題。在大多數情況下,Cas蛋白酶對DNA進行剪切會導致DNA的雙鏈斷裂,這是因為Cas9有兩個核酸內切酶活性區域:位於N端的RuvC活性域和靠近蛋白中心的HNH活性域。在與靶標DNA結合時,Cas9會發生構象變化,定位兩個活性域以切割靶標DNA。目前,科學家們已經從多種微生物中分離鑑定了多種Cas蛋白酶,並把它們改造成基因編輯工具,另外,還對Cas9蛋白酶進行了一系列設計改造,得到了多種Cas9的變異體,其中包括多種高保真Cas9,以及Cas切口酶(Nickase),比如Cas9n,它保留了Cas9兩個活性域中的一個,所以只能切割DNA雙鏈中的一條,從而產生一個DNA切口(nick)。在諸多的Cas9變異體中,D1135E、VAER、EQR和VQR比較常見,它們所識別的PAM序列與野生型Cas9有一定的區別。D1135E變體對NGG PAM特異性要比野生型Cas9高很多。其餘變體(VQR、EQR和VRER)則識別新的PAM序列,從而可用於修改野生型SpCas9無法修改的基因組位點。在人類細胞中,VQR和VRER變體的脫靶效應與野生型SpCas9相似,這表明該變體可能與野生型SpCas9具有同樣的選擇性。下面這個表格對多種Cas蛋白及其變異體所識別的PAM序列進行了總結。Cas9物種/變體和PAM序列
Cas9的種類/變體
PAM序列
化膿性鏈球菌Cas9(SpCas9)
NGG
Cas9 D1135E
NGG(減少NAG結合)
Cas9 VAER
NGCG
Cas9 EQR
NGAG
Cas9 VQR
NGAN or NGNG
葡萄球菌Cas9(SaCas9)
NNGRRT or NNGRR(N)
腦膜炎奈瑟菌Cas9(NmCas9)
NNNNGATT
嗜熱鏈球菌Cas9(StCas9)
NNAGAAW
密螺旋體Cas9(TdCas9)
NAAAAC
Cpf1(Cas12a)
TTN
萬變不離其中,雖然現在出現了很多其它類型的CRISPR基因編輯工具,但是其基本的工作原理都是類似的,離不開「定位」、「剪切」與「修復」三個步驟。圖片來自網絡
在野生型CRISPR/Cas系統中,Cas9實際上需要在兩個RNA的幫助下才能被引導到它的靶點,這兩段RNA分別被命名為crRNA和tracrRNA。crRNA的長度是30個鹼基左右,其5』端的20個鹼基可以與DNA靶標互補,3』端的10個左右的鹼基可以與tracrRNA的5』端互補。而tracrRNA,則充當了連接crRNA和Cas9的橋梁。在後續研究中發現,如果把crRNA和tracrRNA融合成一條gRNA,不但不影響Cas9的剪切效率,甚至還可以增加剪切效率和複合物穩定性。所以,在大多數CRISPR基因組編輯系統中,這兩個小RNA被濃縮成一個RNA序列,也就是sgRNA或gRNA。當使用CRISPR/Cas9進行基因組編輯時,研究人員只需設計併合成一個可以將Cas9導向他們所選擇的靶標DNA序列的gRNA就可以了。gRNA的分子量大約是32,327 g/mol,crRNA的分子量大約是13,500 g/mol,而tracrRNA的分子量大約是23,759 g/mol。100 µM的gRNA大約相當於3.23 µg/µL。記住這些數字對於將來進行基因編輯實驗非常有用。圖片來自網絡