BioArt按:今天,Jennifer Doudna和Emmanuelle Charpentier獲得諾獎,被很多人認為實至名歸。然而重大的科學發現經常是站在巨人肩上獲得的,在CRISPR基因編輯技術發現史上,還有很多英雄,雖然他們沒有獲得諾獎,但是他們的貢獻是偉大的。舊文重發,溫故知新,以饗讀者!
撰文 | 秦逸人
CRISPR,這個幾乎讓每一個人在新聞或者報紙上看到過的詞,便是科學發展史上少有的具有如此來勢兇猛的突破性和革命性的技術。曾幾何時,有三項技術最令我痴迷,並打算去研究,那就是Nuclear transfer、iPS及CRISPR,而我所做的研究都均涉及這三項技術,其中Nuclear transfer與iPS在2012年榮膺諾貝爾生理醫學獎,而CRISPR能否問鼎,筆者認為這只是囊中取物的等待時機的過程,或許就在下個月。這裡,我想通過前段時間我工作報告PPT中的關於CRISPR的發展歷程的原始文獻資料來圖文詳解:CRISPR若問鼎諾獎,誰將是大贏家。
CRISPR,是Clustered,Regularly大Interspaced,大Short Palindromic Repeats的英文縮寫,因為很長,我用逗號格外容易理解,而這個縮寫至今還沒有對應的中文翻譯 (我把他翻譯成「酷睿斯頗」?),全稱翻譯成中文很拗口-「成簇的、規律間隔的、短回文重複」。而Cas指CRISPR-associated,如Cas genes、 Cas proteins,見上圖。
早在1987年12月,日本大阪大學的Yoshizumi Ishino以第一作者身份在Journal of Bacteriology上發報導了E. coli的iap (alkaline phosphatase isozyme) 基因的編碼序列附近存在5個高同源序列,且每個含29個鹼基,這些序列之間又被32個鹼基隔開(見圖中紅色方框),但是原文的最後說這些序列的生物學意義還是未知的。圖中照片為Yoshizumi Ishino (本人在其Researchgate下載)。
1989年,西班牙的Fransisco J. M. Mojica開始在阿里坎特 (Alicante)大學讀博士研究生,他老闆之前發現培養基中的鹽含量可能會影響地中海嗜鹽菌 (Haloferax mediterranei) 限制性內切酶切割此微生物的基因-Psfl,並希望他把這課題再深入研究一下,果然Mojica在開始鑑定這一異樣片段的時候,意外的發現在該基因的第一個DNA片段裡,有一個奇怪的大致呈回文式對稱的、有30個鹼基並被36個鹼基的間隔隔開的多拷貝重複序列的結構,而這個結構與任何已知的微生物的重複序列家族都不相同,該發現在1993年發表於Molecular microbiology雜誌上(見上圖上面部分)。
隨後,Mojica繼續深入研究這一現象,他發現在與地中海嗜鹽菌相近的沃氏嗜鹽富饒菌(H.volcanii) 和關係更遠的嗜鹽古菌中也存在類似的重複序列。這又一發現於1995年發表在同一雜誌上(見上圖中間部分)。
接下來的時間裡Mojica並沒有放棄這項研究,他繼續在20種不同的微生物上鑑定了這樣的重複現象,這些微生物除了古細菌外,還包括結核分枝桿菌(Mycobacteriumtuberculosis),艱難梭菌(Clostridium difficile)及鼠疫桿菌(Yersinia pestis),該發現在2000年再次發表在同一雜誌上 (見上圖下面部分),在此文章中,Mojica把這個重複序列命名為Short Regularly Spaced Repeats (SRSRs),另外他即是第一作也是通訊作者。
上圖右面照片為Fransisco J. M. Mojica近照。
2002年,荷蘭烏得勒支 (Utrecht) 大學的Ruud. Jansen在Molecular microbiology雜誌上發表了題為Identification of genes that are associated with DNA repeats inprokaryotes的文章,他們利用生物信息工具對一系列古菌和細菌的重複序列進行了分析。文章中,Jansen等人在Mojica的協商下(文章中致謝裡面提到的),首次將這個重複序列命名為Clustered Regularly Interspaced Palindromic Repeats,簡稱CRISPR,這就是我們現在所通用的名稱。同時,他們也首次用了CRISPR-associated(cas)這個概念。另外,他們對各種細菌和古菌的相關cas基因進行了鑑定,其中包括後面熱門研究的嗜熱鏈球菌(Streptococcusthermophiles) 與釀膿鏈球菌(Streptococcuspyogenes) 的cas3、cas4、cas1、cas2基因,在這篇文章中Jansen即是第一作也是通訊作者。上圖右面照片為Jansen (本人在其Researchgate下載)。
自2000年以後,Mojica繼續堅持研究他發現的CRISPR,他也作為早期的CRISPR領域的領軍人物,同時他想到了CRISPR對應的spacer可能也有一定的特殊功能,想搞清楚到底這些spacer究竟和什麼基因或者序列相關。於是他用BLAST等生物信息工具,在一種大腸桿菌測序到的一個CRISPR基因位點上發現了其中一個spacer與一種P1 噬菌體的序列相匹配,而這個噬菌體能感染多種大腸桿菌。而具有這一間隔的大腸桿菌對P1 phas具有免疫力。這時候,他已經檢索了4500個CRISPR spacers,發現其中88個間隔與已知序列相似,47個與細菌噬菌體相匹配。這時候,Mojica深刻的意識到CRISPR基因位點儲存了用於為保護微生物抵抗感染的適應性免疫系統所需的信息。這篇CRISPR與immune在In Silico層面預測性相關性文章在2005發表於Journal of Molecular Evolution上。
2005年,在Microbiology雜誌同期2篇文章同時再次報導了CRISPR spacer與噬菌體序列相匹配的在In Silico層面的研究。一篇為法國巴黎大學的G. Vergnaud團隊通過對61種鼠疫桿菌分析發現這些密切相關聯的分離株在串聯重複基因位點上是一致的,CRISPR基因位有許多的新spacer與存在於鼠疫桿菌基因上的原噬菌體序列相匹配。因此,他們推測CRISPR基因位點是在執行防禦機制,見上圖上面部分。
另一篇為法國國家農業研究院的Alexander Bolotin以第一作與通訊作者身份發表了在In Silico層面的關於原核生物CRISPR結構中存在其本身染色體以外的序列,進而他們也推測和假設這些CRISPR的spacers可能為對抗噬菌體感染的細胞免疫應答,見上圖下面部分。
上面Mojica,Vergnaud與Bolotin在In Silico層面發現了CRISPR的spacer與噬菌體相關性,但是還沒有實驗證據的文章來闡述這個事實。直到2007年,法國Danisco公司的Philippe Horvath (上圖照片右) 與其同事Rodolphe Barrango (上圖照片左) 在Science雜誌上正式發表了題為CRISPR Provides Acquired Resistance AgainstViruses in Prokaryotes的研究論文證明了這一事實。在這項研究中,首先他們把野生型(WT)的嗜熱鏈球菌與噬菌體一起培養後,獲得了9個能夠對噬菌體抵抗的突變菌株,然後對其CRISPR序列分析後,將其CRISPR 的一系列spacer (S1-14)序列再次插入WT菌株後,其也產生了對噬菌體的抵抗能力。同時他們也發現在那些侵蝕WT嗜熱鏈球菌的噬菌體的基因組中有S1-14的序列。另外,他們也研究了cas基因的作用,發現該菌株需要cas7來獲得抵抗力,但已經具有抵抗力的細菌再不需要這個基因。同時也發現另一個基因cas5對於該細菌對抗噬菌體是必須的,那個時候,Cas5指的就是現在大名鼎鼎的Cas9。
2008年8月,荷蘭瓦赫寧根(Wageningen)大學的John vander Oost等人在Science上發表了第一個直接由程序設計的基於CRISPR的免疫的實驗論文。首先他們鑑定了大腸桿菌K12的CRISPR/cas系統,發現其包括cas3、casABCDE、cas1及cas2等8個基因,其中casABCDE稱為Cascade。通過Cascade的每一個基因逐一剔除,證實了Cascade能夠將CRISPR前體cleave為 57nt的CRISPR RNA (crRNA),進一步對crRNAs測序發現,其從8個鹼基的重複序列開始,緊隨其後的是完全間隔和新重複區的出現。接下來,他們用實驗證實了crRNA是產生源於CRISPR的噬菌體抵抗的原因。他們將人工設計的CRISPR序列插入大腸桿菌,果然攜帶新的CRISPR序列的品系對噬菌體呈抵抗,見上圖,右側照片為Oost(本人在其Researchgate下載)。
對於上面的荷蘭著名科學家Oost,我還想再另提及一下,他於2014年在Nature發表了一篇題為DNA-guided DNAinterference by a prokaryotic Argonaute的文章,他們發現古細菌Thermusthermophilus的Argonaute (TtAgo) 保護其不受DNA而不是RNA入侵,而TtAgo的功能是通過DNA引導幹擾DNA的宿主防禦的文章。他們從該細菌中純化了TtAgo,發現5'-磷酸化的單鏈DNA能夠指導TtAgo在75℃高溫條件下斷裂質粒DNA,見上圖上面部分。
其實對於Argonaute蛋白人們並不陌生,在人類有8種已知的Argonaute蛋白家族,其在RNA silencing processes中起重要作用。但是在真細菌和古細菌中的Argonaute的作用卻了解甚少。而2016年4月12號,CRISPR先驅加州大學伯克利分校Jennifer Doudna就在PNAS發表了一篇關於Ago蛋白與CRISPR相關的文章,他們發現在Marinitoga piezophila菌的Argonaute(MpAgo) 利用5'-羥基化的gRNA能夠斷裂單鏈靶向的DNA序列。另外他們也獲得了MpAgo RNA與TtAgo的高解析度晶體結構,見上圖,圖中照片為Doudna。
我們繼續回到CRISPR。儘管上面Oost預測CRISPR的靶向目標不是RNA而是DNA,但是還沒有直接的實驗證據。直到2008年底,美國西北大學的Luciano Marraffini等人在Science雜誌發表論文證實了這一結論。他們對表皮葡萄球菌 (Staphylococcus epidermidis)的CRISPR系統定向射靶的質粒中的切口酶基因進行了改變,即在它的序列中間插入一個自我剪接的內含子。若CRISPR是以mRNA為目標,其不會影響幹擾功能。若CRISPR是以DNA為目標,那麼這個插入的內含子會影響幹擾功能。他們的結論就是CRISPR的目標是DNA。這時候,他們認識到CRISPR在本質上是一種可編輯並能設計的限制性內切酶。在文章的最後,他們也預示了CRISPR可以被設計後,利用在其他異源性系統內進而進行基因組編輯。見上圖,右面照片為Marraffini。
2010年,加拿大拉瓦爾(Laval) 大學的SylvainMoineau團隊在Nature雜誌上以Article形式報導了嗜熱鏈球菌 (Streptococcus thermophiles)的CRISPR/Cas9系統是由crRNAs指引並且在DNA中產生雙鏈裂斷。他們也發現了CRISPR/Cas9系統在斷裂噬菌體雙鏈DNA的時候是在proto-spacer位點,見上圖,右面照片為Moineau。
2011年3月,當時還在瑞典于默奧大學的法國女科學家Emmanuelle Charpentier在Nature以Article形式發表了關於發現CRISPR/Cas系統的tracrRNA (trans-activating CRISPR RNA) 的開拓性的研究論文。這篇文章中,Charpentier等人對S. pyogenes通過dRNA-seq(differential RNA sequencing) 分析,發現了一個25nt、與CRISPR重複序列近乎完美地互補tracrRNA,其與csn1參與RNAase III對CRISPR轉錄出序列的選擇性酶切而產生crRNA,隨後csn1、tracrRNA和crRNA形成的複合物可對與crRNA配對的外源DNA實施切割。這裡的csn1便是以後重新命名的大明星Cas9,見上圖,左面照片為Charpentier,她創立的公司為CRISPR Therapeutics。
2011年8月,立陶宛維爾紐斯 (Vilnius) 大學的Virginijus Siksnys在Nucleic Acids Research雜誌上發表了關於首次利用在遠緣細菌物種內重建CRISPR的研究論文。他們將S.thermophiles的整個CRISPR基因位點轉入遠緣的E. coli內,發現了其足以實現對質粒和噬菌體DNA的靶向幹擾,見上圖,右面照片為Siksnys。
2012年8月,Doudna與Charpentier兩個團隊合作在Science雜誌發表了關於利用CRISPR/Cas系統在體外對DNA進行精確切割的具有開拓性的研究論文。在此文中,他們對WT的S. pyogenes的CRISPR/Cas系統進行改造,將tracrRNA和crRNA整合為一條單鏈,稱為crRNA:tracrRNA chimera (本文中又稱chimericRNA),其具有兩個特性,一個位於5』端與靶序列互補的20個核苷酸(crRNA作用),另一個為3』端被Cas9識別的雙鏈髮夾結構(tracrRNA作用),該chimeric RNA與靶DNA相應序列互補配對可啟動核酸內切酶Cas9的活性,進而讓Cas9的HNH結構域與嵌合RNA互補的鏈切開,同時Cas9的RuvC樣結構域將非互補鏈切開,見上圖,右側照片為Doudna (右) 與Charpentier (左)。此項研究奠定了CRISPR/Cas系統作為基因組編輯基礎,也成為讓該項技術發明的一個裡程碑。文章的最後,Doudna與Charpentier也預示了該項研究可以和ZFNs和TALENS一樣,可能作為另外一種選擇性的有效的RNA指導的基因編輯方法。
前面關於CRISPR/Cas系統的重要元素都被基本搞清楚了,比如對於S. pyogenes來講包括Cas9,crRNA、tracrRNA及PAM (protospaceradjacent motif)。接下來做的事就是將這些必需元件組裝起來轉入到人的細胞,看能否WORK。
於是,2013年1月3號在線發表了張鋒團隊發表了關於利用CRISPR/Cas系統實現對人類細胞進行基因組編輯的研究論文。該項研究就是用了之前Doudna與Charpentier研究成熟並命名的S. pyogenes的CRISPR/Cas系統,包括Cas9、chimeric RNA及PAM。Zhang在人的癌細胞系HEK 293FT 與 N2A 當中實現,見上圖,右側照片為Zhang。
重要並巧合的是,在2013年1月3號的Science文章同時也刊登了哈佛大學George M. Church團隊的關於利用CRISPR/Cas系統實現對人類細胞進行基因組編輯的研究論文。與上面不同的是,Church等人將S. pyogenes的crRNA-tracrRNA fusion transcripts命名為了gRNA(guide RNA),基因組編輯的人的細胞不僅僅有癌細胞系293T和K562,還有更為重要的正常的人的iPS細胞,也就是說該項研究是第一次利用Cas9對正常人細胞及幹細胞的基因組編輯。見上圖,左側照片為Church,長得像金毛獅王。
還有一項非常重要的研究,那就是2013年1月29在eLIFE雜誌報導了Doudna利用S. pyogenes的CRISPR/Cas系統實現對293T細胞進行基因組編輯的研究成果。這篇文章裡Doudna首次將前面的chimeric RNA正式命名為目前通用的sgRNA (single-guide RNA )。
這裡我們可以看到,如此瘋狂研究的CRISPR/Cas系統,在2013年的1月同時有3篇文章報導了利用其對人類細胞進行基因組編輯。
接下來,Doudna在2014年3月在Science雜誌報導了S. pyogenes apo-Cas9的晶體結構,見上圖。
2014年2月底,張鋒聯合日本東京大學的Osamu Nureki在Cell雜誌報導了S. pyogenes Cas9-sgRNA複合體的晶體結構(Zhang應該不像Doudna專做生物結構,只能拉個大牛一起研究),見上圖,右側照片分別為Nureki和Zhang。
2015年11月,Doudna又在Nature雜誌報導了S. pyogenes的Cas9的HNH結構域的構想狀態直接控制了靶向DNA切割的活性。他們利用分子內螢光共振能量轉移技術,揭示了HNH核酸酶結構域的一種激活構象,並正式了一個完整的擴展α-螺旋充當了變構開關,將HNH的構想改變傳達給Ruvc結構域,激活其實現DNA切割。
2016年2月,Doudna再次在Science雜誌報導了捕獲S. pyogenes的Cas9蛋白進行DNA編輯時的3D圖像,這些圖像表明Cas9與DNA鏈之間發生相互作用會導致DNA鏈發生彎曲形成一定角度,引起DNA和RNA鏈在特定位置形成R環。
在2014年,Doudna、Charpentier,Zhang均在頂級學術期刊發表了關於CRISPR-Cas的Review,前兩人合作發表在Science雜誌,後者與Patrick D. Hsu及Eric S. Lander合作一起發表在Cell雜誌。我在細讀他們的文章時發現:在2篇文章中都用了時間軸描述CRISPR-Cas的重大事件,Zhang在描述2013年第一次實現人類基因組編輯的時候,僅引用了他和Church的文獻,而沒有提及Doudna在eLIFE的文章,而後者卻均提及同年同月的這三篇實現人類基因組編輯的重要文章。
2016年3月,美國沃倫·阿爾珀特獎基金會(Warren Alpert Prize Foundation) 授予5位對理解CRISPR的細菌防禦系統及其在基因編輯方面的革命性發現做出重要傑出科學家,包括Barrangou、Doudna、Horvath、Siksnys及Charpentier (這裡沒有Zhang與Church)。
2014年11 月,Doudna與Charpentier同時榮膺2015生命科學突破獎(Breakthrough Prize in Life Sciences)。
既然CRISPR-Cas系統目前已經獲得了Warren Alpert與Breakthrough大獎,接下來就是其是否能問鼎諾貝爾獎,如果是,那麼誰又是大贏家呢?我用下面一張表分析一下:
(說明:本文原載於科學網秦逸人老師博客,秦老師授權BioArt發布此文,特此感謝!閱讀原文可點擊左下方「原文閱讀」,文章二次轉載需原作者同意。)