「合成生物學是本世紀最受關注的研究主題之一。從一個人的成長比喻來說,2010年之後的合成生物學進入了青少年時期。可能與充滿煩惱和問題的「青春期」不同,合成生物學在過去十年蓬勃發展,並帶來了許多新技術和具有裡程碑意義的成就。」
孟凡康,Tom Ellis
Imperial College Centre for Synthetic Biology
Department of Bioengineering, Imperial College London
註:本文整理自2020年10月14日發表在Nature Communication的COMMENT文章:The second decade of synthetic biology: 2010–2020。文章篇幅有限,難免出現評述不準確或者不完整,還請見諒。
Cite:Meng, F. and Ellis, T. (2020) The second decade of synthetic biology: 2010–2020.Nat Commun, 11, 5174.
2020年,合成生物學已經20歲了。我們在第一個十年看到了很多令人印象深刻的研究成果和許多充滿遠見的思考。但在合成生物學的第二個十年,也就是2010年至2020年,當初的一些炒作真正地被它的成就所取代了嗎?
這十年似乎有一個很好的開始。回顧2010年,當年引起全世界關注的合成生物學事件是J. Craig Venter研究所(JCVI)的研究團隊完整地合成了一個細菌基因組[1]。這項具有裡程碑意義的成就表明:DNA合成和組裝可以擴展到兆鹼基大小。但是,僅僅擴大DNA組裝的水平還不足以實現該領域其他眾多的野心。在2010年我們也看到了「Five Hard Truths for Synthetic Biology」的發表。這是一篇非常重要的文章,它揭示了在工程理念/技術上的緩慢進展正在拖慢合成生物學兌現可靠化、標準化和自動化設計的腳步[2]。
這些問題確實是該領域面臨的巨大挑戰。我們也可以在這十年首批合成生物學論文中明顯地看到這些問題,比如一篇發表在Nature Communication的論文表明當轉移到不同的大腸桿菌菌株中時,即使是我們認為的同一種微生物(不同的亞型),邏輯門基因線路的表現也會差異巨大,甚至會完全失效[3]。這帶來了很多疑問:我們真的可以解決諸如底盤、噪音、代謝負擔和元件幹擾等棘手的合成生物學問題嗎?我們真的能夠像對電子電路工程一樣對細胞進行工程設計嗎?
答案是肯定的。這要歸功於該領域的許多人,尤其是麻省理工學院的Chris Voigt,開展的一系列的工作。Nielsen等人在2016年發表了Cello,用於大腸桿菌中的邏輯基因電路設計,這是一種出色的端到端計算機輔助設計系統[4]。在過去十年中,這對於原教旨合成生物學家來說可能是最令人滿意的一篇論文,因為它通過標準化、精細刻畫和自動化設計在一定程度上實現合成生物學所許諾的工程設計理念。在此篇文章前後,Voigt的團隊也發表了眾多其他有關大腸桿菌合成生物學的基礎論文,不斷地為我們提供了眾多遺傳元件的設計算法,同時開發了多樣的元件庫並提供了詳細的表徵數據。
圖1:從2010年到2020年,合成生物學具有裡程碑意義的研究成果
雖然我們很容易關注到合成生物學的許多重要成就(圖1),但是真正推動該領域發展主要有兩點:1. 大量艱苦的技術工作提高了我們對遺傳元件或者生物系統的理解程度和設計能力;以及2. 新技術的發現和創新讓我們在設計、構建、編輯和共享DNA遺傳元件上變得比以往都更加高效(圖2)。
圖2:在過去的十年間,新的智能技術和工作方式加快了合成生物學的設計-構建-測試-學習過程。
的確,回顧十年來,最引人注目的莫過於用於工程生命相關的工具和技術的進步。過去許多研究組通過iGEM比賽來交換不同的基因元件:元件通過BioBrick克隆方法進行串聯組裝,然而這些元件的表徵數據實際上很少可靠。構建表達載體也是一項緩慢的實驗室工作,而且在導入細胞後的效果往往不如預期甚至完全沒有效果。在細胞內編輯DNA的方法非常少,但是需求非常迫切。因此,最早在2011年和2012年出現的CRISPR基因編輯技術似乎更像是一種順其而然的事情。2006年以來,George Church的實驗室一直在進行將每個TAG終止密碼子突變為TAA密碼子的項目[5],希望最終能夠省出一個密碼子用於非天然胺基酸的高效引入。因此,他們對開發可以精確改變細胞內DNA的任何技術都非常感興趣。他的團隊和他的前博士後發表於2013年的兩篇論文展示了CRISPR可以用於真核細胞,同時George Church研究組在隨後的幾年中在CRISPR上進行了進一步的創新,包括引發爭議的基因驅動技術。不僅僅是切割DNA的工具,加利福尼亞的合成生物學研究團隊發明了獨特的dCas:dCas9與DNA結合過程的可編程性,使得我們可以定製化地對基因表達進行調控[6]。
雖然CRISPR毫無疑問是生物科學領域過去十年最重要的突破之一,但也許它的先驅TALENs(TAL-Effector核酸酶)在革新過去10年中合成生物學的發展方面值得更多的讚譽。TALENs本身模塊化、可編程性的DNA結合能力以及可細胞內基因編輯的特點在2011年吸引了許多人使用這項新技術。但是,TALENs具有高度的序列重複性,對於習慣於經典DNA克隆方法、PCR甚至Gibson的人來說都是一記重重的耳光。如果想使用TALENs,我們一般需要購買大量合成的DNA,或者精通基於機器的DNA自動化組裝過程,或者直接使用來自Addgene的Golden Gate Assembly TALEN克隆工具包。幸運的是,合成生物學領域的許多人嘗試了一、二、甚至所有這三件方法,很快就看到了DNA的組裝可以有多快。Golden Gate Assembly現在在基因構建過程中主導方法之一,通過Addgene共享的許多模塊化克隆(MoClo)工具箱和遺傳元件庫已經改變了人們的工作方式,讓我們可以基於彼此工作繼續前進。很多公司和學術機構建立了專用於DNA自動克隆的設施,當然最重要的是,低廉的DNA合成現在比自己動手構建克隆更具成本效益。合成基因價格的大幅下降已經徹底改變了人們在生物設計上的工作方式。
基因合成成本的下降主要歸因於一種新方法:在晶片上並行合成包含數千個寡核苷酸的「寡核苷酸池」,並與下一代測序(NGS)結合使用。這是方法在驗證合成DNA的準確性上更具成本效益。這兩項技術也使我們在合成生物學中的工作方式上發生重大變化,我們突然可以在一個實驗中並行設計、構建和表徵數十萬個基因設計[7]。如果將基因設計的表徵和NGS(例如barcoded RNAseq)偶聯起來,此時數據分析將成為一種的新瓶頸,而不再是基因的設計和組裝過程。在過去的十年中,這導致了合成生物學中數學方法與生物學之間關係的重大轉變。在21世紀初期,合成和測試DNA設計緩慢而昂貴時,數學建模對於預測效果以及縮小設計空間上非常有用。但是現在很少需要這種方法了,因為數學在生物設計的重點轉向了大型數據的統計分析,我們可以從數據分析結果中學習如何設計DNA。
在過去的十年中,超級計算工具還在分子建模和預測的領域開闢了新的領域。由David Baker領導的蛋白質理性設計突飛猛進。在這十年快結束的時候,David Baker研究團隊讓人工合成的功能蛋白成為了酵母細胞中基因線路的關鍵組分[8]。第一個Mycoplasma genitalium全細胞模型的發布[9]使得我們可以在一個細胞周期過程中模擬數百個基因的作用,而這促進Craig Veter團隊在最小基因組工作上的進展,該項目在2016年達到了另一個裡程碑:迄今為止擁有最小基因組的生命Synthia 3.0誕生了[10]。
國際Sc2.0計劃也將合成基因組帶入了真核生物,通過國際合作設計並構建了高度修飾且功能齊全的合成酵母染色體[11]。在2019年,大腸桿菌在合成基因組上也取得了進一步的進展:我們刪減了基因組上的3個密碼子,這使得我們可以在細胞內引入更多的非天然胺基酸分子[12]。同時我們還可以在生物中引入非天然核酸,並實現了非天然核酸-非天然胺基酸的編碼與解碼過程。
DNA也成為了一種存儲數據的方式,最初只是在體外通過化學合成,然後又通過「分子記錄儀Molecular Recorder」遺傳系統將其存儲在細胞中。分子記錄儀主要是通過重組酶或者CRISPR在細胞生長過程中對基因進行修改來儲存信息。我們可以將分子記錄儀設置在益生菌中,這樣一來益生菌便可以在腸道中進行健康監測。人工改造益生菌剛開始用來檢測尿液來判斷癌症,後續也轉變為了疾病療法,用於糾正代謝紊亂、感知和殺死病原體等等。製藥行業最熱門的基於細胞的療法,即靶向癌症的CAR-T細胞療法,也開始配備了合成生物學的傳感和邏輯裝置。合成生物學的傳感和邏輯也發現了更多的醫療應用,比如用於檢測伊波拉和寨卡病原體RNA的紙質生物感應器[13]。這些傳感器大多通過新的模塊化方法來設計複雜的核酸相互作用(例如Toehold Switch),同時使用無細胞系統來產生或者支撐相應的生化反應過程[14]。
醫療健康現在可以說已經取代了代謝工程,成為合成生物學應用的絕大多數選擇,但這並沒有阻止代謝這一領域的發展。耀眼的學術成就包括工程細胞固定CO2和氮,工程酵母產生類阿片和大麻素。許多研究所已經建立了生物鑄造廠,證明了細胞的工程改造可以快速實現數十種不同分子的生物合成[15]。當然,利用合成生物學進行代謝工程的許多工作現在都在Amyris、Genomatica、Ginkgo和Zymergen等公司進行。
回顧十年,合成生物學的許多研究裡程碑和新研究方向的確令人印象深刻,但是作為合成生物學研究人員,智能技術的進步使我們最為興奮,因為這些技術可以推動該領域下一步的發展。但是,如果我們要尋找十年來最大的成就來證明該領域在2010年被炒作是合理的,那麼全球數百家合成生物學公司的發展和估值則可以證明。現在,一個價值數十億美元的行業立於我們眼前,該行業可以通過工程細胞生產化學藥品、生物藥物、蛋白質、益生菌,傳感器、肥料、紡織品、食品和許多其他東西。這些不是現有的大公司轉向了合成生物學方向,而是在大多數情況下在這一領域工作的博士後、博士和iGEM學生創立、領導和發展的公司。
特別鳴謝:We wish to thank everyone who engaged with a July 2020 Twitter conversation on the most important achievements in synthetic biology from the last 10 years which helped to shape this article. A link to this conversation is here:https://twitter.com/ProfTomEllis/ status/1280982288797446144.
參考文獻:
[1] Gibson, D. G. et al. Creation of a bacterial cell controlled by a chemically synthesized genome. Science 329, 52–56 (2010).
[2] Kwok, R. Five hard truths for synthetic biology. Nature 463, 288–290 (2010).
[3] Wang, B., Kitney, R. I., Joly, N. & Buck, M. Engineering modular and orthogonal genetic logic gates for robust digital-like synthetic biology. Nat. Commun. 2, 508 (2011).
[4] Nielsen, A. A. K. et al. Genetic circuit design automation. Science 352, aac7341 (2016).
[5] Lajoie, M. J. et al. Genomically recoded organisms expand biological functions. Science 342, 357–360 (2013).
[6] Qi, L. S. et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression. Cell 152, 1173–1183 (2013).
[7] Cambray, G., Guimaraes, J. C. & Arkin, A. P. Evaluation of 244,000 synthetic sequences reveals design principles to optimize translation in Escherichia coli. Nat. Biotechnol. 36, 1005–1015 (2018).
[8] Ng, A. H. et al. Modular and tunable biological feedback control using a de novo protein switch. Nature 572, 265–269 (2019).
[9] Karr, J. R. et al. A whole-cell computational model predicts phenotype from genotype. Cell 150, 389–401 (2012).
[10] Hutchison, C. A. 3rd et al. Design and synthesis of a minimal bacterial genome. Science 351, aad6253 (2016).
[11] Richardson, S. M. et al. Design of a synthetic yeast genome. Science 355, 1040–1044 (2017).
[12] Fredens, J. et al. Total synthesis of Escherichia coli with a recoded genome. Nature 569, 514–518 (2019).
[13] Pardee, K. et al. Paper-based synthetic gene networks. Cell 159, 940–954 (2014).
[14] Tinafar, A., Jaenes, K. & Pardee, K. Synthetic biology goes cell-free. BMC Biol 17, 64 (2019).
[15] Casini, A. et al. A pressure test to make 10 molecules in 90 days: external evaluation of methods to engineer biology. J. Am. Chem. Soc. 140, 4302–4316 (2018).
複雜科學最新論文