我們也許都經歷過這樣的場景:在一臺計算機上寫好的文件,在另一臺計算機上打開後,卻發現好好的文本變成了一堆難以識別的亂碼。這大多是由於選錯了編碼所致。
事實上,有序的文本和無序的亂碼,它們在計算機看來是一樣的——都是一串0和1構成的代碼。唯一不同的是,不同的編碼系統,決定了計算機如何判讀這串0-1代碼,從而造成了「文本」和「亂碼」的區別。
和計算機系統類似,生命本身也有一套編碼系統,這就是我們所熟知的核酸到蛋白質的三聯體密碼系統——核酸上每三個鹼基可以決定一個胺基酸。這套密碼系統能通過「翻譯」(Translation)將mRNA上的遺傳密碼轉換成多肽,隨後加工為有功能的蛋白質在幾乎所有的生物體中,這種編碼的對應關係是一樣的。這種通用的編碼系統構成了生物工程得以實現的基石,使人類能夠用大腸桿菌生產人的胰島素,或是在菸草中合成對抗伊波拉病毒的抗體。
然而,正是「生命編碼」的通用性,讓不少人對生物工程的安全性產生了懷疑。儘管目前在研發和生產上有著極為嚴格的管理措施,人們還是擔心一旦這些人工改造過的生物體釋放到環境中,它們的基因會被野生個體獲得,或是獲得野生個體的基因,從而造成生態問題.?? 在1月21日的《自然》雜誌中,來自哈佛大學的喬治·丘奇(George Church)教授,以及來自耶魯大學的法倫·艾薩克斯(Farren Isaacs)教授分別發表了各自的研究。他們從根本上杜絕了這種生態問題產生的可能,而他們採用的方法就是:改變人造生物體最為基礎的編碼系統,使「通用」的編碼變得並不「通用」。
通過使這些「基因組重編碼生物」的生存依賴於自然界中所沒有的、需要人工合成的胺基酸,人們得以錦上添花地構建更安全的基因工程生物。圖片來源: Spencer Katz
被改變的編碼
人們已經知道,三聯密碼子一共有64種組合可能,而這64種組合,只對應20種胺基酸和一個「停止」信號,因此這造成了「多個組合對應一個編碼」的所謂「冗餘性」現象。例如,UAA、UAG、UGA三個密碼子,都能表示「翻譯停止」的意思。因此這種編碼的冗餘性給了「重編碼」以操作的空間。
早在2013年,丘奇和艾薩克斯所領導的團隊就改變了大腸桿菌的編碼系統。在2013年的工作中,研究團隊掃描了整個大腸桿菌的基因組,並通過多重自動基因組編輯(Multiplex automated genome engineering ,MAGE)手段,將所基因組上所有TAG密碼子改為了TAA(DNA中的T對應RNA中的U),並且刪除了原本能夠識別UAG密碼子的轉錄終止蛋白(釋放因子1,RF1)。同時,研究團隊又給改造過的大腸桿菌中引入了新的氨基醯-tRNA合成系統,從而賦予UAG密碼子編碼一種非天然胺基酸的能力。這樣一來,在這新的大腸桿菌菌株之中,如果遇到UAG密碼子,將會在肽鏈中引入非天然胺基酸,而非像在普通大腸桿菌中那樣終止翻譯。
這一工作是人類第一次人工改變生物最為基礎的編碼系統,相當於在計算機行業中重新定義了通行的Unicode編碼系統——儘管只是改變了一個編碼,就足以造成兼容性的降低。
基因工程生物體的「終極保險」
由於改變編碼能夠降低生物間的「兼容性」,研究者很快意識到,如果在將一些關鍵基因進行類似的改造,那麼可以將這種「兼容性」降低為接近0。經過改造的生物體,即使到環境中,也因為「編碼」的不同而不能生存。
丘奇團隊在經過編碼改造後大腸桿菌中挑選了6個基因,這些基因編碼對細菌生存起重要作用的蛋白質。他們對這些基因進行了仔細的設計,使得引入了非天然胺基酸的蛋白質產物能夠完全替代原有蛋白質的功能。最終,研究團隊獲得了含有1-3個基因改造的大腸桿菌菌株,它們只能在人工添加特定的非天然胺基酸後才能生存。
粗看起來,這似乎類似於目前採用的防止基因工程生物體擴散的手段,即「營養缺陷」。所謂營養缺陷,指的是該生物體具有特定的代謝缺陷,需要人為添加必要的營養成分才能生存。然而,通常的營養缺陷限制手段可以被幾種方式所突破,即發生「逃逸」。例如,生物體可以通過在環境中獲取營養成分、突變恢復代謝缺陷,或者通過橫向基因轉移(Horizontal gene transfer,HGT)來獲得必要的代謝能力。
在《侏羅紀公園》裡,復現的恐龍代需要人們在食物中特別添加一種胺基酸維持生存,以保證恐龍逃出去之後不能存活。丘奇的辦法比《侏羅紀公園》的辦法更加可靠。圖片來源:xkcd,Ent編譯
但在丘奇的研究中,這些途徑都能被有效阻斷。首先,研究者使用的非天然胺基酸——在自然界中壓根就不存在,基因工程生物體無法獲得。其次,突變無法為細菌帶來合成非天然胺基酸的通路;而由於非天然氨酸位於關鍵蛋白內,突變也幾乎不可能恢復對蛋白胺基酸缺失的耐受性。最後,對於橫向基因轉移來說,DNA片段的交換會轉移進以UAG為終止密碼子的普通基因,但由於RF1缺失,蛋白質合成不能正常終止。此外,即便連編碼RF1的基因也被轉移進來,該基因所表達的RF1也會和識別UAG密碼子的tRNA競爭,同樣影響蛋白質的合成。
事實上,丘奇團隊研究過改造後的大腸桿菌在不同環境下逃逸的概率。結果表明,在對3個重要基因進行改造後,大腸桿菌的逃逸概率處於10-12到「未檢測到」的水平,換句話說,每一萬億個大腸桿菌之中,只可能出現一個能繞過所有限制條件而逃逸——這是目前美國國家衛生研究院(National Institutes of Health,NIH)所建議限制的微生物逃逸概率的一萬分之一。艾薩克斯的團隊採取了類似的另一套方案,也獲得了類似的結論。可以說,這一新的方法,為基因工程生物體在環境釋放環節上的安全性打上了「終極保險」。
豈止於安全
事實上,針對人工改造生物的安全性而言,目前所採取的措施對於現有生產生活已經足夠安全。丘奇和艾薩克斯所做的工作,可以說是錦上添花。這種技術不但能夠應用於避免工程菌的在環境中不可預期的擴散,在其他方面其實還有著更為重要的作用。
在諸如製藥等涉及工程菌發酵的產業中,噬菌體汙染通常會使得工程菌大量死亡,造成極為慘重的損失。通過改變編碼技術,可以讓病毒自身的核酸在細菌體內無法得到表達,從而形成對噬菌體的抗性。這極大降低了生產風險和損失。
此外,對生物體進行「重編碼」的技術,也使人們有能力將原本自然中不存在的胺基酸「摻入」蛋白質之中,從而生成全新的蛋白質。這類全新的蛋白質可能作為新的藥物、催化物等功能性物質,從而在人類健康、工業發展等方面做出新的貢獻。
而更為重要的是,這種技術拓展了人們對生命基本過程的認識和理解。這種深化的認識和理解,將大大推動生命科學的發展和應用。正如同計算機編碼系統的演變標誌著計算機技術的發展一樣,「生命編碼」的演變也必將引導生命科學和技術的飛躍。(編輯:Calo)
參考文獻:Marc J. Lajoie et.al.,Genomically Recoded Organisms Expand Biological Functions,Science,2013,342(6156),357 Daniel J.Mandell et.al.,Biocontainment of genetically modified organisms by synthetic protein design,Nature,2015 Alexis J. Rovner et.al.,Recoded organisms engineered to depend on synthetic amino acids,Nature,2015文章題圖:Spencer Katz