(本文由 Nautilus 授權轉載,撰文/Carl Zimmer,繪圖/Emiliano Ponzi)上世紀70年代那會兒,你早上打開一盒麥片,或許會掉出來一個硬紙板做的圓盤。這是個密碼盤,9~12歲的密碼師可以用它來編寫屬於自己的密碼。這種密碼盤由一大一小兩張圓盤組成,圓心處被釘在一起,可以繞著同一個軸轉。外面的盤上寫著字母,裡面的則畫有箭頭。如果把箭頭對準一個字母,裡面小盤上就會有打開一個小窗口,露出另外一個字母。你可以用這些字母組成一句話,外人(尤其是你的父母)看來則是天書。要弄清這句話說了什麼,唯一的方法是藉助另一盒麥片裡的密碼盤來破譯——當然,是同一品牌的另一盒麥片。
每次我在生物教科書上看見這個,都會想起那時候的密碼盤:
這裡畫的也是個轉盤,但並不是用來編寫「帶上變形金剛玩具到後院見我」這樣的口信。這個轉盤就在我們的身體裡、在我們30萬億個細胞裡,它令細胞能將儲存在DNA裡的指令翻譯為構成我們機體的物質。地球上的每一種生物體內都能找到幾乎一模一樣的密碼,可以說,這就是生命的密碼。
遺傳密碼不同於生物體特定的基因序列,後面這個概念大家可是要熟悉得多。例如大猩猩的基因組,它存儲在大猩猩的DNA裡,由一連串叫做鹼基的化學單元構成,鹼基就像書裡的字母。大猩猩的這本「書」裡一共有30.4億個「字母」組成的2.1萬個基因(單詞)。
為了將大猩猩的基因翻譯成相應的蛋白質——是蛋白質構成了大猩猩的身體並且行使各項身體機能——大猩猩的細胞遵循一套規則,這套規則就是遺傳密碼。基因序列是一本書,必須靠遺傳密碼解讀;沒有了遺傳密碼,就好像閱讀象形文字卻沒有羅塞塔石碑。
科學家在上世紀60年代的時候破譯了遺傳密碼,遺傳密碼和DNA的雙螺旋結構一起並稱現代生物學的兩大發現。掌握了遺傳密碼,科學家就能用新的基因製造生物體,從而開啟了生物技術的新時代。
半個世紀以後,遺傳密碼仍然令科學家為之著迷。他們持續爭論遺傳密碼是如何演化的、為什麼沒有出現很多種密碼。他們重編碼細胞,構建出自然中不存在的新蛋白質種類,並以此為基礎研發新的藥物。
這類研究不僅僅包括我們平常在新聞裡聽到的那些生物技術進展,比如測序基因或微調蛋白質功能,還延伸到更遠。它改變了DNA在生物學上的涵義。通過對生命進行重編碼,科學家最終可能製造出與過去40億年來在地球上生活的生物有著本質區別的新生物體——實驗室裡創生的異形生命。
一塌糊塗的謎團當克裡克和沃森在1953年發表DNA的結構時,可謂一舉解開了生命的眾多奧秘。前幾代的科學家一直不明白遺傳的化學機制,而DNA提供了一個精練的答案。DNA由兩條骨架組成,骨架上面排列著一系列的鹼基。DNA只用4種鹼基——縮記為A、C、G和T——製造生命全部的多樣性。鹼基的一種組合方式給了我們大猩猩,另一種則是向日葵。
雖然做出了這一重大發現,但克裡克和沃森完全不知道細胞是如何使用DNA構建蛋白質的。最難理解的一點是蛋白質的化學基礎和基因完全不同。DNA由鹼基構成,而蛋白質卻是由20種不同的胺基酸搭建成的長鏈構成。
俄羅斯籍科學家喬治·伽莫夫(George Gamow)看了沃森和克裡克的論文後,他立即意識到這個難題是一個密碼學問題。DNA裡含有一個由4個字母組成的消息。蛋白質也是序列,但這些序列由另一個字母表的20個字母組成。通過某種方式,這個4位數的系統存儲了製造我們體內所有蛋白質的信息,從肌肉到神經遞質再到消化酶。伽莫夫後來寫道,「於是問題就成了怎樣讓四位數的號碼轉換成這些『單詞』。」
伽莫夫像十年前破解納粹德國恩尼格瑪機的英國密碼破譯員那樣解決這個問題。他沒有進行生物實驗,而是依靠邏輯。在沒有確鑿證據的情況下,伽莫夫提出胺基酸掉進DNA分子的洞裡時形成了蛋白質。下面是伽莫夫的構想(圓圈代表纏繞DNA雙螺旋的鹼基,菱形則是用於形成胺基酸的孔):
伽莫夫提出,一種胺基酸只能通過某一種鹼基組合之間形成的孔。他算出DNA上的鹼基可以形成20種不同的孔,正好符合20種不同的胺基酸。這結果不可能是個巧合吧,伽莫夫表示。
雖然伽莫夫的答案乾淨漂亮,但它完全是錯誤的。科學家最終找出了正確的答案,可惜它繁冗得幾近笨拙:細胞先製作一條單鏈的複製基因,叫做信使RNA。被稱為核糖體的分子工廠拿過這條信使RNA,讀取其上的序列,再抓取細胞周圍游離的胺基酸,製造DNA指定的蛋白質。每製造一個胺基酸,核糖體要一次性讀取3個鹼基,這三個鹼基就被稱為一個密碼子。
再來看看遺傳密碼的轉盤。從內向外,這上面畫出了遺傳密碼中的所有密碼子。例如,GUA編碼纈氨酸。最令人意想不到的是,不止一個密碼子可以編碼相同的胺基酸。GUA可以編碼纈氨酸,GUC、GUG和GUU也能編碼纈氨酸。其他胺基酸或被3個密碼子編碼,或被2個密碼子編碼。只有少數胺基酸被單一的密碼子編碼。這離開伽莫夫設想的一一對應可是差遠了。真正的遺傳密碼看起來一塌糊塗。
要是我買了一個這樣轉的麥片密碼盤,絕對會寫信給商家要求退款。
一套密碼統領萬物為了破解遺傳密碼,科學家開始了對腸道細菌大腸桿菌的研究。他們之所以選擇研究這一特定的微生物,是因為前幾代的科學家已經研究過大腸桿菌,積累了大量剖析其生化機制的工具。在科學家解開大腸桿菌的遺傳密碼後,他們又立即開始研究其他的物種。一例接一例,科學家總是能夠找到完全相同的古怪系統。
自從發現遺傳密碼以來,科學家一直想知道為什麼我們最終得到的是這一普遍的鬆散遺傳方式。有的研究人員認為這表面上的鬆散實際上是耐用性的體現——自然選擇青睞這種遺傳密碼,因為它比之前的版本更有抗性。通過使用一個以上的密碼子對應一個胺基酸,生物體能保護自己不受有害突變的影響。
如果GUC突變成GUU,我們的細胞並不會切換成別的胺基酸,從而製造出有缺陷的蛋白質。細胞在兩種情況下都會選擇纈氨酸。在一項研究中,研究人員創建了大量隨機的遺傳代碼以衡量它們對突變的耐受度,並排列座次。真正的遺傳代碼排在所有可能代碼的最頂端0.000001%的地方。
但其他科學家不贊同這種百萬裡挑一的說法,他們認為我們這套遺傳密碼可能並無特別之處。1968年,克裡克提出了一個遺傳密碼的出現過程,他抒情地稱其為「凍結事故」。克裡克認為,最初的生命形態有著原始的、鬆散的遺傳密碼。細胞在破譯密碼子的時候經常會犯錯,抓取不同的胺基酸。由於早期生命形態的蛋白質分子小、結構簡單,它們可以湊合著使用這些不合格的產品。
隨著時間的推移,微生物出現了,它們的遺傳代碼更加精確,細胞誤讀特定密碼子的可能性也降低了。它們也開始使用更多的胺基酸,從而構建更複雜、具有更多功能的蛋白質。最終,克裡克論證,細胞變得非常複雜,擺弄遺傳密碼變成了非常危險的事情:一個突變就可能使細胞生產出數百種不同的有缺陷的蛋白質,引發災難性的故障。遺傳密碼的演化在尖利的剎車聲中停了下來。
還有的研究人員,比如伊利諾伊大學的奈傑爾·格登菲爾德(Nigel Goldenfeld),在他們看來遺傳密碼更像是一種語言,它令不同的物種得以使用相同的基因,就好比生物學的通用語。微生物有時會從其他物種那裡借來基因,而有時這些借來的基因會被證明是巨大的福音。例如,在我們的身體裡,耐藥菌可以將自己的基因捐獻給其他易受物種用以抵禦抗生素藥物。但能夠受益於借來基因的唯一方法是細胞可以解碼它們。
格登菲爾德認為,經過數百萬年, 生命的眾多遺傳密碼相互交流,實現了DNA裡的全球貿易,直到只留下單一的一個密碼。
密碼躲貓貓在發現通用遺傳密碼的幾十年後,科學家發現它並不是真正普適的。1992年,研究人員發現遺傳密碼規則的一個例外。而這起例外就在我們自己的細胞裡。
人類DNA的大部分都儲存在細胞核裡,但一小撮卻游離其外,存在於為細胞提供動力的線粒體之中。線粒體就像是我們細胞裡的微型細胞,有它們自己的核糖體解碼自己的基因。(其實線粒體有可能一開始是獨立的細胞,它們的祖先很可能是自由生活的細菌,在20億年前入侵了我們人體的細胞。)
在研究線粒體時,科學家偶然得出了一個驚人的發現:線粒體的遺傳密碼並非完全符合細胞核裡DNA的遺傳密碼。通常來說,UGA命令核糖體停止製造蛋白質並將蛋白質釋放出來。在人體的線粒體中,UGA不再是「終止密碼子」;在這裡,它解碼成為色氨酸。
從第一起例外發現以來,研究人員已經找出了34例遺傳密碼的變種。每一例變化都是對祖輩遺傳密碼演化修飾的結果。布朗大學的細胞生物學家肯·米勒(Ken Miller)將這些變種比作方言。「美式英語、加拿大英語和英式英語的拼寫和詞義差異反映出它們源於同一語言。DNA的通用語也正是如此。」
在已知的遺傳密碼變種中,幾乎每一種都有一個密碼子被重新分配,解碼20種標準胺基酸裡的另一種。但也有極少數的物種擴大了密碼,納入了從未被其他生命形態使用過的新的胺基酸種類。有的微生物將它們的一個密碼子換為解碼硒代半胱氨酸。有的則添加了吡咯賴氨酸。還有的將這兩種都加入進來。
這些遺傳方言給生物學家帶來了難題。這些具有變種遺傳密碼的物種彼此相隔甚遠,居住在生命樹枝椏的兩端。這意味著遺傳密碼在進化中被改變了一遍又一遍。
2009年,賓夕法尼亞州立大學的進化生物學家愛德華·霍爾姆斯(Edward Holmes)和他的同事發現了攜帶變種遺傳密碼的物種間的另一共同點,這可能是驅使變種遺傳密碼演化的原因。研究人員觀察了當時所有已知攜帶變種遺傳密碼的物種,發現沒有證據表明病毒可以感染它們。
霍爾姆斯等人提出,躲避病毒是驅使一些物種改變自己遺傳密碼的原因。雖然病毒可以使其宿主致命,但它們同時也依賴於宿主生存。病毒通常只有一個蛋白質外殼和裡面包裹的基因,沒有核糖體或其他製造蛋白質或基因所需的組件。為了繁殖,它們必須侵入細胞並誘使其讀出自己的基因。為了成功入侵宿主細胞,病毒必須使用與宿主相同的密碼。如果密碼不匹配,宿主細胞將產生有缺陷的病毒蛋白質,而新的病毒無法依靠其存活。
當一場致命的新病毒疫情爆發時,病毒有可能消滅大部分的宿主。攜帶變種遺傳密碼的宿主更有可能存活下來,因為病毒無法誘騙它們的細胞。這些突變宿主活了下來,重新建立種群。從那時起,由於體內的變種遺傳密碼,宿主物種對所有的病毒都免疫。
然而,今年早些時候,布法羅大學的科學家發現了首個感染攜帶變種遺傳密碼物種的病毒。它的宿主是一種將遺傳密碼CUG的編碼從亮氨酸改為絲氨酸的酵母。研究人員仔細研究了這種病毒的DNA,發現其中幾乎完全不含CUG密碼子。看來是在酵母改變了密碼後,病毒也改變了遺傳信息,從而避免亂碼出現。通過去掉CUG密碼子,病毒消除了產生故障的風險。不斷演化出變種的遺傳密碼是免受病毒侵害的好方法,但可能保證不了百分百免疫。有的病毒可能會搶先一步。
生命的新任編碼大師20世紀60年代對遺傳密碼的發現在50年後的今天仍然滲透到我們的日常生活裡。在科學家認識到人類和大腸桿菌使用相同的密碼破譯各自的基因以後,他們想知道微生物是否也能根據人類的DNA製造蛋白質。赫伯特·博耶(Herbert Boyer)和他的同事想出一種方法,從人類細胞中截取胰島素基因並將其插入到細菌的DNA裡。正如博耶等人希望的那樣,細菌開始產出胰島素。今天,數百萬的糖尿病患者注射進自己體內的都是細菌製造的胰島素。
科學家在利用遺傳密碼製造有價值的分子這件事上愈發得心應手。他們可以令山羊在分泌的乳汁中產出蜘蛛絲。他們可以調整基因產生新的蛋白質,製備針對特定病原體的特異抗體。所有這些壯舉都是因為有了生命的通用語才成為可能。
然而,遺傳密碼也限制了生物技術的創造力。它僅僅編碼20個胺基酸。自然界中還有成百上千的其他胺基酸(有的甚至存在於星際空間)從未被生命使用過。更重要的是,科學家可以合成幾乎無限多種的非天然胺基酸。如果科學家能夠對遺傳密碼進行重編程,將這些其他胺基酸納入生命的體系,將會開啟控制生命的無限可能。
大自然已經修改過遺傳密碼的事實給了研究人員試圖對其做出更多修改的信心。他們在21世紀初進行了第一次嘗試。2002年,斯克裡普斯研究所的化學家彼得·舒爾茨(Peter Schultz)和他的同事創造出感光的蛋白質。
舒爾茨等人將一個普通的胺基酸(苯丙氨酸)和一種叫做二苯甲酮的光敏化合物相結合從而實現了這一壯舉。二苯甲酮被紫外光照射後會獲得一定能量並與鄰近的蛋白質結合。舒爾茨他們改變了細胞的分子,將原來讀作終止密碼子的UGA改為讀出新的攜帶二苯甲酮的胺基酸。
接下來他們將改造的基因片段插入大腸桿菌,令大腸桿菌製造蛋白質而後採集做樣本。當研究人員用紫外線照射這些蛋白質時,其中一些連在一起,這都要歸功於二苯甲酮形成的化學鍵。改造細菌製造出了此前從未有生物體製造出的分子。
在這類實驗的基礎上,舒爾茨後來參與成立了一家名為Ambryx的公司。2012年,Ambryx與製藥巨頭默克公司(Merck)籤署了一份3.03億美元的合約,通過改變遺傳密碼探索新的製藥途徑。
在一個典型項目裡,Ambryx的研究人員正在努力開發像制導飛彈那樣對抗腫瘤的抗癌分子。他們希望改善一類現有的藥物,這類藥物由單克隆抗體這種蛋白質製成。這些抗體被製造成只攻擊已經變成癌的細胞。標準的單克隆抗體與癌細胞結合,從而令它們更容易被免疫細胞發現,然後殺死它們。
Ambryx研究人員正在研究如何令抗體動手剿滅癌細胞。他們正在構想攜帶毒素的非天然胺基酸,同時改造細菌,使其在製造抗體時會使用這些有毒的胺基酸。他們希望一旦這些非天然的抗體附著於癌細胞後,攜帶的毒素會立即殺死癌細胞。
就目前而言,拓展遺傳密碼只是一項有前景的技術,而不是救贖。默克公司沒有一箱箱製造癌症藥物的大腸桿菌。沒有人知道細菌製造這些非天然蛋白質的效率有多少。
更極端地改變遺傳密碼可能最後會帶來更大的成功。耶魯大學的生化學家法倫·艾薩克斯(Farren Isaacs)和他的同事正在運作這樣一個雄心勃勃的項目。他們想改變不是一個而是幾十個密碼子。如果成功了,他們可能會製造出嶄新的蛋白質。他們重編碼出的微生物將完全不同於如今活著的生物,或許不同於任何曾在地球上出現過的東西。
艾薩克斯想利用遺傳密碼中大量冗餘密碼子這批資源。他想重寫生物體的DNA,使原本編碼精氨酸的4個不同的密碼子只留下一個編碼精氨酸,這樣就騰出3個密碼子,可以用來重編碼製造非天然胺基酸。標準的遺傳密碼中有44個冗餘密碼子,艾薩克的策略可能開闢廣闊的生物新可能。
在《科學》10月初發表的一項研究中,薩克斯和他的同事踏出了走上這條道路的第一步。他們使用新的基因編輯工具搜索大腸桿菌基因組中每一處含有UAG序列的終止密碼子:結果一共找到了314處 。薩克斯等人將這314處的UAG序列替換成另一終止密碼子UAA序列。細菌在不含冗餘密碼子的情況下運轉一切正常。
這個實驗標誌著研究人員第一次改變了生物體基因組中的單一密碼子。現在UAG被騰了出來,可以用於編碼新的胺基酸,科學家因此得以將TAG密碼子加到許多不同的基因當中。如果這種方法起效了,或許能用到其他的冗餘密碼子上面。
以這種方式重寫遺傳密碼不僅可以讓科學家創造新型分子。如今,生物技術操作受病毒所限,因為病毒會殺死科學家用來產生新分子的微生物。薩克斯重編碼的微生物可能被製造成對病毒免疫。
一種新的遺傳密碼也可能消除改造微生物逃出實驗室到外面肆虐的風險。科學家可以改造微生物,令它們依賴於非天然胺基酸生存。如果它們逃出實驗室,只能找到天然胺基酸,就只能死亡。換句話說,這些改造物種會淪為我們密碼的奴隸,從根本上與我們這個星球上的其他生物和天然密碼隔絕開來。
現在對轉基因食品的爭論主要受我們突然開始以危險方法篡改DNA這一概念的煽動。事實上,幾千年來,從我們馴化作物和牲畜開始,我們就一直在擺弄DNA。水果玉米的基因與其有著堅硬種子的祖先相去甚遠。近幾十年來,生物技術使我們能夠更好地將一個物種的基因移進另一個物種,科學家甚至開始編輯DNA的單個鹼基從而微調基因。
儘管攜帶人胰島素基因的細菌可能看起來很怪,不過它仍然使用的是生命幾十億年來賴以生存的古老密碼。現在,我們或許正處在一個全新時代的邊緣——在那裡,是我們而非自然演化駕馭生命的密碼。
本文作者卡爾·齊默(Carl Zimmer)是《紐約時報》專欄作家,著有《病毒的星球》(A Planet of Viruses)等多部科普著作。