1953年,沃森和克裡克提出DNA上的鹼基序列編碼蛋白質的胺基酸序列。那麼,具體是怎麼編碼的呢?1954年,物理學家喬治·加莫夫(George Gamow)提出了三聯體密碼的假設,從數學角度解決了這個生物學問題。
加莫夫(1904-1968)是理論物理大牛,出生於俄羅斯,後來移居美國。他是宇宙大爆炸理論的主要提出者(有興趣的同學可以搜索「αβγ理論」),還提出了原子核的液滴模型,放射性的量子理論等等。之所以未能獲得諾獎,只是因為他沒能活到2019年(19年獲獎的皮布爾斯主要貢獻就是對大爆炸理論的發展)。
喬治·加莫夫。引自科羅拉多大學博爾德分校網站
加莫夫是科羅拉多大學博爾德分校的物理學教授,但也有人說三聯體密碼的提出者是科普作家,其實也沒錯。他一直致力於科普相對論和宇宙論等,代表作有《湯普金斯先生系列》、《宇宙的創造》、《從一到無窮大》等。個人感覺,後者非常符合他的研究對象的尺度。
加莫夫的推理很簡單。核苷酸有4種,兩個核苷酸只有16種組合,不夠編碼所有胺基酸。3個核苷酸有64種組合,編碼20種胺基酸還有剩餘。4個核苷酸的組合是256種,太浪費了。
克裡克用噬菌體證實了加莫夫的假說。他發現在噬菌體的基因中增加一個或兩個鹼基都會蛋白產物異常,而增加三個鹼基卻影響很小。這同時也提示了遺傳密碼的連續性(commaless)。
遺傳密碼的破譯主要歸功於尼倫伯格(Marshall W. Nirenberg)。他用大腸桿菌提取液建立了體外翻譯系統,以多聚U為模板,發現只能翻譯出多聚苯丙氨酸,表明UUU編碼Phe。
在這個工作的啟示下,很快通過不同的模板組合測定出了全部的遺傳密碼。在此過程中,從印度移居美國的生化學家霍拉那(Har Gobind Khorana)的工作最為重要,所以他倆與首先分離出tRNA的化學家羅伯特·霍利(Robert W. Holley)分享了1968年諾貝爾生理學獎。
遺傳密碼研究獲得1968年諾獎。引自諾貝爾基金會
加莫夫的數學分析也提示了遺傳密碼的簡併性(degeneracy),即多數胺基酸有幾個不同的密碼子,稱為同義密碼子。遺傳密碼的破譯證實了這一點。在遺傳密碼字典中,只有含量較低的色氨酸和甲硫氨酸屬於單密碼子。
遺傳密碼字典。引自百度圖片
密碼子的簡併性可減少有害突變。如果多餘的密碼子不編碼胺基酸,相應的突變就會導致肽鏈終止。而在有簡併的情況下,就只會產生一個胺基酸的點突變,不會中斷肽鏈而造成嚴重後果。
簡併性也使DNA的鹼基組成有較大的變化餘地,在物種的穩定性上起一定作用。通過同義密碼子的替換,可以在不影響胺基酸序列的情況下改變核酸序列。此類突變稱為同義突變。
需要注意的是,同義密碼子之間也是有區別的,不同密碼子的使用頻率可能不同,所對應的mRNA二級結構、加工修飾,以及翻譯速度等都可能有差異。所以同義突變也可能產生不同表型。
密碼子通過翻譯速度影響新生肽鏈摺疊。Nat Rev Mol Cell Biol. 2018 Jan; 19(1): 20–30.
生物對同義密碼子的偏好也會不同,例如在精氨酸的四個密碼子中,古細菌優先使用AGG和AGA,而細菌優先使用CGC和CGU,而真核生物介於二者之間(Mol Biol Evol. 2019)。在原核生物中表達真核基因,就需要選擇其常用的密碼子,稱為密碼子優化(codon optimization)。
地球上各種生物的遺傳密碼字典基本都是相同的,這稱為密碼子的通用性(universal)。通用性表明這些生物有共同的起源。一個經常被提到的例外是線粒體,如人線粒體中UGA編碼色氨酸,AUA編碼甲硫氨酸(在基因組中編碼異亮氨酸)。有人認為線粒體在進化上更古老,它處於遺傳密碼的早期形式。
其實,現已發現多種生物的核遺傳密碼發生改變,包括支原體、纖毛蟲、草履蟲、四膜蟲、綠藻、假絲酵母等。所以遺傳密碼並非完全「凍結」,而是可以進化的。目前有不同理論分析密碼子進化機制,如密碼子捕獲(codon capture)理論等(Proc Jpn Acad Ser B Phys Biol Sci. 2008)。
密碼子(紅)與反密碼子(黃)的配對。引自PDB-101
密碼子的擺動性(wobble)是指其第三位的配對不嚴格,可以有一些非標準鹼基對。例如,反密碼子上的I可與U、A、C配對,G可與U配對。
擺動性的結構基礎已經由結構生物學研究闡明。下圖a-c是Phe密碼子UUU與其反密碼子GAA的三個鹼基對。前兩對都與16 S rRNA形成了氫鍵,監視配對是否正確,而第三位則缺乏監視機制。d和e顯示了非標準的G-U配對情況,f為解碼中心的整體環境。
核糖體結構與密碼子的擺動性。Annu Rev Biochem. 2005;74:129-77.
因為對核糖體結構的研究,Ramakrishnan和Thomas A. Steitz、Ada E. Yonath分享了2009年諾貝爾化學獎。核糖體對生命科學的意義不言而喻,一直因為其巨大、複雜和穩定性差而無法測定精細結構。三人的工作將為翻譯機制的深入研究奠定基礎。
參考文獻:
1. 大英百科全書,喬治·加莫夫詞條。https://www.britannica.com/biography/George-Gamow
2. Gavin Hanson, Jeff Coller. Codon optimality, bias and usage in translation and mRNA decay. Nat Rev Mol Cell Biol. 2018 Jan; 19(1): 20–30.
3. Novoa EM, Jungreis I, et al. Elucidation of Codon Usage Signatures across the Domains of Life. Mol Biol Evol. 2019 Oct 1;36(10):2328-2339.
4. James M Ogle, V Ramakrishnan. Structural Insights Into Translational Fidelity. Annu Rev Biochem. 2005;74:129-77.
5. 陳惟昌等。線粒體遺傳密碼及基因組遺傳密碼的對稱分析。生物物理學報,2002,18(1):87
6. Ohama T, Inagaki Y, et al. Evolving genetic code. Proc Jpn Acad Ser B Phys Biol Sci. 2008 Feb; 84(2): 58–74.