圖1 通用的密碼子表
事實上,在原核生物中,除了AUG外,GUG和UUG也可以作為起始密碼子。以大腸桿菌為例,其基因組上使用AUG作為起始密碼子的約佔77%,以GUG為起始密碼子的約佔14%,以UUG為起始密碼子的約佔8%。當然還有更離譜的,如CUG。那麼當GUG和UUG等作為起始密碼子的時候,究竟編碼什麼胺基酸呢?是編碼密碼子表上(圖1)所示的胺基酸,如GUG是纈氨酸(Val,V),UUG是亮氨酸(Leu,L),還是與AUG一樣編碼甲硫氨酸呢?
對於上述問題,就我所知,很多人想當然的會認為,肯定是遺傳密碼子表所示的胺基酸。殊不知,不管是哪一種密碼子作為起始密碼子,生物都會用統一的起始tRNA對其解碼,而起始tRNA總是攜帶甲硫氨酸,因此都編碼甲硫氨酸。當然,原核生物的中的細菌起始tRNA在攜帶甲硫氨酸以後,甲硫氨酸還要甲醯化修飾,故由起始密碼子編碼的是甲醯甲硫氨酸。記得在新版高中教材審定的時候,我建議在必修2(遺傳與進化)這一冊將密碼子的地方,加上了相關的備註,以防老師在教學過程中講錯(圖2)。這裡有兩個沒有以AUG作為起始密碼子的重要例子:一個是大腸桿菌乳糖(lac)操縱子編碼阻遏蛋白的lacI基因,另一個是編碼轉乙醯酶lacA基因。它們分別以GUG和UUG作為起始密碼子。那麼為什麼這些蛋白質基因在進化的過程中,起始密碼子沒有選擇AUG呢?
對於這個問題,如果你知道控制一個基因轉錄起始的啟動子有強有弱,而這可以用來作為控制基因產物量的一種方式,那麼你同樣可以理解選擇AUG作為起始密碼子和不用AUG作為起始密碼子,也可以控制不同蛋白質翻譯的量。對於細胞大量需要的蛋白質,用強啟動子來啟動轉錄更合適,因為這樣可以轉錄出更多的mRNA,反之,對於細胞少量需要的蛋白質,用弱啟動子更合適。按照這樣的思路,細胞大量需要的蛋白質使用AUG作為起始密碼子更合適,因為它更容易被起始tRNA上的反密碼子(CAU)識別,因此AUG可視為「強起始密碼子」,而細胞少量需要的蛋白質不用AUG作為起始密碼子更合適,因為它不容易被起始tRNA上的反密碼子識別,因此AUG以外的起始密碼子可視為「弱起始密碼子」。那麼對於那些不用AUG作為起始密碼子的蛋白質來說,如果強行將它們的起始密碼子改造成AUG的話,它們還能正常翻譯嗎?
對於此問題,要看改造成AUG以後還能不能被起始tRNA識別!顯然是可以被識別的,而且會變得更容易識別。因此,對於起始密碼子改造成AUG的蛋白質來說,不僅照樣翻譯,而且翻譯的效率會增加!因為它們原來先天不足的「弱起始密碼子」變成了「強起始密碼子」!
以上所說的起始密碼子的例外是針對原核生物的,那麼真核生物有任何例外嗎?
事實上,真核生物的線粒體翻譯系統就有例外,例如人類線粒體翻譯系統使用AUA和AUU作為起始密碼子,當然它們由線粒體內的起始tRNA對其解碼,編碼的也是甲醯甲硫氨酸。除此之外,還有什麼其他例外嗎?
我的回答是有的!而且這個例外更加不可思議。事實上早在2012年6月,Science上有一篇題為「Leucine-tRNA Initiates at CUG Start Codons for Protein Synthesis and Presentation by MHC Class I」的研究論文。該論文報導:哺乳動物體通過細胞毒性T細胞進行有效的免疫監視,需要新合成的多肽才能通過主要的組織相容性複合體(MHC)I類分子呈遞。而這些多肽不僅通過常規的AUG起始,而且還可以通過隱秘的CUG起始翻譯。但如果使用CUG作為起始密碼子,細胞會在起始因子2A(eIF2A)的幫助下使用亮氨醯tRNA(Leu-tRNA)來啟動CUG起始密碼子的翻譯,而不是起始tRNA,這樣翻譯出來的就是密碼子表所示的亮氨酸。
沒想到有關起始密碼子會有這麼多的例外,我相信將來科學家還會發現更多的例外!