從1953年提出遺傳密碼到1966年破譯全部遺傳密碼,期間反覆經歷了抽象的理論分析和巧妙的實驗驗證,很值得我們總結和學習。大體過程如下:
①通過簡單的排列組合推測遺傳密碼是三聯體→②遺傳密碼的閱讀方式如何(重疊讀碼還是非重疊讀碼)→③克裡克通過T4噬菌體突變實驗證實了遺傳密碼是三聯體並採用非重疊的讀碼方式→④遺傳密碼與胺基酸如何對應→⑤尼倫伯格和馬太通過體外無細胞體系合成蛋白質的實驗破譯了UUU編碼苯丙氨酸→⑥AAA和CCC也隨之被破譯→⑦通過異聚核苷酸作為mRNA的體外合成蛋白實驗,找出了各種胺基酸密碼子的大體範圍,並證實了密碼子的簡併性→⑧通過特定的三核苷酸能促進特定的氨醯-tRNA與核糖體結合的重大發現而破譯了61種編碼胺基酸的密碼子→⑨通過對琥珀和赭石突變的回覆突變實驗,破譯了UAG和UAA這兩個終止密碼→⑩通過已經破譯的63種遺傳密碼發現了遺傳密碼的規律,間接證明了UGA是第三個終止密碼子,稱為蛋白石密碼子。
【三聯體密碼的提出】
1953年沃森和克裡克發現了DNA雙螺旋結構後,很多科學家們把目光聚焦在蘊藏在四種鹼基的遺傳信息上。1954年,美籍俄裔科普作家伽莫夫應用排列組合計算來研究遺傳密碼,並在《自然Nature》雜誌首次發表了文章,指出三個鹼基編碼一個胺基酸的三聯體假說。我愛讀三字經。
【提出問題】
三聯體中的每個鹼基作為信息只讀一次還是重複閱讀呢?
【實驗證據】
克裡克用T4噬菌體做了如下實驗
1、思路:T4噬菌體野生型能在大腸桿菌K菌株上生長,形成嗜菌斑。用藥物處理T4噬菌體,研究某個基因鹼基發生增加或缺失對其所編碼的蛋白質影響。
2、結果:
a.缺失一個核苷酸時,在K菌株上不生長
插入一個核苷酸時,在K菌株上不生長
b.缺失兩個核苷酸時,在K菌株上不生長
插入兩個核苷酸時,在K菌株上不生長
c.缺失三個核苷酸時,在K菌株上生長(擬野生型)
插入三個核苷酸時,在K菌株上生長(擬野生型)
3、結論:
a.遺傳密碼中3個鹼基編碼一個胺基酸。
b.遺傳密碼從一個固定的起點開始,以非重讀的方式閱讀,編碼之間沒有分隔符。
1961年12月30日克裡克等人在自然雜質上發表題為蛋白質遺傳密碼的一般性質。但是
克裡克實驗無法說明一個密碼子對應的究竟是哪個胺基酸。
[遺傳密碼對應規則的發現]
尼倫柏格和馬太的實驗
1、實驗過程
2、實驗結果
加入了苯丙氨酸的試管中出現了多聚苯丙氨酸的肽鏈。
3、實驗結論
多聚U導致了多聚苯丙氨酸的合成,而多聚尿嘧啶的鹼基序列是由多個尿嘧啶組成(UUUUUU······),可見尿嘧啶的鹼基序列編碼由苯丙氨酸組成的肽鏈;即苯丙氨酸對應的密碼子是UUU。
1961年夏天在莫斯科召開的第五屆國際生物化學大會上,尼倫伯格宣讀了他們的研究成果。當時,沃森沒有參加,但是當他聽到這個消息後,大吃一驚,立刻投入到實驗中,實驗結果證實了尼倫博格提出的實驗方案確實可行。這可能是一個開創性的實驗,後來的歷史證實了這一點,科學家們沿著體外合成蛋白質的實驗思路,不斷改進實驗方法,最終破譯了所有遺傳密碼。
【同聚核苷酸密碼子的破譯】
同聚核苷酸,就是由同一種核苷酸聚合而成,有多聚U(polyU)、多聚A(polyA)、多聚C(polyC)和多聚G(polyG)四種。
1、第一個遺傳密碼的破譯
尼倫伯格和馬太利用體外無細胞體系中合成蛋白質的方法,成功的破譯了第一個遺傳密碼,及UUU編碼苯丙氨酸。圖解如下。
值得注意的是,細胞中合成蛋白質是從一個特定的起始位點,即起始密碼(AUG)開始的,而上述實驗中並沒有起始密碼AUG,核糖體如何起始翻譯呢?經過後來研究發現,由於體外的無細胞體系中加入了大量的鎂離子,使得核糖體可以從多核苷酸鏈(mRNA)的任意部位起始翻譯,而細胞中由於鎂離子濃度低,必須從裝配起始複合物,從起始密碼處起始翻譯,這也是細胞的聰明之處。
2、AAA和CCC密碼子的破譯
有了尼倫伯格他們開創新性的實驗,只要把實驗中的polyU換成pPolyA或polyC就可以破譯出AAA或CCC所對應的胺基酸了。經過實驗發現polyA能促使賴氨酸(Lys)形成多聚賴氨酸(poly-Lys),而polyC能促使脯氨酸(Pro)形成多聚脯氨酸(poly-Pro)。因此,AAA編碼的是賴氨酸,CCC編碼的是脯氨酸。
那麼GGG編碼什麼胺基酸呢?在上述實驗中加入polyG不就能破譯出來了嗎?可惜的是,在體外的細胞提取液中每條polyG之間會形成較強的氫鍵而結合成三條鏈的三股螺旋,這樣polyG就不能與核糖體結合了,因此,GGG編碼的胺基酸不能通過這種方法被破譯。那麼最終通過什麼方法被破譯的呢?往後看就明白了。
【異聚核苷酸密碼子的破譯】
異聚核苷酸,就是由不同種核苷酸聚合而成核苷酸鏈。
1、多聚二核苷酸
所謂多聚二核苷酸就是由兩種核苷酸形成的核苷酸鏈。
①兩種核苷酸交替排列的核苷酸鏈
如:UAUAUAUAUAUAUAUUA...... 表示為poly(UA)n。這樣就會出現兩種密碼子交替出現情況,即UAU和AUA交替出現,那麼形成的多肽鏈中也會交替出現兩種胺基酸。事實確實如此,實驗中得到了酪氨酸和賴氨酸交替出現的多肽鏈。但是由於體外合成蛋白質時,是從多聚核苷酸的任意位點起始的,因此,不清楚UAU對應酪氨酸還是賴氨酸,同樣的AUA對應酪氨酸還是賴氨酸。
②兩種核苷酸隨機排列的核苷酸鏈
就是把兩種核苷酸混合讓其隨機結合形成一條多聚核苷酸。例如把U和A兩種核苷酸混合,在形成多核苷酸鏈上就會出現8種密碼子:UUU、UUA、AUU、UAU、AAU、UAA、AUA和AAA。其中,UUA、AUU和UAU可歸為一類,就是2個U和1個A,而AAU、UAA和AUA歸為一類,就是2個A和1個U。(怕大家看著累,換到下一段,下一段與上面這段聯繫很大。)
那麼上面那條隨機的多核苷酸鏈如何密碼子對應的胺基酸呢?聰明的科學家們想出了一個聰明的辦法。舉例如下:如果把U和A的量按照5:1來進行混合,那麼多聚核苷酸鏈中出現UUU的概率就是5/6×5/6×5/6,而出現UUA或AUU或UAU(即兩個U和1個A)的概率是5/6×5/6×1/6,而出現AAU或UAA或AUA(即兩個A和1個U)的概率是1/6×1/6×5/6。這樣的話,多核苷酸鏈中UUU:UUA(或AUU或UAU)=5:1,而UUU:AAU(或UAA或AUA)=25:1。我們已知UUU對應的是苯丙氨酸,那麼由這條polyUA合成出來的多肽鏈中苯丙氨酸:某種氨酸X的量接近5:1的話,那麼胺基酸X的密碼子就是含有2個U和1個A(即UUA、AUU和UAU),但是不能確定胺基酸X的密碼子具體是哪一種,但是也縮小了範圍。同樣的由這條polyUA合成出來的多肽鏈中苯丙氨酸:某種氨酸Y的量接近25:1的話,那麼胺基酸Y的密碼子就是含有2個A和1個U(即AAU、UAA和AUA),但是也不能確定胺基酸Y的密碼子具體是哪一種。
利用以上方法還可以做polyUC、polyUG、polyAC......的實驗,但是這只能鎖定很多胺基酸密碼子的範圍,但是不能確定胺基酸的具體密碼子。
2、多聚三核苷酸
所謂多聚三核苷酸就是由三個核苷酸作為一個重複單位的核苷酸鏈,如:polyAAG,由於體外無細胞體系中合成蛋白質是從mRNA的任意起點開始合成蛋白質,因此,polyAAG,就有可能是AAG的重複讀碼,也可能是AGA的重複讀碼,還可能是GAA的重複讀碼。也就是說polyAAG會合成由一種胺基酸組成的三種多肽鏈。但是通過實驗測定只合成了多聚賴氨酸和多聚穀氨酸,這就證明了密碼子簡併性的存在,但是仍然不清楚穀氨酸和賴氨酸對應的具體密碼,只知道它們的密碼子是AAG、AGA和GAA三個中的其中一個或兩個。
以上無論是多聚二核苷酸還是多聚三核苷酸實驗,都沒有找出胺基酸對應的具體密碼子,只是找出了胺基酸對應密碼子的範圍,同時也證明了密碼子簡併性的存在。
【密碼子的最終破譯】
1963年巴基斯坦裔美籍生化學家科拉納的重大發現,使得遺傳密碼被最終破譯。
科學家們發現某種特定的三核苷酸(注意不是三核苷酸多聚體,而是只由三個核苷酸組成核苷酸鏈)能促進某種特定氨醯-tRNA(氨醯-tRNA就是tRNA與某種特定的胺基酸結合的產物)與核糖體結合,科學家認為這個三核苷酸就是這種胺基酸的密碼子。這樣科學家們就能通過密碼子找出對應的胺基酸了,再也不用通過胺基酸找密碼子了。我們知道,通過胺基酸找密碼子只能找出個大致範圍。現在,通過密碼子找對應胺基酸,就直接破譯了遺傳密碼。
於是,聰明科學家們設計了一個巧妙的實驗,就是一種硝酸纖維素濾膜,這種濾膜能結合核糖體。如在體外無細胞體系中加入某種三核苷酸,再加入各種胺基酸,其中某種胺基酸就會在三核苷酸的促進下與核糖體結合,而其他胺基酸就不會與核糖體結合,讓這些無細胞體系的混合物通過硝酸纖維素濾膜,那些沒有與核糖體結合的胺基酸就通過濾膜漏掉了,而與核糖體結合的胺基酸就留在了濾膜上,這樣就相當於抓住了那種核苷酸編碼的胺基酸了。再通過上面的多聚核苷酸實驗確定的胺基酸密碼子的範圍,科學家們驗證了這個方法是可靠的。這樣編碼胺基酸密碼子都被破譯了,那個GGG的密碼自然也就被破譯了。
但是,科學家們只破譯出了61種密碼子,三聯體密碼應該有64種,還有三種找不到對應的胺基酸。現在,我們當然知道那三種是終止密碼,但是,當時科學家們並不知道,那麼終止密碼是如何破譯的呢?當終止密碼破譯後,密碼子表中又蘊含著怎樣的規律呢?
【終止密碼存在的推測】
證據1:1964年科學家們在研究大腸桿菌的色氨酸合成酶時發現一個現象。色氨酸合成過程需要3種酶,5條肽鏈,5個基因,如下圖所示。奇怪的是,這5個基因是一起轉錄的,即先轉錄出一條mRNA,然後再由這一條mRNA翻譯產生5條肽鏈。科學家猜想,核糖體在一條mRNA上移動能夠產生5條肽鏈,那麼,核糖體肯定在移動的過程中在某些位置終止了翻譯了,否則就只能產生一條肽鏈了。於是科學家們認為,那個終止翻譯的位置存在終止密碼。
證據2:科學家們(揚諾夫斯基)發現了一種大腸桿菌色氨酸合成酶基因的突變菌株,該菌株不能合成完整的色氨酸合成酶,如果對突變菌株進行誘變,有些個體能夠發生完全回復突變,所謂完全恢復突變就是這些大腸桿菌又恢復到正常的大腸桿菌,合成的色氨酸合成酶的胺基酸組成和排序與正常大腸桿菌完全相同。科學家猜想,最開始的那種突變是一種鹼基對替換,不是鹼基對的刪除或增添,而且這種突變阻止了翻譯,這就意味著終止密碼的存在。
證據還有很多,這裡就不一一列舉了。
【琥珀和赭石密碼子的破譯】
受到上面實驗現象的啟發,科學家們(蓋倫和維特)繼續利用大腸桿菌的無義突變體進行回復突變。這裡需要說明兩個名詞,就是「無義突變」和「回復突變」。所謂無義突變就是:突變使基因在某處停止翻譯,不能合成完整的多肽鏈,而是合成了比突變前短的肽鏈,這種突變往往沒有功能。所謂回復突變就是在無義突變的基礎上進行人工誘變,從而使得該基因能夠合成完整的多肽鏈。
1965年科學家們發現了大腸桿菌的鹼性磷酸酶中編碼色氨酸的位點處發生了無義突變,於是對這種突變進行大量的回覆突變實驗,然後探測這些回復突變中無義突變處回復成了什麼胺基酸,結果科學家們經過測定每一種無義突變發現,無義突變處變成了7種胺基酸(注意,是每一種無義突變的回覆突變處變成一種胺基酸,共有7種情況),分別是色氨酸、酪氨酸、絲氨酸、亮氨酸、穀氨酸、穀氨醯胺和賴氨酸。科學家分析,這個無義突變處的密碼子是不能編碼胺基酸的,應該是UAG、UAA、UGA中的一種,然後科學家們通過回復突變後的7種胺基酸判斷出了這個無義突變處的密碼子就是UAG(如何判斷的呢,看下一段的分析),那麼這個UAG就是讓肽鏈終止的密碼子,這個密碼子(UAG)就第一個被確定的終止密碼子,由於當時進行分離突變體工作的是德國科學家伯恩斯坦(Bernstein),他的姓氏在德國是「永遠的琥珀的意思」,於是把這種無義突變叫做琥珀突變,而UAG這個終止密碼就稱為「琥珀密碼子」。
科學家是如何通過回復突變後的7種胺基酸分析出那個無義突變處的密碼子就是UAG的呢?我找了很多文獻,沒有找到當時科學家們分析思路的記載,就是「於是,科學家們通過判斷得出無義突變處的密碼子是UAG」這樣一句話帶過了。我通過正推的辦法得出了答案,我想,當時科學家們應該也是通過這種辦法推導的。推導思路如下圖所示。不難看出,只有UAG的回覆突變變成了7種胺基酸,而且7種氨酸的種類與上述實驗結果完全相符。
不久,科學家們在大腸桿菌的鹼性磷酸酶中又發現了一種無義突變,經過回復突變後分析回復後的胺基酸有6種,分別是:酪氨酸、亮氨酸、絲氨酸、賴氨酸、穀氨酸和穀氨醯胺。(這個不是我根據上面那個分析圖編造的,是科學家的實驗結果。)根據上面的分析圖就可以推出,這個無義突變應該是產生了UAA,因此,UAA是第二個發現的終止密碼子,科學家們把這個突變稱為「赭石突變」,把這個終止密碼子稱為「赭石密碼子」。大概是為了延續琥珀突變的命名習慣,因為琥珀、赭石都是寶石。琥珀和赭石突變及其回復突變圖示如下:
①琥珀突變及其回復突變過程如下圖所示:
②赭石突變及其回復突變過程如下圖所示:
【蛋白質石密碼子的破譯】
琥珀密碼子(UAG)和赭石密碼子(UAA)已經破譯,確信它們是兩種終止密碼子,不編碼胺基酸的密碼子只剩下UGA了,這個密碼子到底是不是終止密碼呢?很長一段時間,科學家沒有找到實驗證據。其實就是沒有遇到產生UGA的無義突變材料。克裡克根據已經破譯的63種密碼子發現一個規律,即XYA和XYG編碼同一種胺基酸,XYC和XYG編碼同一種胺基酸。(說明:X和Y是四種鹼基中的任一種,由於甲硫氨酸只有一種密碼子,因此甲硫氨酸的密碼子不符合這一規律。)根據以上規律可知,UGA和UGG是編碼同一種胺基酸的,而UGG是編碼色氨酸,但是體外合成蛋白質的實驗表明UGA並不編碼色氨酸,因此克裡克堅信UGA是第三種終止密碼子,科學家們也一致認為UGA是第三種終止密碼子,命名為蛋白石密碼子。(蛋白石也是一種寶石,因此,還是沿用前面兩個終止密碼子用寶石名字命名的習慣)至此,64種遺傳密碼全部破譯。當然後來科學家們證實了GUA能夠終止肽鏈的翻譯,是名副其實的終止密碼子。
【啟迪】
回首遺傳密碼破譯的歷史,我們感覺到了科學研究的艱辛,也感受到了科學成果的來之不易,同時也被科學家們的聰明才智和堅韌不拔所折服。科學研究的道路不是一帆風順的,但正是這曲折的探究過程激發了科學家們的興趣,激勵著一代又一代人們不斷探索。人類是地球上或許是宇宙中唯一破譯了編碼自己的遺傳密碼,然而科學家們又發現了這個生命密碼的背後還有一套密碼,稱為遺傳第二套密碼,這個密碼在tRNA分子上,即一種tNRA如何準確的識別並攜帶一種特定胺基酸。關於遺傳的第二套密碼科學家們已經發現了一些規律,但是完全破譯第二套遺傳密碼還需要走很長的路,我們下期就討論一下第二套遺傳密碼的一些規律。