在真核生物中,蛋白質基因由DNA編碼的遺傳信息是首先通過RNA聚合酶II(Pol II)轉錄到mRNA分子中。作為分子生物學的「中心法則」三大步驟之一,Pol II在這個過程中如何準確找到基因的轉錄起始位點(TSS)的分子機制是很多基因調控研究的重點【1】。大多數真核生物基因能夠從不同的TSS開始轉錄,產生多種轉錄異構體【2,3】。而且這些TSS在不同組織細胞或者不同生長條件下替代使用的現象非常普遍,說明了Pol II 對TSS的選擇在基因調控中扮演者非常重要的角色。
目前,Pol II轉錄機制的大多數研究都是在含有TATA box的啟動子中進行的,因為這個轉錄機制從古細菌到真核生物都是高度保守的。轉錄起始首先開始於TBP(TATA box binding protein)結合到TATA box上,然後其他通用轉錄因子(GTFs)按照一定順序結合到TBP-TATA box複合體上進而召集Pol II形成轉錄起始前複合物(PIC),該複雜結構使得Pol II直接到達下遊約30bp處的TSS,這一種轉錄模式稱之為「經典模型」(圖1)。1983年,美國科學家Paul Russell首先在釀酒酵母Saccharomyces cerevisiae中觀察到了不同的轉錄起始機制【4】。其後研究發現釀酒酵母的PIC通過掃描下遊序列而尋找有偏好性的位點作為TSS,並主要從下遊60-120bp啟動轉錄,稱為「掃描模型」 【5】。最近的一項研究表明,「掃描模型」也用於釀酒酵母中不含有TATA box的啟動子中,表明它是全基因組轉錄起始的機制【6】。但是,這種「掃描模型」何時起源以及它的演化分子機制尚未清楚。
近日,美國聖路易斯大學生物系林振國課題組在Genome Research上以封面文章發表了題為 The origin and evolution of a distinct transcription initiation mechanism in yeast 的研究論文【7】。該研究利用nAnT-iCAGE技術準確定位12種酵母的轉錄起始位點圖譜,系統揭示了真核生物Pol II 「掃描模型」的起源和逐步演化過程。
圖1:A.兩種不同轉錄起始機制的模式圖;B.出芽酵母進化過程中「掃描模型」的起源和逐步演化示意圖
該研究利用TSS圖譜和基因組序列推論出每個物種的轉錄起始機制,發現「掃描模型」的出現應該發生在解脂耶氏酵母Yarrowia lipolytica 和其他出芽酵母的分化過程之後(2-3億年前左右,圖1)。該研究發現「掃描模型」物種的TSS的上遊含有一個富含腺嘌呤的區域,並且在S. cerevisiae以及幾個相近物種的TSS上遊第八個鹼基在大多數情況下是腺嘌呤(-8A)。該研究認為這種序列特徵可能有助於「掃描模型」中Pol II選擇TSS。基於這些發現,該研究提出了「掃描模型」的起源和逐步演化過程的模型(圖1)。
此外,該研究還發現位於TSS的嘌呤在轉錄和翻譯中的重要作用(圖2)。「經典模型」和「掃描模型」這兩種轉錄起始基本都發生在嘧啶-嘌呤二核苷酸的位置,其中嘌呤是轉錄起始位置 (+1)。之前研究發現在-1位置上的嘧啶有助於Pol II加載mRNA的第一個核苷酸 【8】,但是為什麼Pol II選擇嘌呤作為第一個核苷酸並不清楚。該研究通過比較結果nAnT-iCAGE原始測序數據和基因組序列發現,嘌呤作為mRNA第一個鹼基增加了mRNA成熟過程中5』端加帽子結構的機會,這對於蛋白質生物合成過程中有效的翻譯起始至關重要(圖2)。因此在長期進化過程中,Pol II會優先選擇嘧啶-嘌呤二核苷酸作為轉錄起始位置。這個是首次關於嘧啶-嘌呤二核苷酸中嘌呤的作用的描述,該發現進一步完善對轉錄起始的分子機制的了解。
圖2:轉錄起始位點附近的序列特徵以及嘧啶-嘌呤二核苷酸中嘌呤在轉錄起始過程中的作用。
美國聖路易斯大學博士研究生逯召蓮為該論文第一作者,林振國副教授為論文通訊作者。