按照慣例,真核生物的啟動子更加複雜。真核生物有三種RNAP,所以有相應的三類啟動子。RNAP I負責轉錄rRNA,對應的是I類(class I)啟動子,由核心啟動子(-45至+20)和上遊控制元件(-180至-107)構成。
小RNA對應的III類啟動子又有3種類型,其中5 S rRNA基因和tRNA基因的啟動子都屬於下遊啟動子,即位於轉錄起點下遊。其內部包含box A、box B、boxC等元件,需要由TFIIIA、TFIIIC等轉錄因子識別。而snRNA的啟動子位於轉錄起點上遊。
研究最多的還是II類啟動子,對應轉錄蛋白質編碼基因的RNAP II(Pol II)。其TATA box相當於原核的Pribnow box,位於-25至-32位;在大約-80位有CAAT box,相當於原核的-35序列;另外還有GC box和八聚體(octamer)box,以及一些應答元件(responseelement)等。
TATA box又稱為基本啟動子(basal promoter),它與上遊的TFIIB識別元件(TFIIB recognition element,BRE)、以轉錄起始位點為中心的起始子(initiator, Inr),以及下遊啟動子元件(downstream promoter element, DPE)一起構成核心啟動子,其它均稱為上遊元件。
在真核生物的轉錄調控中,另一種常用的順式元件是增強子(enhancer)。增強子是與輔因子和轉錄因子(TFs)結合的DNA元件,能夠通過直接刺激啟動子(通常通過染色質環)來增加其靶基因的轉錄水平。
啟動子的位置是確定的,即與基因之間有特定的距離和方向。增強子則不同,它可能與其調節的啟動子相距數千Kb,可以在上遊或下遊。當處於非活性狀態時,二者不會靠近。但在活性狀態下,增強子通過形成環狀結構而在三維空間上接近啟動子,並將相應轉錄因子募集到該區域,從而促進基因表達。
轉錄調控與染色質結構密切相關。活性增強子通常沒有核小體結構,以利於TF的結合。而其附近的組蛋白經常具有表觀遺傳標記,例如H3K4me1(組蛋白H3的4位賴氨酸單甲基化)和H3K27的乙醯化(H3K27ac)。而H3K4的三甲基化(H3K4me3)通常在基因啟動子上富集。
參與轉錄調控的順式元件還包括絕緣子(insulator)和沉默子(silencer)等。前者可以隔絕某些順式元件對基因表達的調控作用,也可以防止異染色質擴散;後者抑制某一區域內的轉錄。
真核生物的轉錄起始同樣分為3個步驟,先識別啟動子形成封閉的前起始複合物,然後DNA解鏈形成開放複合物;最後通過「啟動子解脫」過渡到延伸階段。
原核生物的初始封閉複合物(RPC)由RNAP和promoter構成,而真核生物的啟動子識別還需要很多轉錄因子(transcription factor,TF),它們起著類似σ因子的作用。真核生物的初始封閉複合物稱為前起始複合物(preinitiation complex,PIC),其中包括中介體複合物(mediator complex)和多種通用轉錄因子(GTF),如TFIIA,TFIIB,TFIID,TFIIE,TFIIF和TFIIH。
TFIID是真核mRNA基因的核心啟動子識別因子,是一個很大的組裝體,分子量大於1 MD。它包括TATA結合蛋白(TBP)和13-14個不同的TBP相關因子(TAF)。TFIID識別DNA上的核心啟動子區域,隨後募集Pol II,TFIIH和Mediator複合物,組裝前起始複合物。
Mediator(中介體)也是一個分子量上兆的巨大複合物,參與PIC的募集與組裝。它與Pol II大亞基Rpb1的羧端結構域(CTD)相互作用,當CTD非磷酸化時二者結合,磷酸化後就會分離。中介體也參與轉錄調控,根據其組分不同而對轉錄其促進或抑制作用。
當TFIIH被募集之後,TFIIH相關的解旋酶會促進轉錄泡的形成,並允許模板DNA進入Pol II活性位點。這樣就啟動了RNA合成,在Pol II活性位點內產生雜合雙鏈。
RNA不斷延伸,但複合體與啟動子的結合仍然存在,從而阻止了聚合酶向前移動,因而不斷積累應力。在形成大於10 nt的RNA後,轉錄泡的上遊區域坍塌,從而允許模板鏈和編碼鏈DNA重新結合。
有人認為該過程獲得的能量可以推動聚合酶向前運動,使啟動子解脫步驟得以實現。當然啟動子解脫也是一個複雜的過程,還涉及Pol II羧端結構域(CTD)的磷酸化等過程。CTD的磷酸化可以幹擾其與中介體(Mediator)的結合,協助與啟動子的脫離。
現已陸續發現,在轉錄起始過程中,會有多種RNA參與。例如,增強子會轉錄出增強子RNA(eRNA),可以穩定染色質環,還可能參與轉錄延伸過程。
一些轉錄組研究表明,多數基因的啟動子區域會轉錄出一些非編碼RNA,稱為啟動子相關非編碼RNA(promoter-associated noncoding RNAs,pancRNAs)。它們可能通過順式元件作用促進或抑制轉錄,已有多種模型(J Exp Clin Cancer Res. 2020 Mar 17;39(1):51.)。
上世紀60年代就已經發現,原核和真核RNA聚合酶可以利用2-8 nt的RNA 在體外引發轉錄起始。2011年,Goldman等人在銅綠假單胞菌(Pseudomonas aeruginosa)中發現,2-4 nt 的nanoRNA(納米RNA)可在體內引發轉錄起始(Mol Cell. 2011 Jun 24; 42(6): 817–825.)。
這種極小的RNA可被特異性的寡核糖核酸酶(Orn)降解,Orn的失活會導致nanoRNA積累並引發廣泛的RNA轉錄。所以nanoRNA介導的啟動可以作為一種基因表達調控方式。