轉錄調控(transcription regulation)是分子生物學核心大課題——基因調控的首要層級,也是最早受到關注和研究得最為透徹的分支。超過半個世紀的知識積累建構了一個由順式調控元件(cis-regulatory element)和反式作用因子(trans-acting factor)兩大要素相互作用形成的轉錄調控框架[1,2]。
在組成結構上,前者主要包括啟動子、增強子和沉默子等非編碼DNA序列;而後者則包含RNA聚合酶、轉錄因子、染色質重塑因子(chromatin remodeler)、甚至是一些RNA結合蛋白(RNA binding protein, RBP)等[3]。
在行為邏輯上,順式元件所蘊含的內在序列特徵(intrinsic sequence pattern)往往直接決定了反式因子的結合與作用模式,而反式因子在不同生物場景下的差異性行為也能夠反過來影響順式元件的激活,因而構成了類似「雞」與「蛋」的相輔相成的複雜邏輯[4]。
儘管轉錄調控機制的大體面貌已經相對明晰,但其中的若干基本環節依然有很大的修正空間,諸多具體細節也仍待釐清。例如,近年來的一系列重要研究表明:啟動子核心序列(core promoter sequence)所控制的基因轉錄經常是異向同時存在的(divergent transcription)[5]、RNA轉錄酶從轉錄起始位點起始後並非連貫作用,而是會在啟動子下遊發生短暫停滯[6]、5端外顯子RNA的剪接能夠直接增強基因的轉錄強度[7]等。
如果說上述問題僅僅是對於內涵和外延已然明確的轉錄調控概念進行豐富和完善,那麼從上個世紀八十年代開始的對於增強子(enhancer)的研究至今仍很大程度地著眼於其定義本身,即增強子是什麼、在哪裡、具備怎樣的功能和基因組特徵[8]。增強子研究的系統性困難根植於其本身模糊的定義空間和多樣靈活的行為模式:「不受作用距離和序列取向限制與基因啟動子相互作用促進轉錄」的定義使得增強子成為了幾乎可能遍布於整個基因組的「暗物質」。
對增強子的位置進行搜索的一個重大突破來自於本世紀第一個十年間由Phillip Sharp課題組和任兵(Bing Ren)課題組等發展起來的對於組蛋白修飾H3K27ac和H3K4me1和增強子活性的顯著關聯[9,10]。由ENCODE計劃領銜的對組織特異性表觀遺傳特徵基於染色質免疫沉降技術進行系統性描繪的努力,則使得具有特殊修飾狀態的組蛋白與DNA區域的結合幾乎成為了判斷增強子存在性的金指標。
隨著研究界對反式調控因子尤其是主調控轉錄因子(master transcription regulator)捕獲的快速進展,增強子的蛋白結合標記得到了極大的擴展。2013年,Richard Young實驗室首次提出了「超級增強子」(super enhancer)概念[11],將其發展為一個由豐富轉錄因子結合和普遍轉錄激活為特徵的基因調控樞紐。
與基於表觀修飾或轉錄因子結合等基因組特徵對增強子進行定義的方向不同,另一個關於增強子身份認知的重要進展來自於對其類似基因的轉錄特徵的描述。由Michael Greenberg課題組首次於2010年[12]發現的增強子RNA(enhancer RNA, eRNA)迅速成為了一個研究熱點。
其後,研究人員又由測定新生RNA的GRO-seq和標記轉錄位點的CAGE-seq等方法鑑定出上萬個潛在增強子位點[13,14]。不過,雖然增強子的轉錄被確定與各類經典轉錄元件,如RNA聚合酶II和輔因子CBP等均具有直接關聯[15],但這種轉錄行為本身究竟是某種調控功能的必要條件還是基因組背景轉錄的副產物,仍舊是個爭議極大的話題。
2020年10月1日,美國MD安德森癌症研究中心梁晗課題組在Cancer Cell上發表了題為「A High-Resolution Map of Human Enhancer RNA Loci Characterizes Super-enhancer Activities in Cancer」的論文。
該研究首次報導了利用常規RNA-seq信號對超級增強子單元進行定義,並揭示了增強子獨特的由核小體結合決定的調控機制,以及增強子轉錄活性對細胞類型特異性表型的精準反映。這項研究由課題組成員陳涵博士完成。
在該研究中,作者基於增強子激活的轉錄特性,創造性地提出了超級增強子轉錄與基因組背景轉錄相比應該具有明顯高信噪比、高復現性的假說。在實際情況下,考慮到常規轉錄組測序信號對非編碼區域的覆蓋度較低,受到背景轉錄的影響較大,這一假說所預測的增強子轉錄模式往往無法被準確探測。
然而,當具有相似生物學狀態的大規模轉錄組信號被疊加後,就可能顯現出增強子單元的獨特轉錄信號。的確,當作者將TCGA計劃中跨越32種癌症類型的一萬多個RNA-seq樣本根據癌症類型分別進行疊加並限制在由H3K27ac規定的超級增強子區域後,觀察到了具有明顯周期性和尖銳峰型的轉錄信號,並且幾乎均具有100bp左右的長度特徵。
接下來,作者推測,由於上述具有固定尺度的高復現性轉錄信號與已知核小體(nucleosome)的結合範圍147bp之間具有明顯的相似性,因而這些潛在的增強子區域可能建立了與核小體之間的調控關聯。
為了驗證這一假設,作者搜集了數十種組織中的MNase-seq數據(一種於全基因組尺度標定核小體結合位點的經典方法)與上述增強子單元位點進行聯立分析,結果發現核小體結合信號的確在增強子區域呈現出顯著的對稱式分布。更驚人的是,核小體與增強子單元的聯繫在跨越數十億年的進化過程中呈現出很強的保守性,因而暗示了這種調控模式的功能重要性。
對核小體結合信號與增強子轉錄信號的相對關係的進一步詳細分析發現,由跨29種細胞類型的數百萬個核小體信號分布降維後的第三個主成分(principal component 3, PC3)幾乎完美地區分出兩群具有截然不同的結合特徵的核小體信號,一種與增強子信號峰處於精準重疊狀態,而另一種則相對增強子具有一定程度的上下遊偏移。
基於這一結果,作者作出假設:核小體結合與增強子轉錄信號的同步化可能是增強子功能性的良好指標。作為驗證,作者發現核小體信號的PC3與增強子區域所含的常見單核苷酸序列變異(common SNP)是由GTEx項目所識別的eQTL位點的概率之間存在顯著反比關係。
由於eQTL位點往往被認為是能夠揭示基因調控因果關係(causal relationship)的重要指徵,因此上述結果實際表明了核小體和增強子的同步性與後者的基因調控效應強弱之間的顯著關聯。儘管這種功能聯繫的邏輯先後關係需要進一步探討,但核小體的結合模式是判斷增強子存在性的關鍵指標的事實是確鑿無疑的。
增強子作為轉錄調控的關鍵元件,在生命活動中的功能重要性是不言而喻的。同時,這種功能重要性相對於基因而言往往是高度組織和細胞特異性的。因此,實現對增強子激活程度的準確定量對於揭示其功能後果是極為關鍵的。與超級增強子尺度過大難以根據轉錄信號精準定量和表觀修飾信號往往缺乏可定量依據[16]不同,該研究所定義的增強子單元具有相當高的精度,並且基於廣泛存在的常規轉錄組數據而量化,因此其蘊藏的關於組織和細胞類型特異性調控邏輯及其所聯繫的生理、疾病表現型的解釋力可能是十分驚人的。
具體而言,儘管一個表型與一個或多個基因的特定表達模式具有直接關聯,但這種關聯往往只在某種特殊細胞類型或細胞狀態中有意義;而組織細胞集群的基因表達譜只能提供基因表達的平均度量,因而可能掩蓋了細胞特異性基因調控機制與重要表型的聯繫。相反,增強子經由其轉錄強度所表徵的激活程度是高度環境特異性的,因此即使在常規大體組織測序(bulk sequencing)樣本中也能夠提供關於特定細胞類型的表達模式變化與相關表型之間的聯繫。
為了印證這一邏輯,在根據轉錄信號和核小體結合特徵成功識別出數十萬個潛在增強子單元的基礎上,作者利用腫瘤免疫治療(cancer immunotherapy)的公共RNA-seq數據分別定量了增強子激活程度,結果發現,與超兩萬個蛋白編碼基因無一通過顯著性測試相比,近兩百個增強子單元在對免疫治療具有良好響應的病人樣本中存在顯著激活。而更令人興奮的是,這群增強子經由eQTL聯繫所對應的靶基因顯著富集於CD8+ T細胞功能,因此很好地展示了增強子作為細胞狀態特異表型指徵的角色。
總之,這項研究全面展示了超級增強子轉錄特徵的普遍性,解析了增強子單元的定位圖譜,進一步強化了這種屬性在其功能行為中的核心地位,為研究界對增強子的身份和本質的認知做出了重要的推動。
相關論文信息:
https://doi.org/10.1016/j.ccell.2020.08.020
參考文獻:
1.Lee, T. I. & Young, R. A. Transcriptional regulation and its misregulation in disease. Cell 152, 1237–1251 (2013).
2.Andersson, R. & Sandelin, A. Determinants of enhancer and promoter activities of regulatory elements. Nat. Rev. Genet. 21, 71–87 (2020).
3.Xiao, R. et al. Pervasive Chromatin-RNA Binding Protein Interactions Enable RNA-Based Regulation of Transcription. Cell 178, 107-121.e18 (2019).
4.Zeitlinger, J. Seven myths of how transcription factors read the cis-regulatory code. Curr. Opin. Syst. Biol. 301, 127065 (2020).
5.Wu, X. & Sharp, P. A. Divergent transcription: A driving force for new gene origination? Cell 155, 990 (2013).
6.Shao, W. & Zeitlinger, J. Paused RNA polymerase II inhibits new transcriptional initiation. Nat. Genet. 49, 1045–1051 (2017).
7.Fiszbein, A., Krick, K. S., Begg, B. E. & Burge, C. B. Exon-Mediated Activation of Transcription Starts. Cell 179, 1551-1565.e17 (2019).
8.Pennacchio, L. A., Bickmore, W., Dean, A., Nobrega, M. A. & Bejerano, G. Enhancers: Five essential questions. Nat. Rev. Genet. 14, 288–295 (2013).
9.Heintzman, N. D. et al. Distinct and predictive chromatin signatures of transcriptional promoters and enhancers in the human genome. Nat. Genet. 39, 311–318 (2007).
10.Creyghton, M. P. et al. Histone H3K27ac separates active from poised enhancers and predicts developmental state. Proc. Natl. Acad. Sci. U. S. A. 107, 21931–21936 (2010).
11.Whyte, W. A. et al. Master transcription factors and mediator establish super-enhancers at key cell identity genes. Cell 153, 307–319 (2013).
12.Kim, T. K. et al. Widespread transcription at neuronal activity-regulated enhancers. Nature 465, 182–187 (2010).
13.Andersson, R. et al. An atlas of active enhancers across human cell types and tissues. Nature 507, 455–461 (2014).
14.Core, L. J. et al. Analysis of nascent RNA identifies a unified architecture of initiation regions at mammalian promoters and enhancers. Nat. Genet. 46, 1311–1320 (2014).
15.Li, W., Notani, D. & Rosenfeld, M. G. Enhancers as non-coding RNA transcription units: Recent insights and future perspectives. Nat. Rev. Genet. 17, 207–223 (2016).
16.Orlando, D. A. et al. Quantitative ChIP-Seq normalization reveals global modulation of the epigenome. Cell Rep. 9, 1163–1170 (2014).
來源:小柯生命