原文連結:
https://www.nature.com/articles/ng.3884
在基因組上,基因的表達受到近端的啟動子和遠端的增強子共同調控。近年來,一些研究發現部分啟動子可能具有增強子活性。為了在全基因組鑑別有增強子功能的啟動子,來自法國Aix-Marseille大學的Salvatore Spicuglia課題組,利用體外報告系統篩選,結合體內CRISPR-Cas9,在小鼠和人類細胞中篩選鑑定出了一系列具有增強子功能的啟動子,它們可激活遠端的基因。該工作揭示了基因組上精細的轉錄調控過程,將有助於我們理解機體發育與疾病發生發展過程。
一、 在小鼠細胞中發現部分啟動子有增強子活性
為鑑定出基因組上的增強子序列,Salvatore Spicuglia課題組此前開發了一項體外報告系統,叫做CapStarr-seq (Captured self-transcribing active regulatory region sequencing)[1, 2],如圖1所示[3, 4]。
圖 1 CapStarr-seq流程圖
CapStarr-seq流程如下:
研究者將基因組打斷(本文用DNase I酶切基因組DNA,富集出的DNA即為染色質開放程度較高的DNA,即DHS,DNase I hypersensitivity sites);
合成< 150bp 的DNA 探針,用DNA microarray的方法,把打斷的基因組雜交出來,作為待鑑定的增強子(圖1a前兩步);
構建報告質粒:利用增強子無論在基因的上遊還是下遊,均可激活靶基因轉錄的特性,將待鑑定的增強子放在報告基因的3』端,和報告基因GFP融合在一起(圖1a第三步,圖1b)。將質粒轉染目的細胞。
用流式細胞術分選出GFP高表達的細胞,進行RNA-seq。同時檢測轉染到細胞內的待鑑定增強子的DNA量。
報告質粒會轉錄出GFP融合待鑑定增強子的RNA(圖1C)。通過RNA-seq可以獲知融合RNA的序列及豐度,將該豐度除以轉染的DNA量,即可得知待鑑定的增強子是否具有增強子活性,是否可激活GFP表達,及其活性。
該方法的優點是:可以大規模篩選、鑑定基因組中的增強子;用探針雜交的方法捕獲待鑑定的增強子序列,節省了合成DNA的成本;待鑑定的增強子序列可以通過RNA-seq測到,因此不需要額外給每個增強子序列設計標籤序列,節省人力物力。缺點是無法考慮體內染色質環境的影響。而且融合表達的增強子序列可能會影響RNA穩定性。
增強子研究的更多方法,歡迎點擊:Plus深讀 | Nature Biotech: 如何研究基因組中的非編碼序列?
在本文中,研究者將小鼠T細胞系P5424的基因組切斷,捕獲DHS序列,分為兩類:啟動子近端序列(距離TSS < 1kb)和遠端序列(距離TSS > 1kb)。構建報告質粒,轉染小鼠T細胞系P5424和小鼠胚胎成纖維細胞系NIH-3T3,進行RNA-seq,比較來自T細胞系的兩類DHS序列,在兩種不同細胞內的增強子活性。
研究發現,具有增強子活性的遠端DHS序列具有更強的組織特異性,而近端序列的組織特異性較弱。這體現在:來自T細胞的遠端增強子上富集淋巴轉錄因子的結合(如ETS1,HEB),而近端序列則缺少這些轉錄因子的結合(圖2a);來自T細胞的遠端序列更多地只在T細胞中具有增強子活性、在胚胎成纖維細胞中無增強子活性,而近端序列則更多地在兩種細胞系中都有增強子活性(圖2b-2d)。
圖 2 具有增強子活性的遠端DHS序列具有更強的組織特異性 | (a)T細胞中的淋巴轉錄因子的ChIP-seq表明它們更富集在具有增強子活性的遠端DHS序列上。(b) 棕色部分是在兩種細胞系中都有增強子活性的DHS,其中近端DHS的棕色比例高於遠端DHS。(c,d) 表明來自T細胞的DHS序列轉入胚胎成纖維細胞後的增強子活性,仍然是遠端序列弱於近端序列,表明遠端序列的組織特異性更強。
研究還發現,具備增強子活性的近端DHS序列大多分布在TSS上遊300bp至下遊100bp,基本與核心啟動子區重疊。因此,研究者把這些具備增強子活性的啟動子稱為Epromoter。下面,研究者將用該方法鑑定人源細胞K562和HeLa中的Epromoters,並研究其特徵和功能。
二、在人源細胞中鑑定具有增強子活性的啟動子
研究者在ENCODE計劃所用細胞系:人類髓性白血病細胞系K562和人類宮頸癌細胞系HeLa中篩選鑑定Epromoters。
他們將K562和HeLa細胞的基因組打斷,捕獲TSS -200bp至+50bp的DNA序列,進行CapStarr-seq。最終,他們在20719個啟動子中,篩選到632個K562的Epromoters,以及493個HeLa的Epromoters,兩者交集為146個。這些Epromoters與對照組啟動子(基因有相同轉錄活性、非Epromoters的啟動子)相比,CpG島的比例無明顯差別,物種間保守性也無明顯差別。
三、Epromoter的表觀基因組學和基因組學特徵分析
研究者針對Epromoter的表觀基因組進行分析,發現Epromoter有更高的p300(H3K27ac乙醯化酶)結合水平(圖3a),更高的H3K4me1和H3K27ac水平(圖3b),具備增強子的表觀遺傳學特徵。並且來自K562的Epromoter序列轉染K562細胞的增強子活性要強於轉染HeLa細胞,HeLa Epromoter也是轉染HeLa更強(圖3c),說明Epromoter還是具有一定的組織特異性的。
圖 3(上)Epromoter具備增強子的表觀遺傳學特徵
在HeLa中進行5』GRO-seq發現Epromoter有更高比例的反向轉錄(divergent transcription),這也是活躍的增強子的一個特徵。
針對Epromoter近端基因進行GO聚類分析(圖3d),發現其首先富集在一些基本生命過程相關的基因上(如肌動蛋白微絲相關基因,細胞代謝過程)。這和此前在果蠅的Starr-seq的結論相符,一些持家基因的啟動子可發揮增強子功能。此外,K562和HeLa的Epromoter的富集通路也有各自的獨特性。K562的Epromoter特異地富集在應激相關基因上,而HeLa的Epromoter特異地富集在I型和II型幹擾素應答基因、病毒相關基因、病毒防禦基因上。HeLa細胞確實高表達很多幹擾素應答基因,而K562並沒有,這可能是因為HeLa細胞來源於乳頭瘤病毒感染的腫瘤細胞。此外,Epromoter還富集很多轉錄因子的motif(圖3e),這也和增強子類似。
圖 3(下)Epromoter具備增強子的表觀遺傳學特徵 | (d) K562和HeLa的Epromoter近端基因的聚類分析。(e) K562和HeLa的Epromoter上富集的轉錄因子motif。
下面,研究者發現Epromoter近端基因的轉錄活性並不比非Epromoter更高(圖4a); K562或HeLa特異性的Epromoter近端基因的轉錄活性,在兩種細胞系中也差不多(圖4b),這表明Epromoter可能並不是近端基因的增強子。通過Pol II、H3K4me3、RAD21 ChIA-PET發現,Epromoter比非Epromoter在遠端基因有更強的啟動子-啟動子相互作用(圖4c)。這提示Epromoter是遠端基因的增強子。
圖 4 Epromoter的近端基因表達情況,以及啟動子-啟動子相互作用。
四、 在體內驗證Epromoter是真實的增強子
研究者以FAF2基因的Epromoter為例進行研究。他們用Pol II ChIA-PET發現該Epromoter與基因NOP16, CLTB 和RNF44的啟動子有相互作用(圖5a)。為了研究該Epromoter在體內是不是增強子,他們用CRISPR-cas9將該Epromoter切除,發現NOP16在Hela中的表達下降,RNF44在Hela及K562中的表達都下降(圖5b)。這提示FAF2 Epromoter可能是RNF44的增強子。切除FAF2基因的Epromoter後,RNF44啟動子的H3K27ac水平下降(圖5c)。4C-seq也發現WT細胞的FAF2基因的Epromoter與RNF44啟動子有互作,但切除Epromoter後互作消失(圖5d)。最後,研究者又構建了體外luciferase報告系統,證明該Epromoter可以激活RNF44的啟動子(圖5e)。而如果切除RNF44的啟動子,FAF2的表達不受影響(圖5f),表明FAF2 Epromoter對RNF44的調控作用是單向的。
這些結果證明了FAF2基因的Epromoter是距其88kb處的RNF44基因的增強子。
圖 5 FAF2基因的Epromoter是距其88kb處的RNF44基因的增強子
那麼該Epromoter作為增強子時,有沒有方向呢?為了解答這一問題,研究者將FAF2的Epromoter在基因組上翻轉了過來,發現翻轉後,RNF44的表達會下降(圖6a),但還是高於Epromoter切除後的表達量(圖6b)。這說明該Epromoter有一定方向性。
此外,過表達FAF2無法回復由於Epromoter切除或翻轉引起的RNF44下調(圖6b),證明RNF44並不是受FAF2基因調控的。
圖 6 FAF2 Epromoter有一定的方向性
五、Epromoter可調控遠端的幹擾素響應基因
研究者利用ChIA-PET尋找Epromoter的靶基因(圖7a),找到K562和HeLa的Epromoter的遠端靶基因中,分別有18個和56個是幹擾素調控基因(圖7b)。
例如在K562中,SERPING1基因的Epromoter的遠端靶基因是幹擾素響應基因UBE2L6,METTL21A的遠端靶基因是幹擾素響應基因CCNYL1。這些幹擾素響應基因在TNF-alpha的刺激下會被激活。但如果切除對應的Epromoter,UBE2L6和CCNYL1就不能在TNF-alpha的刺激下激活(圖7c, 7d)。
這進一步證明了Epromoter對遠端基因有順式調控作用。
圖 7 Epromoter可調控遠端的幹擾素響應基因
最後,研究者發現SNP可以影響Epromoter的活性,當把K562細胞的Epromoter的SNP突變,會導致Epromoter的靶基因的表達下調(圖8)。這提示Epromoter中的疾病相關的SNP可能影響遠端的基因表達,可能有助於我們更好地研究疾病的發生發展機制,
圖 8 把K562細胞的Epromoter的SNP突變,會導致Epromoter的靶基因的表達下調
延伸思考
1.本研究通過高通量報告系統篩選了小鼠和人類細胞中,可能具有增強子功能,激活遠端基因表達的啟動子,將其命名為Epromoter。研究者鑑定了這些Epromoter的獨特的基因組學和表觀遺傳學特徵,以及SNP對其產生的影響,證明了部分啟動子可以作為增強子,以及CapStarr-seq可以很好地用於篩選增強子。本研究揭示了基因組上精細的轉錄調控過程,將有助於我們理解機體發育與疾病發生發展過程。
2.本研究提示,啟動子可能存在成簇激活的情況。這或許有利於轉錄機器更高效地完成轉錄。但值得注意的是,成簇激活的啟動子可能並非互相激活。本文發現F2F Epromoter可以調控RNF44,但反之則不行。說明它們之間還是存在dominance的。此外,Epromoter調控的近端與遠端基因,或許功能上存在聯繫,使得他們經常需要被一起激活,同時這種成簇激活還存在上下遊關係。後續工作可以對其生物學功能展開更多研究。
3.lncRNA的啟動子也有可能發揮增強子的作用。2016年,Eric Lander 和 Eric Olson分別在Nature上發表的兩篇論文,及Mitchell Weiss在Molecular Cell 發表的論文,都分別提出了這一設想[5-7]。如lncRNA linc1536/Bendr的啟動子可以調控35kb外的基因Bend4的轉錄,lncRNA Uph的啟動子也可以調控Hand2的表達。以前研究lncRNA的作用,經常採用刪除lncRNA(或其promoter)的做法。這樣看到的表型,其實並不一定對應lncRNA作為RNA的功能,還有可能是其作為調控元件的作用,或其轉錄過程對其他基因的調控作用。所以,或許可以採用antisense-oligo(ASO)在核內敲低lncRNA來進行研究。此外,還可以rescue lncRNA(通過質粒,或者整合到基因組的其他位置產生核內lnRNA)作為對照。
(更多內容歡迎點擊:【Plus深讀】lncRNA:不只是RNA——三篇重磅文章齊解讀 )
4.後期工作還可以研究Epromoter和遠端啟動子之間的染色質高級結構如何被調控,與基因間區的經典增強子-啟動子互作有何異同。
5.可以在DNA序列上分析Epromoter與基因間區的經典增強子的關係,推測增強子的起源機制(部分增強子也許源於啟動子的複製、易位,Epromoter也許是比較原始的增強子模式)。
有關增強子的更多研究,可參考:
Plus深讀 | Mol Cell: Mll3/4催化的H3K4me1對增強子活性不必要
Plus深讀 | eRNA激活增強子的乙醯化?
【Plus深讀】Nature Comm:原發性胃癌的超級增強子異質性分析
參考文獻
[1] ARNOLD C D, GERLACH D, STELZER C, et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq[J]. Science, 2013,339(6123):1074-1077.
[2] VANHILLE L, GRIFFON A, MAQBOOL M A, et al. High-throughput and quantitative assessment of enhancer activity in mammals by CapStarr-seq[J]. Nat Commun, 2015,6:6905.
[3] DAO L, GALINDO-ALBARRAN A O, CASTRO-MONDRAGON J A, et al. Genome-wide characterization of mammalian promoters with distal enhancer functions[J]. Nat Genet, 2017,49(7):1073-1081.
[4] ELKON R, AGAMI R. Characterization of noncoding regulatory DNA in the human genome[J]. Nat Biotechnol, 2017,35(8):732-746.
[5] ENGREITZ J M, HAINES J E, PEREZ E M, et al. Local regulation of gene expression by lncRNA promoters, transcription and splicing[J]. Nature, 2016,539(7629):452-455.
[6] ANDERSON K M, ANDERSON D M, MCANALLY J R, et al. Transcription of the non-coding RNA upperhand controls Hand2 expression and heart development[J]. Nature, 2016,539(7629):433-436.
[7] PARALKAR V R, TABORDA C C, HUANG P, et al. Unlinking an lncRNA from Its Associated cis Element[J]. Mol Cell, 2016,62(1):104-110.
23Plus歡迎表觀遺傳領域的同行們投稿,分享學術成果、學術見解和學術故事。
投稿請聯繫:
23plus@epican.cn
微信添加23Plus小秘書:
bai5211992
拉您入群參加更深入的討論。
點擊下方閱讀原文,進入23Plus移動社區,獲得更多表觀遺傳學領域資訊內容,與表觀人們在線互動。
23Plus: 首個專注於表觀遺傳學領域的網絡社區
微信號:epi23plus