Plus深讀 Nat. Genet. 揭示具有增強子功能的啟動子---Epromoter

2021-01-10 網易

  

  原文連結:

  https://www.nature.com/articles/ng.3884

  在基因組上,基因的表達受到近端的啟動子和遠端的增強子共同調控。近年來,一些研究發現部分啟動子可能具有增強子活性。為了在全基因組鑑別有增強子功能的啟動子,來自法國Aix-Marseille大學的Salvatore Spicuglia課題組,利用體外報告系統篩選,結合體內CRISPR-Cas9,在小鼠和人類細胞中篩選鑑定出了一系列具有增強子功能的啟動子,它們可激活遠端的基因。該工作揭示了基因組上精細的轉錄調控過程,將有助於我們理解機體發育與疾病發生發展過程。

  一、 在小鼠細胞中發現部分啟動子有增強子活性

  為鑑定出基因組上的增強子序列,Salvatore Spicuglia課題組此前開發了一項體外報告系統,叫做CapStarr-seq (Captured self-transcribing active regulatory region sequencing)[1, 2],如圖1所示[3, 4]。

  

  圖 1 CapStarr-seq流程圖

  CapStarr-seq流程如下:

  

  研究者將基因組打斷(本文用DNase I酶切基因組DNA,富集出的DNA即為染色質開放程度較高的DNA,即DHS,DNase I hypersensitivity sites);

  

  合成< 150bp 的DNA 探針,用DNA microarray的方法,把打斷的基因組雜交出來,作為待鑑定的增強子(圖1a前兩步);

  

  構建報告質粒:利用增強子無論在基因的上遊還是下遊,均可激活靶基因轉錄的特性,將待鑑定的增強子放在報告基因的3』端,和報告基因GFP融合在一起(圖1a第三步,圖1b)。將質粒轉染目的細胞。

  

  用流式細胞術分選出GFP高表達的細胞,進行RNA-seq。同時檢測轉染到細胞內的待鑑定增強子的DNA量。

  

  報告質粒會轉錄出GFP融合待鑑定增強子的RNA(圖1C)。通過RNA-seq可以獲知融合RNA的序列及豐度,將該豐度除以轉染的DNA量,即可得知待鑑定的增強子是否具有增強子活性,是否可激活GFP表達,及其活性。

  

  該方法的優點是:可以大規模篩選、鑑定基因組中的增強子;用探針雜交的方法捕獲待鑑定的增強子序列,節省了合成DNA的成本;待鑑定的增強子序列可以通過RNA-seq測到,因此不需要額外給每個增強子序列設計標籤序列,節省人力物力。缺點是無法考慮體內染色質環境的影響。而且融合表達的增強子序列可能會影響RNA穩定性。

  增強子研究的更多方法,歡迎點擊:Plus深讀 | Nature Biotech: 如何研究基因組中的非編碼序列?

  在本文中,研究者將小鼠T細胞系P5424的基因組切斷,捕獲DHS序列,分為兩類:啟動子近端序列(距離TSS < 1kb)和遠端序列(距離TSS > 1kb)。構建報告質粒,轉染小鼠T細胞系P5424和小鼠胚胎成纖維細胞系NIH-3T3,進行RNA-seq,比較來自T細胞系的兩類DHS序列,在兩種不同細胞內的增強子活性。

  研究發現,具有增強子活性的遠端DHS序列具有更強的組織特異性,而近端序列的組織特異性較弱。這體現在:來自T細胞的遠端增強子上富集淋巴轉錄因子的結合(如ETS1,HEB),而近端序列則缺少這些轉錄因子的結合(圖2a);來自T細胞的遠端序列更多地只在T細胞中具有增強子活性、在胚胎成纖維細胞中無增強子活性,而近端序列則更多地在兩種細胞系中都有增強子活性(圖2b-2d)。

  

  圖 2 具有增強子活性的遠端DHS序列具有更強的組織特異性 | (a)T細胞中的淋巴轉錄因子的ChIP-seq表明它們更富集在具有增強子活性的遠端DHS序列上。(b) 棕色部分是在兩種細胞系中都有增強子活性的DHS,其中近端DHS的棕色比例高於遠端DHS。(c,d) 表明來自T細胞的DHS序列轉入胚胎成纖維細胞後的增強子活性,仍然是遠端序列弱於近端序列,表明遠端序列的組織特異性更強。

  研究還發現,具備增強子活性的近端DHS序列大多分布在TSS上遊300bp至下遊100bp,基本與核心啟動子區重疊。因此,研究者把這些具備增強子活性的啟動子稱為Epromoter。下面,研究者將用該方法鑑定人源細胞K562和HeLa中的Epromoters,並研究其特徵和功能。

  二、在人源細胞中鑑定具有增強子活性的啟動子

  研究者在ENCODE計劃所用細胞系:人類髓性白血病細胞系K562和人類宮頸癌細胞系HeLa中篩選鑑定Epromoters。

  他們將K562和HeLa細胞的基因組打斷,捕獲TSS -200bp至+50bp的DNA序列,進行CapStarr-seq。最終,他們在20719個啟動子中,篩選到632個K562的Epromoters,以及493個HeLa的Epromoters,兩者交集為146個。這些Epromoters與對照組啟動子(基因有相同轉錄活性、非Epromoters的啟動子)相比,CpG島的比例無明顯差別,物種間保守性也無明顯差別。

  三、Epromoter的表觀基因組學和基因組學特徵分析

  研究者針對Epromoter的表觀基因組進行分析,發現Epromoter有更高的p300(H3K27ac乙醯化酶)結合水平(圖3a),更高的H3K4me1和H3K27ac水平(圖3b),具備增強子的表觀遺傳學特徵。並且來自K562的Epromoter序列轉染K562細胞的增強子活性要強於轉染HeLa細胞,HeLa Epromoter也是轉染HeLa更強(圖3c),說明Epromoter還是具有一定的組織特異性的。

  

  圖 3(上)Epromoter具備增強子的表觀遺傳學特徵

  在HeLa中進行5』GRO-seq發現Epromoter有更高比例的反向轉錄(divergent transcription),這也是活躍的增強子的一個特徵。

  針對Epromoter近端基因進行GO聚類分析(圖3d),發現其首先富集在一些基本生命過程相關的基因上(如肌動蛋白微絲相關基因,細胞代謝過程)。這和此前在果蠅的Starr-seq的結論相符,一些持家基因的啟動子可發揮增強子功能。此外,K562和HeLa的Epromoter的富集通路也有各自的獨特性。K562的Epromoter特異地富集在應激相關基因上,而HeLa的Epromoter特異地富集在I型和II型幹擾素應答基因、病毒相關基因、病毒防禦基因上。HeLa細胞確實高表達很多幹擾素應答基因,而K562並沒有,這可能是因為HeLa細胞來源於乳頭瘤病毒感染的腫瘤細胞。此外,Epromoter還富集很多轉錄因子的motif(圖3e),這也和增強子類似。

  

  圖 3(下)Epromoter具備增強子的表觀遺傳學特徵 | (d) K562和HeLa的Epromoter近端基因的聚類分析。(e) K562和HeLa的Epromoter上富集的轉錄因子motif。

  下面,研究者發現Epromoter近端基因的轉錄活性並不比非Epromoter更高(圖4a); K562或HeLa特異性的Epromoter近端基因的轉錄活性,在兩種細胞系中也差不多(圖4b),這表明Epromoter可能並不是近端基因的增強子。通過Pol II、H3K4me3、RAD21 ChIA-PET發現,Epromoter比非Epromoter在遠端基因有更強的啟動子-啟動子相互作用(圖4c)。這提示Epromoter是遠端基因的增強子。

  

  圖 4 Epromoter的近端基因表達情況,以及啟動子-啟動子相互作用。

  四、 在體內驗證Epromoter是真實的增強子

  研究者以FAF2基因的Epromoter為例進行研究。他們用Pol II ChIA-PET發現該Epromoter與基因NOP16, CLTB 和RNF44的啟動子有相互作用(圖5a)。為了研究該Epromoter在體內是不是增強子,他們用CRISPR-cas9將該Epromoter切除,發現NOP16在Hela中的表達下降,RNF44在Hela及K562中的表達都下降(圖5b)。這提示FAF2 Epromoter可能是RNF44的增強子。切除FAF2基因的Epromoter後,RNF44啟動子的H3K27ac水平下降(圖5c)。4C-seq也發現WT細胞的FAF2基因的Epromoter與RNF44啟動子有互作,但切除Epromoter後互作消失(圖5d)。最後,研究者又構建了體外luciferase報告系統,證明該Epromoter可以激活RNF44的啟動子(圖5e)。而如果切除RNF44的啟動子,FAF2的表達不受影響(圖5f),表明FAF2 Epromoter對RNF44的調控作用是單向的。

  
這些結果證明了FAF2基因的Epromoter是距其88kb處的RNF44基因的增強子。

  

  圖 5 FAF2基因的Epromoter是距其88kb處的RNF44基因的增強子

  那麼該Epromoter作為增強子時,有沒有方向呢?為了解答這一問題,研究者將FAF2的Epromoter在基因組上翻轉了過來,發現翻轉後,RNF44的表達會下降(圖6a),但還是高於Epromoter切除後的表達量(圖6b)。這說明該Epromoter有一定方向性。

  此外,過表達FAF2無法回復由於Epromoter切除或翻轉引起的RNF44下調(圖6b),證明RNF44並不是受FAF2基因調控的。

  

  圖 6 FAF2 Epromoter有一定的方向性

  五、Epromoter可調控遠端的幹擾素響應基因

  研究者利用ChIA-PET尋找Epromoter的靶基因(圖7a),找到K562和HeLa的Epromoter的遠端靶基因中,分別有18個和56個是幹擾素調控基因(圖7b)。

  例如在K562中,SERPING1基因的Epromoter的遠端靶基因是幹擾素響應基因UBE2L6,METTL21A的遠端靶基因是幹擾素響應基因CCNYL1。這些幹擾素響應基因在TNF-alpha的刺激下會被激活。但如果切除對應的Epromoter,UBE2L6和CCNYL1就不能在TNF-alpha的刺激下激活(圖7c, 7d)。

  這進一步證明了Epromoter對遠端基因有順式調控作用。

  

  圖 7 Epromoter可調控遠端的幹擾素響應基因

  最後,研究者發現SNP可以影響Epromoter的活性,當把K562細胞的Epromoter的SNP突變,會導致Epromoter的靶基因的表達下調(圖8)。這提示Epromoter中的疾病相關的SNP可能影響遠端的基因表達,可能有助於我們更好地研究疾病的發生發展機制,

  

  圖 8 把K562細胞的Epromoter的SNP突變,會導致Epromoter的靶基因的表達下調

  延伸思考

  1.本研究通過高通量報告系統篩選了小鼠和人類細胞中,可能具有增強子功能,激活遠端基因表達的啟動子,將其命名為Epromoter。研究者鑑定了這些Epromoter的獨特的基因組學和表觀遺傳學特徵,以及SNP對其產生的影響,證明了部分啟動子可以作為增強子,以及CapStarr-seq可以很好地用於篩選增強子。本研究揭示了基因組上精細的轉錄調控過程,將有助於我們理解機體發育與疾病發生發展過程。

  2.本研究提示,啟動子可能存在成簇激活的情況。這或許有利於轉錄機器更高效地完成轉錄。但值得注意的是,成簇激活的啟動子可能並非互相激活。本文發現F2F Epromoter可以調控RNF44,但反之則不行。說明它們之間還是存在dominance的。此外,Epromoter調控的近端與遠端基因,或許功能上存在聯繫,使得他們經常需要被一起激活,同時這種成簇激活還存在上下遊關係。後續工作可以對其生物學功能展開更多研究。

  3.lncRNA的啟動子也有可能發揮增強子的作用。2016年,Eric Lander 和 Eric Olson分別在Nature上發表的兩篇論文,及Mitchell Weiss在Molecular Cell 發表的論文,都分別提出了這一設想[5-7]。如lncRNA linc1536/Bendr的啟動子可以調控35kb外的基因Bend4的轉錄,lncRNA Uph的啟動子也可以調控Hand2的表達。以前研究lncRNA的作用,經常採用刪除lncRNA(或其promoter)的做法。這樣看到的表型,其實並不一定對應lncRNA作為RNA的功能,還有可能是其作為調控元件的作用,或其轉錄過程對其他基因的調控作用。所以,或許可以採用antisense-oligo(ASO)在核內敲低lncRNA來進行研究。此外,還可以rescue lncRNA(通過質粒,或者整合到基因組的其他位置產生核內lnRNA)作為對照。

  (更多內容歡迎點擊:【Plus深讀】lncRNA:不只是RNA——三篇重磅文章齊解讀 )

  4.後期工作還可以研究Epromoter和遠端啟動子之間的染色質高級結構如何被調控,與基因間區的經典增強子-啟動子互作有何異同。

  5.可以在DNA序列上分析Epromoter與基因間區的經典增強子的關係,推測增強子的起源機制(部分增強子也許源於啟動子的複製、易位,Epromoter也許是比較原始的增強子模式)。

  有關增強子的更多研究,可參考:

  Plus深讀 | Mol Cell: Mll3/4催化的H3K4me1對增強子活性不必要

  Plus深讀 | eRNA激活增強子的乙醯化?

  【Plus深讀】Nature Comm:原發性胃癌的超級增強子異質性分析

  參考文獻

  [1] ARNOLD C D, GERLACH D, STELZER C, et al. Genome-wide quantitative enhancer activity maps identified by STARR-seq[J]. Science, 2013,339(6123):1074-1077.

  [2] VANHILLE L, GRIFFON A, MAQBOOL M A, et al. High-throughput and quantitative assessment of enhancer activity in mammals by CapStarr-seq[J]. Nat Commun, 2015,6:6905.

  [3] DAO L, GALINDO-ALBARRAN A O, CASTRO-MONDRAGON J A, et al. Genome-wide characterization of mammalian promoters with distal enhancer functions[J]. Nat Genet, 2017,49(7):1073-1081.

  [4] ELKON R, AGAMI R. Characterization of noncoding regulatory DNA in the human genome[J]. Nat Biotechnol, 2017,35(8):732-746.

  [5] ENGREITZ J M, HAINES J E, PEREZ E M, et al. Local regulation of gene expression by lncRNA promoters, transcription and splicing[J]. Nature, 2016,539(7629):452-455.

  [6] ANDERSON K M, ANDERSON D M, MCANALLY J R, et al. Transcription of the non-coding RNA upperhand controls Hand2 expression and heart development[J]. Nature, 2016,539(7629):433-436.

  [7] PARALKAR V R, TABORDA C C, HUANG P, et al. Unlinking an lncRNA from Its Associated cis Element[J]. Mol Cell, 2016,62(1):104-110.

  

  

  23Plus歡迎表觀遺傳領域的同行們投稿,分享學術成果、學術見解和學術故事。

  投稿請聯繫:

  23plus@epican.cn

  微信添加23Plus小秘書:

  bai5211992

  拉您入群參加更深入的討論。

  

  點擊下方閱讀原文,進入23Plus移動社區,獲得更多表觀遺傳學領域資訊內容,與表觀人們在線互動。

  

  23Plus: 首個專注於表觀遺傳學領域的網絡社區

  微信號:epi23plus

相關焦點

  • Nat Genet.:科學家找到方法預測基因不同條件下生成蛋白的數量
    他們開發了一種基因表達模式,揭示了蛋白質的產生量是如何被控制的。研究結果已發表在Nature Genetics雜誌上。基因不是簡單地切換「開」或「關」,每一個基因在它開始時都有一個DNA片段被稱為啟動子,啟動子在蛋白質的生成中起著關鍵作用。當啟動子被激活時,它產生mRNA分子,然後mRNA分子變成一種蛋白質。
  • 11q13.5處的遠端增強因子促進Treg細胞抑制結腸炎
    他們發現位於風險基因座11 q13.5處的遠端增強子促進T reg細胞抑制結腸炎。 這一研究成果在線發表在2020年5月13日的《自然》上。 使用共有、同義性來指導小鼠中人類同源增強子功能喪失分析,研究人員發現在染色體11q13.5處存在自身免疫病和過敏性疾病的風險位點,其包含一個遠端在CD4 +調節性T(Treg)細胞中起作用的增強子,並且該增強子是Treg介導的結腸炎抑制所必需的。增強子招募轉錄因子STAT5和NF-κB來調控信號驅動的Lrrc32表達,Lrrc32編碼糖蛋白A為主的重複序列(GARP)。
  • 梁晗團隊揭示超級增強子的轉錄本質和定位圖譜
    例如,近年來的一系列重要研究表明:啟動子核心序列(core promoter sequence)所控制的基因轉錄經常是異向同時存在的(divergent transcription)[5]、RNA轉錄酶從轉錄起始位點起始後並非連貫作用,而是會在啟動子下遊發生短暫停滯[6]、5端外顯子RNA的剪接能夠直接增強基因的轉錄強度[7]等。
  • Nature:轉錄輔助因子對不同類型的核心啟動子具有特異性
    2019年5月26日訊/生物谷BIOON/---轉錄輔助因子(transcriptional cofactor, COF)在增強子與啟動子之間傳遞調控線索,是轉錄激活和基因表達的核心效應物。雖然已證實某些COF比其他COF更偏好某些啟動子類型,但是不同COF對不同啟動子顯示出的內在特異性的程度尚不清楚。
  • 高度互連的增強子群體調控人類間充質幹細胞中的譜系決定基因
    高度互連的增強子群體調控人類間充質幹細胞中的譜系決定基因 作者:小柯機器人 發布時間:2020/10/10 13:52:33 南丹麥大學Susanne Mandrup研究團隊發現,高度互連的增強子群體調控人類間充質幹細胞中的譜系決定基因
  • ...公司正式推出R9e(基礎型)和R9plus(增強型)兩款掃描隧道顯微鏡...
    為了更好地適應和匹配廣大科研工作者的各類需求,RHK公司對其最新一代多功能掃描探針控制平臺進行了配置和功能的劃分,推出了基礎型(R9e)和增強型(R9plus)兩款產品,R9e控制器可精確控制所有類型的STM。增強型R9plus則增加了AFM控制功能,以滿足更多科研實驗需求。
  • 杜敏教授團隊揭示母親孕期運動增強子代抵禦肥胖的機制
    孕期運動增強子代斷奶後脂肪組織產熱研究團隊首先將孕期小鼠分成兩組,一組小鼠久坐,一組小鼠接受運動訓練。隨著科學研究,人們對肥胖的認識越來越深。肥胖發生與飲食攝入、運動、生活習慣、遺傳因素等多種因素相關。然而,關於孕婦懷孕期間運動狀態對自身健康,以及對後代健康的影響,及社會和科學界重視度普遍不高。國內普遍對孕婦存在過度保護情況,「豐富營養」往往帶來高熱量;「多休息」往往意味著缺乏運動。
  • Nat Comm丨馬莉等揭示導致洞穴盲魚視覺退化的首個基因
    Jeffery教授領導的研究團隊 (馬莉博士為本文第一作者)在Nature Communications雜誌發表文章「A hypomorphic cystathionine ß-synthase gene contributes to cavefish eye loss by disrupting
  • Nat Metab | 胰島β細胞分化程序和譜系分支
    該工作使用人類胚胎幹細胞定向誘導胰島β細胞體外分化並使用單細胞RNA 測序技術(Drop-Seq)重建完整分化譜系樹,從而系統地揭示了分化程序和譜系分支。此外,根據HES1 在譜系樹上的表達時間,研究者優化了NOTCH 信號通路抑制時間並成功提高分化效率(圖4d-e)。
  • Nat Genet:揭示EBV通過重編程宿主表觀遺傳景觀促進胃癌新機制
    在一項新的研究中,來自日本千葉大學、新加坡科技研究局和杜克-新加坡國立大學的研究人員揭示了EBV相關胃癌的新模式,即EBV病毒基因組直接改變宿主的表觀遺傳景觀,促進原癌基因(proto-oncogene,參與正常細胞生長的基因,發生突變後可變為致癌基因)的激活和腫瘤發生。
  • 吳強組揭示染色質架構蛋白調控基因組高級結構的非對稱性阻斷機制
    人類大約2米長的染色體非常有規律地摺疊在約5微米的細胞核內,其摺疊結構對於組織器官生長發育具有重要作用,而摺疊異常在出生缺陷、神經疾病和腫瘤等各種各樣的疾病發生中也起到重要的病理作用。三維基因組摺疊形成高度有序並且層次分明的拓撲結構域,影響細胞特異性基因表達調控。其中,染色質可以通過形成環狀結構使得遠端的增強子與不同基因的啟動子在空間上靠近,從而精確調控基因的時空特異性表達。
  • 高度重排的染色體揭示基因組拓撲結構
    高度重排的染色體揭示基因組拓撲結構 作者:小柯機器人 發布時間:2019/8/4 20:25:17 歐洲分子生物學實驗室Eileen E. M. Furlong、Jan O.
  • NAT網絡地址轉換複習一(思科)
    NAT(Network Address Translation )是一種將多個內部IP位址映射到一個或幾個公網IP位址實現內部網絡連接網際網路的技術,該技術隱藏了內部網絡的結構增強了網絡的安全性,並且緩解了IPv4地址緊張的問題,是網際網路廣泛應用的一種技術。
  • Nature:科學家通過對97,691個全基因組進行分析揭示了誘發克隆性...
    2020年10月19日 訊 /生物谷BIOON/ --近日,一項刊登在國際雜誌Nature上題為「Inherited causes of clonal haematopoiesis in 97,691 whole genomes」的研究報告中,來自麻省總醫院等機構的科學家們通過對97,691名個體機體的全基因組進行分析揭示了誘發克隆性造血(clonal
  • ...691個全基因組進行分析揭示了誘發克隆性造血過程的遺傳性原因!
    2020年10月19日 訊 /生物谷BIOON/ --近日,一項刊登在國際雜誌Nature上題為「Inherited causes of clonal haematopoiesis in 97,691 whole genomes」的研究報告中,來自麻省總醫院等機構的科學家們通過對97,691名個體機體的全基因組進行分析揭示了誘發克隆性造血(clonal haematopoiesis
  • Nat Genet:科學家發現癌症基因激活的新原則
    近日,一項刊登在國際雜誌Nature Genetics上的研究報告中,來自瑞典卡羅琳學院的研究人員通過研究發現了一種新型機制,其或能揭示驅動癌症過度活躍的典型驅動子,相關研究結果有望幫助研究人員開發新型抗癌療法。
  • 手機plus是什麼意思 蘋果手機plus版和原版有什麼區別【圖文】
    蘋果 手機一直以來都是手機界的翹楚,其他手機品牌也就只能夠望其項背,蘋果手機一直以來都是有一個系列的,但是自從蘋果手機傳到第六代的時候,就發生了一點點的改變,那就是plus,蘋果6手機推出了一款全新手機蘋果6 plus,繼蘋果手機推出了蘋果6 plus以後,其他手機品牌也紛紛開始模仿複製,各種plus都出現了。
  • 【科技前沿】Genome Biology | 朱冰課題組揭示增強子的活性需要多...
    美國加州大學聖地牙哥分校任冰實驗室利用染色質免疫沉澱技術(ChIP)分析了多種組蛋白修飾在基因組上的分布,最早將特定的組蛋白修飾與啟動子和增強子等重要的功能元件聯繫起來【2,3】。隨後,MIT的Rudolf Jaenisch實驗室發現利用H3K27乙醯化修飾(H3K27ac)可以有效地區分活躍增強子和非活躍的增強子【4】。