北京時間2020年8月31日晚23時,美國費城兒童醫院和賓夕法尼亞大學醫學院的Gerd Blobel教授,其實驗室的張帝(Di Zhang),和他們的合作者在Nature Genetics上發表了題為Alteration of genome folding via contact domain boundary insertion的論文,報導了通過運用一系列基因組編輯技術來改變基因組三維摺疊,構建新的亞微米結構,並剖析邊界DNA元件和不同基因組環境間相互作用的發現。
哺乳動物基因組DNA的線性距離可長達~2米,而包含其的細胞核僅有幾微米寬。之所以DNA可被壓縮106(兆)倍進而儲藏於細胞核中,是因為基因組在三維空間中經過錯綜複雜的摺疊和組織。
三維基因組學(3D genomics/genome architecture)研究的焦點之一是在亞微米(sub-micrometer)及其對應的兆鹼基(megabase)/亞兆鹼基(sub-megabase)量級上結構和功能間的聯繫。
這些結構是由高通量染色質構象捕獲技術(ahigh-throughput, genome-wide version of chromosome conformation capture: Hi-C)描述的,可大致分為(如圖):
1. 染色質區室化 (compartmentalization):傳統上被認為是兆鹼基量級上開放的(轉錄活躍)染色質(open chromatin: A compartment)和封閉的(轉錄不活躍)染色質(closed chromatin: B compartment)。屬於同種區室的染色質區域相互接觸,而異種區室間相互隔開。因而在Hi-C熱圖(heatmap)上顯現格子狀(plaid)的圖案。
2. 拓撲結構域(topologically associated domain, TAD)或接觸結構域(contact domain): 兆鹼基-亞兆鹼基級別,結構域內的染色質傾向於相互接觸,而屬於兩個不同結構域染色質之間的跨邊界(domain boundary)接觸相對稀少。Hi-C熱圖上對應沿對角線上的三角/正方形。
異常的結構域組織可涉及發育障礙,肢體畸形和癌症等疾病。精確的結構域組織一定程度上取決於架構因子(architectural factors),其中被詳盡研究的是一個多功能轉錄因子:CCCTC結合因子(CCCTC binding factor, CTCF)和黏連蛋白或粘合素(cohesin)。
事實上,一個主要解釋染色質結構域形成的理論:環擠壓模型(loop extrusion model)認為粘合素沿著染色質進行擠壓,形成逐漸增大的環狀結構,待其遇到一對呈會聚去向(convergently oriented)的CTCF而停滯。這一對CTCF和cohesin也因而一起劃定結構域的邊界(domain boundary)。
但值得一提的是,不是所有CTCF都處於結構域的邊界,而且同樣處於結構域邊界的還有不少其他基因組特徵(genomic features),比如轉錄起始位點(transcription start site: TSS)。目前不少描述性研究把一些基因組特徵與其處於相同位置的結構域邊界大致關聯(correlation)起來。
然而,一些重要的因果機制(causation)問題還是沒有得到徹底的解答。到底哪些DNA元件是形成結構域邊界的必要和充分(對於後者的研究更少)條件?如果一個DNA元件在其原本的基因組位點上可以劃定結構域邊界,當它被放置於另一個基因組環境(genomic context)時,是否還能形成結構域邊界?形成結構域邊界的功能是怎麼編碼入DNA元件的,而有多大程度又被該元件周圍的基因組環境所調節?
在一個近乎單倍體的人類細胞系中,張帝和他們的合作者先運用人工轉座子(artificial transposon)把一段2千鹼基位於結構域邊界的DNA--其包含一個CTCF結合位點(CTCF binding site: CBS)和一個轉錄起始位點(TSS)--隨機插入11個染色體共16個基因組位點。接著通過Hi-C來同時測量這同一個DNA元件怎樣在不同基因組環境下影響染色質的空間架構。隨後,作者更深入地用CRISPR解析了CTCF結合位點和轉錄起始位點各自以及共同地對於基因組摺疊的功效。
文章主要結論
1. 通過篩選具有多個基因組位點被同時編輯的單細胞克隆,可實現一輪基因組編輯結合Hi-C對多個編輯位點的多重架構測定。
2. 該CBS-TSS元件在至少4個不同位點形成了新的接觸結構域,造成了染色質區室轉換,劃分了新的邊界,或者形成了新的反映環擠壓的Hi-C表型(結構條紋:architectural stripes)。這個發現證明一個2千鹼基(kb)的DNA元件可以用來改變其周圍千兆鹼基(10 Mbp)量級染色質的空間架構。
3. 該元件當插入本已存在的結構域邊界時,可進一步加強邊界。
4. 該元件在若干個位點沒有導致明顯的結構域水平上的變化,但深入探究後發現該元件還是造成了結構域內部的細微調整。巧合的是這些位點本已經有著相當複雜的架構格局。
5. 在一個該元件的插入位點,是轉錄起始位點--而不是CTCF結合位點--負責形成了新的接觸結構域。而在另一位點,轉錄起始位點和CTCF結合位點分工施加了染色質近距離和遠距離摺疊的偏好。這個發現對於理解基因組上眾多共定位(co-localized)的CTCF和TSS對於基因組架構的功效會有一定啟發。
6. 一系列CRISPR基因剖析表明,在這個2 kb的元件中,指示染色質摺疊的信息大部分編碼於其中 ~100 bp匯集了CTCF結合位點和轉錄起始位點的區間內。兩者其一或同時存在都會對附近基因組的cohesin結合水平有影響,暗示染色質區室化(compartmentalization)和環擠壓(loop extrusion)兩種模式也許並不是兩種相互獨立的過程。
有意思的是,這個2 kb邊界元件在其原生位點(endogenous locus)被刪除後,兩個臨界結構域並沒有出現明顯融合,而是邊界被微調到了旁邊另一個具有CTCF結合位點和轉錄起始位點的位置。這也進而意味著架構上的效應是由編碼了指示基因組摺疊信息的邊界元件和其周圍基因組環境(genomic context)共同決定的。
到底高等動物基因組的三維結構是如何在進化中形成新的結構域或是增添結構上的冗餘(redundancy)或穩定性,還有待進一步研究。
總之,本文通過大量基因組編輯和多重架構測定展示了用短DNA片段來塑造三維基因組的可行性,並解開了結構域邊界元件中CTCF和轉錄在不同基因組環境下對於染色質摺疊的功效。
本文通訊作者為費城兒童醫院與賓夕法尼亞大學醫學院的Gerd A. Blobel MD, PhD, Frank E. Weise III Professor of Pediatrics, 第一作者和共同通訊作者為費城兒童醫院及賓夕法尼亞大學醫學院博士學生張帝。合作者包括賓州州立大學Ross C. Hardison, PhD的團隊,以及賓夕法尼亞大學Jennifer Philips-Cremins, PhD的團隊成員。(來源:科學網)
相關論文信息:https://doi.org/10.1038/s41588-020-0680-8