斑馬魚是生物醫學研究中重要的模式脊椎動物。由於它70%的蛋白質編碼基因與人類同源而且有著透明快速的體外胚胎發育, 所以科學家們經常用它來研究早期發育和各種疾病, 比如白血病、多種實體瘤以及阿爾茨海默氏病。可是現有的斑馬魚的基因組功能性研究多局限於對整個胚胎的研究,斑馬魚組織特異性的基因組功能元件系統圖譜和基因組三維結構仍然亟待揭示。
從進化上說,斑馬魚的祖先與人類祖先在4億年前「分道揚鑣」,其歷經的差異進化時間遠長於小鼠與人類的一億年的差異進化時間。對斑馬魚基因組的功能元件以及基因組三維結構的注釋,也將為研究從低等脊椎動物到高等脊椎動物基因組功能性序列進化進化提供寶貴的數據。斑馬魚的基因組功能元件與人的功能元件在進化中產生了什麼差異?斑馬魚的基因組三維結構與人的基因組結構相比有哪些相似的地方?什麼因素可能影響基因組的進化?斑馬魚的第四號染色體被推測為性染色體,但斑馬魚的性別決定基因一直是個未解之謎,主要因為四號染色體有大量的重複序列,所以現有的參考基因組(reference genome)在此染色體處的組裝不甚準確。我們可否通過現代測序手段組裝一個更為精確的四號染色體?
2020年11月25日,來自美國西北大學的Duane and Susan Burnham講席教授和癌症組學中心主任嶽峰課題組在Nature上發表題為A map of cis-regulatory elements and 3D genome structures in zebrafish(斑馬魚順式調控元件圖譜和基因組三維結構)的研究論文,第一次系統研究並展示了Tubingen 品系斑馬魚11個成年組織和2個胚胎組織的組織特異性轉錄組、順式調控元件圖譜、異染色質圖譜、DNA甲基化圖譜和成魚的基因組三維結構。通過與小鼠和人的功能元件的比較,該研究組發現了進化上保守的和物種特異的序列和調控網絡;並且發現進化上的基因組斷裂位點富集在拓撲相關結構域(topologically associating domains, TADs)的邊界位置,且這種富集與更強的H3K4me3信號和CTCF結合有關。利用最新的10x,Nanopore 三代測序,以及Bionano 光學圖譜測序技術,嶽峰課題組還重新組裝了Tubingen斑馬魚的四號染色體,為研究斑馬魚的性別決定基因和機制提供了重要資源。

在研究中,嶽峰研究組用RNA-seq和H3K4me3信號預測了8311個以前未被定義過的轉錄物,其中3739個為可能的蛋白質編碼基因。通過ChIP-seq (H3K27ac和H3K4me3)和ATAC-seq定義了可能的啟動子和增強子,其中有40.9%的啟動子和62.5%的增強子首次在斑馬魚中被定義。絕大多數增強子(71.3%)顯示出組織特異性,並且與對組織特異性發揮重要作用的基因相關。值得一提的是,用GFP報告基因來驗證預測的增強子在體內的活性,在被測試的32個組織特異性增強子中,有87.5% (28個)的增強子在斑馬魚胚胎中顯示出相應的組織特異信號。為了繪製斑馬魚大腦更為精細的順式作用元件圖譜,該研究組利用最新的單細胞測序技術(sing-cell ATAC-seq), 展示了25種細胞類型在成年斑馬魚大腦中單細胞染色質開放圖譜(chromosome accessibility),並揭示了每種類型細胞中起重要作用的轉錄因子。在對異染色質和DNA甲基化的研究中,該研究組發現H3K9me3和H3K9me2在同一組織中的分布重合很少,並有重複序列元件SINEs的富集。相對於其他組織,精巢的CpG甲基化程度更高,而大腦的CAC三核苷的甲基化水平明顯高於其餘組織。同時該研究組用三節點網絡(three-node networks)的方法比較斑馬魚與人的組織特異性調控網絡,發現在同樣的組織中,斑馬魚和人具有十分相似的調控模式,說明了用斑馬魚研究人類轉錄因子調控網絡的價值。
為了研究染色質的三維結構,該研究組利用Hi-C技術繪製了成年魚大腦和骨骼肌的高解析度基因組三維結構。通過比較,發現了組織特異的A/B compartment以及組織特異的染色質相互作用環(chromatin loops),這些空間結構的差異與相應的組織特異性基因表達相關。除了CTCF的結合,組織特異性的轉錄因子在組織特異的相互作用(loops)中發揮作用。
這篇文章另外一個有意思的發現是作者們報導基因組斷裂位點絕大多數位於TADs的邊界位置,很少有位於TADs中間的。為了找出可能對TADs保守性產生影響的因素,該研究組首先把TADs分為兩類:中間含有進化斷裂位點的TADs和中間不含有進化斷裂位點的TADs。結果,他們發現,中間不含斷裂位點的TADs內部總體上顯示出更強的相互作用,暗示其內部結構更為緊緻。這些不含斷裂位點的TADs中的基因表達與同源的人的TADs中的基因表達更為相關,暗示了TADs的穩定和基因表達保守性之間的關聯。接著,該研究組又把TADs邊界分為了兩類:不含進化斷裂位點的邊界和含有進化斷裂位點的邊界,然後研究不同組蛋白修飾以及轉錄在不同TADs邊界中的分布特點。他們發現,含有斷裂位點的TADs邊界富集了更強的H3K4me3信號;比起不含CTCF結合位點的TADs邊界,那些含有CTCF結合位點和進化斷裂位點的TADs邊界有更高的轉錄活性。這些分析暗示了,H3K4me3信號強弱,有無CTCF的結合和轉錄活性的高低均可能對TADs邊界的穩定性和基因組進化產生影響。
圖註:TADs內部相互作用的強弱;TADs邊界H3K4me3信號的強弱,有無CTCF的結合和轉錄活性的高低均可能對TADs穩定性和基因組進化產生影響
最後,為了重新組裝四號染色體,該研究組利用Nanopore、10X Genomics和Bionano等長片段測序技術,並結合Hi-C數據,成功重新組裝了該染色體。用新的四號染色體序列重新處理Hi-C數據,結果顯示,之前提示序列結構異常的信號大部分消失。新組裝的4號染色體將為研究斑馬魚性別決定和其上其餘重要基因提供重要的支持。
綜上所述,該研究報導了目前為止對斑馬魚基因組最為詳盡的注釋,發現了斑馬魚和人類之間保守和差異的基因調控網絡和基因組結構。該研究數據的廣度和深度為今後在斑馬魚中的基因功能研究和人類疾病研究提供了豐富的數據源和基因組基礎。
據悉,美國西北大學的嶽峰教授為本文的通訊作者,實驗室的研究助理教授楊紅波、博士後欒宇和劉婷婷為本文的共同第一作者。合作實驗室包括賓夕法尼亞大學州立大學醫學院的Keith C. Cheng課題組、聖路易斯華盛頓大學的王艇課題組和賓夕法尼亞兒童醫院的王凱課題組。嶽峰課題組的Yanli Wang、 王曉濤和張博參與了共同研究,王艇課題組的Hyung Joo Lee和王凱課題組的方力對本文做出了重要貢獻。
原文連結:
https://www.nature.com/articles/s41586-020-2962-9