青鱂(Oryzias latipes)是一種重要的脊椎動物模型,已經在遺傳學、發育生物學以及環境科學等領域廣泛應用。目前,青鱂已有高質量的基因組序列,以及大量可用的遺傳學技術手段。然而,目前的青鱂基因組注釋主要是基於生物信息學預測和短讀長的轉錄組測序數據,仍然存在很多問題。低質量的基因組注釋是利用青鱂作為模式動物進行組學和系統生物學研究的重要障礙。
近日,中國科學院遺傳與發育生物學研究所研究員屠強團隊和日本國家基礎生物學研究所教授Kiyoshi Naruse團隊合作,用PacBio轉錄組測序、Illumina轉錄組測序以及ATAC-seq這三種組學實驗手段獲得了青鱂胚胎發育過程中的轉錄及調控動態圖譜。整合這些數據,研究者獲得了準確全面的基因注釋信息,其中包括17000個新轉錄本、1600個轉錄因子、1100個長鏈非編碼RNA和150000個候選順式調控元件。此外,利用時間序列數據提供的基因表達動態圖譜,研究人員發現了一批在胚胎發育中出現轉錄本異構體轉換的基因;利用基因調控動態圖譜,研究人員發現了順式調控元件之間有同步、抑制、增強子轉換、提前開放四種調控邏輯,而在反式調控元件方面,發現了一批早期胚胎發育中的先鋒轉錄因子。該研究首次獲得了全面的青鱂胚胎發育多組學數據集。研究人員將這三種組學技術組合命名為「ENCODE最小工具箱」,對於很多缺乏組學數據的物種來說,這個技術組合應該作為首選的組學分析工具,對相關領域都有重要參考意義。
另外,團隊開發了青鱂組學數據門戶網站,提供該研究獲得的以及已發表的相關數據供研究人員使用。該網站提供了上百組學數據,來自於多種組學技術以及多個胚胎發育階段或成體組織等樣品,還提供了大量功能注釋信息和表達定量數據。
該成果以Dynamic Transcriptional and Chromatin Accessibility Landscape of Medaka Embryogenesis為題發表於Genome Research上。屠強研究組博士研究生李瑩姝和劉勇傑為該論文共同第一作者,屠強和Kiyoshi Naruse為該論文共同通訊作者。該研究得到國家自然科學基金和中科院戰略性先導科技專項的資助。
圖:青鱂胚胎發育的多組學研究。(a) 改善了的青鱂基因組注釋。(b) 順式調控邏輯:同步、抑制、增強子轉換、提前開放。(c) 反式調控邏輯:早期胚胎發育中的先鋒轉錄因子。(d) 青鱂組學數據門戶網站。
來源:中國科學院遺傳與發育生物學研究所