作者:小柯生命
「DNA元件百科全書」(ENCyclopedia of DNA Elements,ENCODE)國際合作計劃於2003年啟動,合作團隊由美國國立人類基因組研究所(NHGRI)組織成立,致力於繪製人類與小鼠基因組功能性元件的綜合圖譜。
北京時間2020年7月29日晚23時,ENCODE計劃發布第三階段成果,公布了超過120萬個人類與小鼠體內調控基因的候選功能性元件。
《自然》、《自然—方法》和《自然—通訊》聯合發表14篇論文描述了這一結果,為基因組組織和功能帶來了新的認知。
在《自然》發表的一篇概述性文章中,美國麻省大學醫學院教授翁志萍和同事描述了在ENCODE前兩個階段上擴展增加的近6000項新實驗(4834項涉及人類樣本,1158項涉及小鼠樣本)。
之前幾個階段的大部分研究使用的都是模型細胞系,而第三階段包含了超過1369個生物樣本來源的503種細胞或組織類型。
根據ENCODE已經繪製出的數百萬個元件,研究人員還建立了一個在線註冊庫,裡面包含了926535個人類的和339815個小鼠的候選順式調節元件(調節基因轉錄的非編碼DNA區域),覆蓋到各自基因組的7.9%和3.4%。
合集中的其他論文利用ENCODE的數據集揭示了決定部分功能性元件作用方式的原理。
例如,美國史丹福大學教授Michael Snyder和同事繪製了24種人類細胞類型內染色質(DNA與蛋白的複合物)的相互作用,發現不同細胞間的染色質環狀結構差異會影響基因表達。
研究人員還通過小鼠研究了順式調節元件在產前哺乳動物發育中的調節作用。《自然》發表的三篇論文報導了胎鼠在八大發育階段的具體信息。
其中兩篇論文裡,美國加州大學聖地牙哥分校教授任兵和同事以及美國索爾克生物研究所教授Joseph Ecker和同事表明,與小鼠發育期間特定組織中有活性的部分增強子元件(能增強基因轉錄的調節DNA序列)同源的人類元件,存在疾病相關性遺傳突變的富集。
這些結果或為探索與人類發育障礙相關的調節元件打下了基礎。
《自然》同時發表的一篇的「觀點」文章中,Michael Snyder和同事指出,控制基因組調控和功能的元件密集編碼在人類基因組中。
不過,雖然發現了大量這類元件,許多影響特定細胞類型或狀態的元件依然有待鑑定。
在ENCODE的第四階段,大量工作將用來拓展所分析的細胞類型和組織。
附:14篇論文標題及連結
1,Expanded encyclopaedias of DNA elements in the human and mouse genomes
https://www.nature.com/articles/s41586-020-2493-4
2,Perspectives on ENCODE
https://www.nature.com/articles/s41586-020-2449-8
3,A large-scale binding and functional map of human RNA-binding proteins
https://www.nature.com/articles/s41586-020-2077-3
4,Landscape of cohesin-mediated chromatin loops in the human genome
https://www.nature.com/articles/s41586-020-2151-x
5,Occupancy maps of 208 chromatinassociated proteins in one human cell type
https://www.nature.com/articles/s41586-020-2023-4
6,An atlas of dynamic chromatin landscapes in mouse fetal development
https://www.nature.com/articles/s41586-020-2093-3
7,Spatiotemporal DNA methylome dynamics of the developing mouse fetus
https://www.nature.com/articles/s41586-020-2119-x
8,The changing mouse embryo transcriptome at whole tissue and single-cell resolution
https://www.nature.com/articles/s41586-020-2536-x
9,Global reference mapping of human transcription factor footprints
https://www.nature.com/articles/s41586-020-2528-x
10,Index and biological spectrum of human DNase I hypersensitive sites
https://www.nature.com/articles/s41586-020-2559-3
11,An integrative ENCODE resource for cancer genomics
https://www.nature.com/articles/s41467-020-14743-w
12,Transcriptional activity and strain-specific history of mouse pseudogenes
https://www.nature.com/articles/s41467-020-17157-w
13,Detecting sample swaps in diverse NGS data types using linkage disequilibrium
https://www.nature.com/articles/s41467-020-17453-5
14,Supervised enhancer prediction with epigenetic-pattern recognition and targeted validation
https://www.nature.com/articles/s41592-020-0907-8