甲基化的一些基礎知識

2021-02-08 生信技能樹

前面我們系統性的總結了circRNA的相關背景知識:

同樣的策略,我們也可以應用到其它領域的知識背景快速學習,比如我們的lncRNA系列,miRNA系列,現在我們一起學習一下DNA甲基化吧。

值得注意的是,因為我本人在DNA甲基化領域接觸到的項目很少,而生信技能樹約9成的教程是我寫的,所以DNA甲基化相關教程不多,我檢索了一下,目錄如下,但其實只有那個文獻閱讀出自我手!

首先甲基化是表觀修飾的一種

所以首先需要搞清楚什麼是表觀修飾,表觀遺傳學,以及為什麼關注DNA甲基化這其中一種表觀修飾!

表觀遺傳修飾是指對基因組功能的相關修飾,通過一系列生物學修飾改變基因的活性而不是DNA的核苷酸序列影響基因的表達。對基因組功能的相關修飾主要包括對DNA、RNA、以及組蛋白等的修飾,這些修飾改變了染色質的局部電化學特性和構象,從而調節基因的轉錄活性。

其中對組蛋白修飾主要是究方法通常是chip-seq技術,我們已經在生信技能樹發布了系統性的chip-seq教程,這裡就不再贅述。組蛋白是染色質的重要組成部分,主要分為H2A、H2B、H3、H4,與DNA纏繞可形成核小體。組蛋白修飾是在組蛋白N末端的胺基酸殘基上發生的共價修飾,主要包括甲基化、乙醯化、泛素化、磷酸化、羰基化、糖基化等。值得一提的是chip-seq其實也可以應用於轉錄因子研究,這裡也不展開介紹,大家可以看下面推文:

DNA甲基化是表觀遺傳學領域一個重要的研究方向,真核生物中最常見的DNA修飾非5-甲基胞嘧啶(5mC)莫屬了,然而在原核生物中最常見的DNA修飾方式則為N6-methyladenine (6mA),即腺嘌呤第6位氮原子甲基化修飾。

人類是真核生物,所以當然是5mC的DNA甲基化形式的檢測咯。人的參考基因組約30億鹼基,上面不到1%是 CpG位點,可以被甲基化,也就是說不到3千萬個 CpG 位點。這些 CpG 位點中,大約 60~80% 被甲基化。主要是而啟動子等特殊區域存在 未被甲基化的CpG 島,那些區域的CpG 位點比較富集。目前研究表明,腫瘤細胞的甲基化水平平均是低於正常細胞的。

亞硫酸鹽是甲基化探測的「金標準」,不管是晶片或者甲基化測序,都要先對DNA樣品進行亞硫酸鹽處理,使非甲基化的C變成U,而甲基化的C保持不變,從而在後續的測序或者雜交後區分出來。

DNA甲基化檢測手段

關於DNA甲基化檢測手段介紹,我覺得Make Decision: DNA甲基化檢測方法,哪一款適合你? 寫的就足夠好了。同樣的,早期研究以晶片為主,從成本的角度來看,也是晶片為主,但是測序數據更豐富。

甲基化晶片

可選的甲基化晶片產品就少很多,絕大部分是illumina公司產品的,從27K到450K到850K甲基化晶片。比較好的介紹是:Illumina  琪先生  2018-07-17的 一文了解 MethylationEPIC 850K 甲基化晶片

Infinium MethylationEPIC BeadChip晶片包含了原先的Infinium Methylation450 BeadChip晶片90%以上的內容,這種選擇可提供一種廣泛、全面的甲基化組圖譜。而且還靶定了ENCODE計劃中確定為潛在增強子的區域,還有FANTOM5計劃在各種組織類型中確定出的增強子。詳細如下:

●   CpG島以外的CpG位點
●   人類幹細胞中鑑定出的非CpG甲基化位點(CHH位點)
●   腫瘤相對於正常(多種形式的癌症)及一些組織類型的差異甲基化位點
●   FANTOM5增強子
●   ENCODE開放染色質和增強子
●   DNase超甲基化位點
●   miRNA啟動子區域
●   Illumina HumanMethylation450 BeadChip晶片中90%以上的位點

Infinium MethylationEPIC BeadChip晶片的數據分析是由GenomeStudio Methylation Module模塊所支持,讓研究人員能夠對小規模研究開展差異甲基化分析。GenomeStudio軟體2011.1版特有高級可視化工具,讓研究人員能夠在單幅圖中查看大量的數據,如熱圖、散點圖和線圖

甲基化測序

甲基化檢測方法多達上百種,哪怕是基於NGS的測序技術,也有BS-Seq、MeDIP-Seq、RRBS-Seq、WGBS、MBD-Seq、SMRT 等,我發現 何聰聰  諾禾科服  2016-09-10 介紹的比較齊全,摘抄送給大家,原文在:DNA甲基化研究方法速遞

WGBS(Whole Genome Bisulfite Sequence)全基因組甲基化測序,利用重亞硫酸氫鹽使DNA中未發生甲基化的胞嘧啶(C)脫氨基轉變成尿嘧啶(U),而甲基化的胞嘧啶保持不變,然後通過PCR將U變為A,僅有甲基化的C可以成功保留,最後通過測序就可判斷CpG位點是否發生甲基化。

簡化甲基化測序 (Reduced representation bisulfite sequencing, RRBS)是一種準確、高效、經濟的DNA甲基化研究方法,通過酶切 (Msp I) 富集啟動子及CpG島區域,並進行Bisulfite測序,同時實現DNA甲基化狀態檢測的高解析度和測序數據的高利用率。作為一種高性價比的甲基化研究方法,簡化甲基化測序在大規模臨床樣本的研究中具有廣泛的應用前景。

oxBS-Seq(oxidativ ebisulfite sequencing)化學氧化結合重亞硫酸鹽測序,在哺乳動物中,5mC 可以在TET酶的作用下轉換成 5hmC,而傳統的 WGBS 方法不能區分 5mC 和 5hmC。oxBS-Seq 技術先將 5hmC 氧化為甲醯基修飾(5fC),進而被重亞硫酸鹽處理轉換為U,從而排除了 5hmC 的幹擾,實現 DNA 甲基化的精準檢測。

RRHP(Reduced Representation 5-Hydroxymethylcytosine Profiling)DNA 羥甲基化,即 DNA 甲基化中的5-甲基胞嘧啶易發生氧化形成5-羥甲基胞嘧啶。Msp I 酶切完之後,末端修復,加上接頭,然後 β-GT 反應將 5hmC 進行糖基化保護,無法被 Msp I 酶識別;然後進行再次酶切,與常規的 C 以及 5mC 相連的 P5 接頭均被切下來,最後僅有含 5hmC 的片段含有兩端接頭,可以被擴增後建庫測序。

MeDIP(Methylated DNA Immunoprecipitation Sequencing) 甲基化 DNA 免疫共沉澱測序,先通過與5mC特異性結合的抗體加入到變性的基因組DNA片段中,富集胞嘧啶甲基化的基因組片斷,然後對富集的片段進行高通量測序。

我們我們介紹甲基化測序數據的一般分析流程的時候,主要是針對WGBS技術的數據。

改進版甲基化測序

BS-Seq(亞硫酸氫鹽測序)有兩個缺點:

針對這兩個缺陷,科研界一直在嘗試研發改進方法。

復旦大學於文強教授團隊開發出了一種新的全基因組檢測的方法 GPS。該方法利用 T4DNA 聚合酶的 3′-5′外切酶活性和 5′-3′聚合酶活性,使得雙端測序的一端是基因組原序列,另一端是轉化後的表觀序列。該方法極大提高了比對效率和準確性。

低通量的DNA甲基化檢測

當然了,也是可以用低通量手段,專注特異性位點甲基化檢測,有:

甲基化特異性 PCR

亞硫酸氫鹽測序 PCR

焦磷酸測序

質譜檢測

比如發表在BMC Med. 2009 Oct 的文章Genomic and epigenetic evidence for oxytocin receptor deficiency in autism.裡面Gregory等研究者通過亞硫酸氫鹽測序的方法對119例ASD患者和119名健康人進行了DNA甲基化分析,分析了與調節OXTR表達相關的CPG在外周血和顳葉皮質的甲基化水平,發現ASD患者的CPG甲基化水平在外周血和顳葉皮質均較健康人明顯升高。這個研究裡面的bisulfite sequencing (BSS)就是低通量,僅僅是關注感興趣的基因而已:

We carried out bisulfite sequencing (BSS) analysis of cloned alleles of two OXTR CpG islands in the peripheral blood mononuclear cells (PBMCs) of all four family members

DNA甲基化的生物學意義

生物學意義,通常是建議大家看教科書吧,DNA甲基化是最早被發現的表觀遺傳修飾途徑之一,參與許多重要的細胞過程,如基因組印記、X染色體滅活、轉錄抑制、胚胎發育等,與精神分裂症、Rett症候群、腫瘤等多種疾病的發生和發展密切相關。

尤其是我感興趣的腫瘤中普遍存在DNA甲基化狀態的改變,其特點是總體甲基化水平的降低與局部甲基化水平的升高。在腫瘤細胞中,癌基因處於低甲基化狀態而被激活,抑癌基因處於高甲基化狀態而被抑制。

腫瘤領域前景廣大

比如:DNA甲基化與腫瘤風險預測

再比如:DNA甲基化推進腦腫瘤的精準分型

植物學也有研究報導

隨便微信公眾號搜索了一下,發現大豆,柑橘,小麥,花菜都有報導,如下:

中國科學院遺傳與發育生物學研究所田誌喜研究組等研究組對包括9個野生種、12個農家種和24個栽培種在內的45個大豆品種進行了全基因組甲基化測序及分析,發現從野生種到農家種的馴化過程和從農家種到栽培種的改良過程中分別鑑定到4248個和1164個DNA甲基化水平發生變化的差異甲基化區間(Differentially Methylated Regions,DMRs)。發表於Genome Biology雜誌(DOI:10.1186/s13059-018-1516-z)

植物生理生態研究所上海植物逆境生物學研究中心郎曌博研究組題為Global increase in DNA methylation during orange fruit development and ripening 的研究論文,該研究揭示了DNA甲基化在柑橘果實成熟過程中的調控作用。該研究通過整合分析五個成熟時期柑橘全基因組DNA甲基化和轉錄組數據(A),發現柑橘成熟過程中DNA甲基化明顯上升,這種變化與番茄成熟過程DNA甲基化水平下降呈相反的變化趨勢。

2015年發表在genome biology上的一篇關於小麥基因組甲基化的研究。文章的題目是「A genome-wide survey of DNA methylation in hexaploid wheat」,從萌發後7天的中國春幼苗中提取基因組總DNA,其中三個在12℃生長,三個在27℃生長。基因組DNA富集,亞硫酸氫鹽處理,測序,使用Bismark映射到參考序列。

BMC Plant Biology在線發表了南開大學生命科學學院王春國課題組題為「Transcriptomeand DNA methylome reveal insights into yield  heterosis in the curds ofbroccoli(Brassica oleracea L var. italic)」的論文。該論文發現了不同表達基因、DNA甲基化修飾在花球產量雜種性狀形成中的調控過程和可能作用。這些發現為花椰菜花球產量雜種優勢研究提供了全面的視角,對選育高產花椰菜品種具有重要意義。

還有番茄,玉米的研究,大家自行檢索深入學習哦。

當然,更值得一讀的是2018年5月,Nature Reviews Molecular Cell Biology 發表的中國科學院上海植物逆境生物學研究中心朱健康研究員、張惠明研究員與郎曌博研究員共同完成的題為「Dynamics and function of DNA methylation in plants」的綜述文章。 系統的討論了植物中DNA甲基化過程。

表觀修飾相關的酶通常是藥物開發重點

人體內,DNA甲基轉移酶主要有四種:DNMT1、DNMT3A、DNMT3B和DNMT3L。

在DNA複製完成後,DNMT1是催化甲基轉移至新合成的DNA鏈上,這一現象稱為維持甲基化

DNMT3A和DNMT3B負責催化核酸鏈上新的甲基化位點發生反應,稱為形成甲基化

DNMT3L不具有甲級轉移酶活性,其主要作用是調節其他甲基轉移酶的活性。

因為藥物研發也不是我的領域,這裡略~~~

五大甲基化公共資料庫

隨著高通量生物技術(晶片、測序技術)的不斷更新發展,高通量的DNA甲基化數據不斷湧現,一些大型國際合作的生物大數據計劃產生了Pb(petabyte)數量級的甲基化譜。由多個國家和地區的研究機構組成的「國際人類表觀基因組同盟」(International Human Epigenome Consortium,簡稱IHEC)為了研究與人類健康和包括癌症在內的複雜疾病相關的細胞狀態產出了超過1000個表觀基因組的數據

由美國NIH資助的「表觀組學線圖計劃」 (Roadmap Epigenomics Mapping Consortium,簡稱Roadmap)產出了367個人類主要組織和細胞類型的DNA甲基化圖譜

歐洲「血液表觀基因組項目」(BLUEPRINT of Haematopoietic Epigenomes,簡稱BLUEPRINT)產出了與人類複雜疾病相關的82個不同血液細胞的DNA甲基化圖譜。

「DNA元件百科全書」計劃(The Encyclopedia of DNA Elements,簡稱ENCODE)是繼"人類基因組計劃"後又一大型國際合作項目,來自世界各國32個研究機構對206個人類不同的細胞系和組織進行了DNA甲基化水平的測定。

「國際癌症基因組聯盟」(The International Cancer Genome Consortium,簡稱ICGC,旨在從基因組、表觀基因組和轉錄組等多維數據層面研究癌症的發生和發展,ICGC產出了涉及27種常見癌症的9000多個樣本的DNA甲基化數據,

美國癌症基因組圖集(The Cancer Genome Atlas,簡稱TCGA)旨在從基因組、表觀基因組和轉錄組等多維數據層面研究癌症的發生和發展,TCGA產出了涉及34種癌症類型的10000多個樣本的DNA甲基化數據,並且保留了癌症患者詳細的臨床數據資料,為生存分析提供了大量的數據資源。

相關焦點

  • 學習筆記:抑鬱與甲基化
    ,有很多非常不錯的,我就筆記的形式記錄了下來,文章主體分為上課的具體內容與我的感悟與收穫,這篇文章主要講甲基化對人的一些影響,文章內容主要是筆記形式,內容僅供大家參考。正常的甲基化是健康的重要一環,所謂甲基化,簡單地說,就是一種物質給另一種物質提供甲基基團(-CH3)的過程,在這一過程中,甲基基團的提供方被稱為甲基供體。簡單來講,我認為的就是它是人體許多生活反應過程中一個很基礎又重要的過程,許許多多生化反應都需要經歷過這個過程,雖然看似簡單,但是非常重要的環節。
  • 甲基化文獻分享
    微信公眾號:生信小知識關注可了解更多的教程及單細胞知識。
  • ecRNA:決定神經元DNA的甲基化和去甲基化一種特殊的RNA
    DNA甲基化是最常見的一種表觀遺傳學修飾。近年來人們意識到,神經元DNA的甲基化動態與大腦的記憶形成有關,這一過程受到了嚴格的調控。Alabama大學和Purdue大學的研究人員發現,神經元DNA的甲基化和去甲基化取決於一種特殊的RNA,ecRNA(extra-coding RNA)。
  • 甲基化研究綜述
    需要注意的是,本節所講的「DNA甲基化和去甲基化的機制」均為諸多觀點當中的一種觀點,肯定有其不足之處,表觀遺傳學尚處在初步研究階段,隨著人類認知的進步,現行的觀點會被逐漸修改甚至推倒重來。比如上面提到的三種DNMT在甲基化過程中所起到的作用隨著研究的深入也有必要進行一些調整。最新的研究表明,這並不是一個完善的模型。
  • 比較遠古與現代人的甲基化圖譜
    表觀遺傳學調控可改變基因的表達方式,但它並非通過改變基礎的DNA序列,而是通過包括DNA甲基化等過程來影響基因的。科學家們不太知道表觀遺傳學調控是如何隨著時間而變化的,但有可能它的演變凸顯了在遠古與現代人之間的特質差異。
  • 蛋白質的甲基化修飾
    蛋白質甲基化經常與乙醯化並列,因為它們都是常見的表觀遺傳修飾,經常發生在組蛋白上。不過從化學反應的角度來看,乙醯化可以算作一種短鏈脂醯化修飾,這裡主要討論甲基化方面的問題。 蛋白質的甲基化供體是S-腺苷甲硫氨酸(SAM),受體通常是賴氨酸的ε-氨基和精氨酸的胍基。
  • DNA甲基化是什麼?
    在這裡,筆者簡單區分一下一些易於混淆的概念以及介紹一下DNA甲基化發現的歷史。 首先,我們來區分幾個常見概念:DNA甲基化、胞嘧啶甲基化、5mC。 DNA甲基化是指在DNA上添加甲基基團(CH3)。所以在人類、小鼠等相關研究中,能夠見到DNA甲基化和胞嘧啶甲基化(cytosine methylation)的混用。
  • 學一學DNA甲基化晶片分析流程
    TCGA甲基化晶片分析流程梳理總結我學甲基化沒啥目的,只是因為好奇目前DNA甲基化有大量的學習資源,既然工具不需要重複造輪子,那麼整理過很多遍的背景知識也是一樣,以最快吸收為宗旨背景知識很重要脫氧核糖的碳編號與鹼基的碳編號不要搞混DNA(脫氧核糖核酸)的主鏈是由糖+磷酸根重複堆疊而成,在脫氧核糖結構中,將位於氧原子右邊的碳原子定義為1號碳,依次排序直至
  • 甲基化問題的真相
    甲基化問題實際上並不是基因問題,這並不是亞甲基四氫葉酸還原酶(MTHFR, methylenetetrahydrofolate reductase)基因突變,基因突變不會破壞甲基化過程或導致其紊亂。甲基化問題要比這個大的多,而且與現在醫學界了解的完全不同。本文將揭開究竟是什麼導致甲基化問題,以及什麼會導致基因檢測所說的甲基化問題。
  • 導入不含CpG島的DNA讓抵抗甲基化的CpG島發生甲基化
    這種新技術靶向一種最為常見的被稱作DNA甲基化的表觀遺傳變化。DNA甲基化指的是被稱作甲基的化學標記附著到DNA上。通常而言,這些甲基標誌著準備開啟或關閉的基因。科學家們越來越多地了解到DNA甲基化參與眾多生理學過程(包括胚胎發育)和病理學過程(包括生命後期出現的某些疾病,如癌症)。
  • 解析組蛋白氨基末端甲基化分子機制
    NRMT1催化著絲粒組蛋白CENP-A的氨基末端甲基化。   組蛋白甲基化,通常情況下,被認為發生在賴氨酸和精氨酸殘基側鏈上,是一類重要的表觀遺傳修飾密碼,在轉錄調控、染色質高級結構組織及DNA修復等多種過程中發揮重要功能。
  • 我是如何發現850K甲基化晶片和EPIC的區別
    sample1                 NaNsample2                NaN ---後面省略一些樣本Error in if (any(numfail >= SampleCutoff)) { :   missing value where TRUE/FALSE needed
  • DNA甲基化調控m6A甲基化影響番茄果實成熟 | m6A專題
    作為一種動態和可逆的轉錄後修飾,其通過RNA甲基化轉移酶複合物(METTL3、METTL14和WTAP等)獲得,而去除m6A修飾則是由去RNA甲基化酶FTO和ALKBH5介導。在植物中,m6A甲基化的甲基化轉移酶和去甲基化酶最早在模式植物擬南芥中得到鑑定,並發現m6A可以調節幹細胞命運(案例解析:擬南芥m6A甲基化酶FIP37調控莖尖分生組織發育 | m6A專題),成花轉變(案例解析:擬南芥去甲基化酶ALKBH10調控成花轉變 | m6A專題)和毛狀體分枝(案例解析:m6A-YTH組件調控擬南芥葉片發育時間和形態發生 | m6A專題)。
  • JBC:組蛋白甲基化調控研究
    該文章主要報導了人KMT3a複合物在維持體內三甲基化H3K36水平中的作用。真核生物中,DNA的轉錄發生在染色質模板上。染色質的基本單位是由DNA纏繞組蛋白八聚體組成的核小體。核小體及其共價修飾能影響所在DNA的轉錄。組蛋白H3第36位賴氨酸的甲基化(H3K36me)與活躍轉錄的基因相關。
  • M6A(RNA甲基化修飾)課題思路介紹及熱點方向分析
    國家自然基金支持情況既代表國家宏觀層面對學術研究的導向性,也可以反映出當前學術研究的熱點方向,我們以國家自然科學基金中標項目分析m6A甲基化研究。調查發現(圖2)在2009年-2016年間,以m6A甲基化研究的標書年均中標數量在3-6項左右,這一數字在2017年增長為22項,增長近4倍;而2018年,m6A甲基化中標項目激增至65項,比2017年又提高了近3倍;與2016年相比,2018年的增長倍數超過了10倍。
  • 肺癌診斷中的基因甲基化到底是什麼
    簡單來說,基因甲基化就像DNA的一頂最神奇的「帽子」。戴上這頂「帽子」則會封鎖轉錄起始使轉錄過程不能延伸,並且影響轉錄因子與啟動子的結合,從而使得基因沉默。因此低甲基化會激活基因轉錄,而超甲基化則會阻止基因轉錄導致基因沉默。
  • Nat Commun:RNA的甲基化與去甲基化修飾
    DNA和RNA均可通過甲基化修飾,即甲基(CH3)取代基與核苷酸的連接。另外,細菌用含有硫原子的官能團修飾RNA,作為調節蛋白質合成的一種手段。一種這樣的修飾代替胞苷鹼中2位的氧。在大腸桿菌中,Kellner和她的同事現已鑑定出這種改性的含硫鹼的一種以前未知的形式。Kellner說:「在這種情況下,細菌在胞苷的硫基被甲基化。
  • ​iMETHYL:DNA甲基化、 SNP和RNA_seq的多組學聯合資料庫
    全基因組關聯分析(GWAS)可以闡明基因組變異與表型之間的關係,其中CpG二核苷酸的甲基化與常見疾病之間的關係,體現了表觀遺傳調控DNA甲基化的重要性,DNA甲基化資料庫與其他組學數據一起將有助於研究人員深入研究疾病的表觀遺傳機制。iMETHYL是DNA甲基化、 SNP和RNA_seq的多組學聯合資料庫。
  • 生物所系統總結植物RNA胞嘧啶甲基化研究
    ,並對RNA甲基化領域發展方向和作物育種應用提出了展望。表觀遺傳(epigenetics)是指在不改變DNA,RNA或蛋白序列的情況下,發生可遺傳的基因表達變化,參與生長發育、基因表達調控、響應環境信號等多個方面,是生物性狀多樣性的基礎。RNA甲基化作為重要的表觀遺傳修飾類型,在調控RNA翻譯、RNA穩定性等幾乎所有RNA代謝方面扮演重要角色。
  • 醫學院李海濤課題組《基因與發育》發文解析組蛋白氨基末端甲基化...
    醫學院李海濤課題組《基因與發育》發文解析組蛋白氨基末端甲基化分子機制  清華新聞網11月24日電  11月15日,清華大學醫學院李海濤研究組在《基因與發育》(Genes & Development)雜誌發表了題為「NRMT1催化組蛋白氨基末端甲基化的分子機制」(