掃描下方二維碼免費領取☟☟☟
大家好,我是巧巧,今天給大家帶來的一篇文獻是Integrative analysis of DNA methylation and gene expression identified cervical cancer-specific diagnostic biomarkers,一篇關於DNA甲基化標誌物與宮頸癌相關的文獻,發表於 Signal Transduction and Targeted Therapy雜誌,影響因子13.493。
今天在這篇文章是想和大家嘮叨一下腫瘤中差異基因與甲基化改變的關係,甚至可聯合高度甲基化伴表達降低的基因標誌物來區分正常和宮頸癌患者,從而達到篩選可靠的新型基因標誌物的目的。
本文的數據來源是Illumina 人450K甲基化晶片和來自TCGA的RNA-seq數據,數據類型是DNA,研究對象是宮頸癌患者。
簡單看一下摘要可以發現,作者做了啟動子甲基化與基因表達的局部調控的關係,基因甲基化與基因表達水平的相關性以及免疫組織化學評估篩選出來的標記基因在宮頸癌與正常組織中蛋白質水平表達情況。
此外,作者還做了TCGA數據的交叉驗證4種甲基化標誌物cg07211381(RAB3C),cg12205729(GABRA2),cg20708961(ZNF257)和cg26490054(SLC5A8)作為診斷標誌物的敏感性與特異性,使用GEO資料庫的四個獨立驗證集做了ROC模型評估這四個甲基化標誌物的可靠性。
首先,我們概覽一下本文的數據要點,從結果呈現來看,本文包含5張figure。
Fig. 1 The DNA methylation landscape of cervical carcinoma.縱覽宮頸癌中DNA甲基化情況。這是靠的部分。
Fig. 2 The number of hypo- and hyper-methylated CpGs and genes.使用測序分析結果觀測低甲基化與高度甲基化的基因數量。這是挑的部分。
Fig. 3 Integrative analysis of DNA methylation and gene expression.整合分析DNA甲基化與基因表達的關係。這是挑和圈的部分。
Fig. 4 Identification of cervical cancer-specific biomarkers.鑑定宮頸癌中腫瘤特異性標誌物。這可以認為是靠和聯的部分。
Fig. 5 GABRA2, SLC5A8, and ZNF257 are weakly expressed in human cervical squamous cell carcinoma (CSCC). 驗證多個宮頸上皮細胞癌中的標誌物的表達。這是組織水平的驗證。
下面我們來詳細解讀一下這篇文獻的數據論證要點和觀點。
▲ Fig. 1 The DNA methylation landscape of cervical carcinoma.縱覽宮頸癌中DNA甲基化情況
首先,作者通過熱圖與柱狀圖來展示了用於分析的宮頸癌的樣本信息。顯示熱圖中,作者先根據甲基化水平將組織樣本分為3簇,即CIMP low(CpG島低甲基化),CIMP intermediate(CpG島中等甲基化),CIMP high(CpG島高度甲基化)(fig 1A-B)。
此外,作者感染的HPV類型,HPV感染狀態,腫瘤病理類型進一步觀察樣本情況,發現三個臨床特徵,包括組織學(p-value = 3.794e–09),HPV狀態(p-value = 0.007229,發現HPV和HPV種類(p值= 7.954e–06)與這三個簇相關(fig1D-E)。
大多數腺癌富集在CIMP高簇中,而我們可以在圖中看出CIMP低表達和CIMP中間組則有更多的鱗狀細胞癌(fig 1C)。腺鱗癌僅在低CIMP組中發現。CIMP高和CIMP中間組織中的所有患者均被人乳頭瘤病毒(HPV)感染,而未感染HPV的患者則分布在CIMP低組中(圖1D)。HPV A7類型富含CIMP低甲基化簇,而CIMP高甲基化簇組中的大多數樣品都被HPV A9感染(圖1E)
▲ Fig. 2 The number of hypo- and hyper-methylated CpGs and genes.分析測序分析結果觀測低甲基化與高度甲基化的基因數量
作者在113個正常和307個腫瘤樣本檢測甲基化情況,發現46,040個CpG島甲基化程度改變,包含29,730個高甲基化的CpG和16,235個低甲基化的CpG。然後觀測不同基因組中功能區域的甲基化分布情況,包括啟動子,CpG島(CGI)和CGI啟動子區域中,分別有7851、17515和4539位點觀察到高甲基化增加(fig 2A)。
然後作者也做了對比N-Shore,N-Self,S-Shore,S-Self,CpG島的甲基化的比例情況,發現CpG島的甲基化率最高(95%)(fig 2B)。
檢測基因周圍的位點表明,在3'UTR中低甲基化率較高,而在轉錄起始位點(TSS)附近的區域如TSS200,TSS1500、5'UTR,第一外顯子和基因體的高甲基化率較高(fig 2C)。
觀察CpG島改變對應的基因數量,也就是差異甲基化基因(DMGs),可發現在整個基因組中,低甲基化基因的數量高於高甲基化基因的數量,而在功能基因組區域中,高甲基化基因的數量增加了(fig 2D)。文中,作者提到在69個正常和304個腫瘤樣品之間進行差異表達分析,總共檢測到4949個差異表達基因(DEG),其中3096個上調基因和1853個下調基因。
▲ Fig. 3 Integrative analysis of DNA methylation and gene expression.整合分析DNA甲基化與基因表達的關係
首先作者根據甲基化差異水平與基因差異倍數來區分腫瘤中的基因表達改變,將基因分為四類:高甲基化表達上調(hyper-up),高甲基化表達下調(hyper-down),低甲基化表達上調(hypo-up)和低甲基化表達下調(hypo-down)的基因組(fig 3A)。
然後是韋恩圖取交集,觀察以上四組的具體數量。作者在文中描述:在2096個高甲基化基因中,123個基因被上調,601個基因被下調。在1800個低甲基化基因中,165個基因被上調,203個基因被下調(fig 3B)。
接著通過對高度甲基化伴基因表達降低的基因進行GO與KEGG富集分析檢測這些基因主要涉及的生物學過程包括化學突觸傳遞,通過質膜粘附分子的嗜性細胞粘附,神經系統發育,穀氨酸受體信號傳導途徑和鉀離子跨膜轉運的基因;主要的通路含神經活性配體-受體相互作用,晝夜節律夾帶,鈣信號傳導,細胞粘附分子和逆行內源性大麻素信號傳導(fig 3C)。
通過pearson矯正相關性分析可發現,CpG基因對中88%基因顯示出顯著的負相關(fig 3D)。
最後通過相關性的熱圖,來說明差異表達和甲基化基因中的相關性,來說明高甲基化基因的啟動子甲基化更可能與基因表達負相關,而低甲基化基因的啟動子甲基化更可能與基因表達正相關(fig 3E)。
▲ Fig. 4 Identification of cervical cancer-specific biomarkers.鑑定宮頸癌中腫瘤特異性標誌物
作者在差異甲基化與差異表達基因取交集後獲得3582個基因,進一步篩選去除其他11種類型的癌症中鑑定出的2194個差異甲基化的基因,最終得到388個宮頸癌中同時差異甲基化和差異表達的基因,並對TCGA,GSE38266,GSE46306和GSE68339的樣本進行了層次聚類(fig 4A),然後基於信息增益和順序向後特徵選擇(SBFS)的混合特徵選擇和logistic回歸方法來進一步過濾候選標記,最後,鑑定了四種宮頸癌差異甲基化特異性標記cg07211381,cg12205729,cg20708961和cg26490054;分別對應四個不同的基因:RAB3C(cg07211381),GABRA2(cg12205729),ZNF257(cg20708961)和SLC5A8(cg26490054)。
▲ Fig. 5 GABRA2, SLC5A8, and ZNF257 are weakly expressed in human cervical squamous cell carcinoma (CSCC). 鑑定多個細胞宮頸上皮細胞癌中的標誌物的表達,與基因甲基化水平相互對應
作者用使用免疫組化染色,檢測宮頸癌組織與癌旁組織中GABRA2, SLC5A8,ZNF257和RAB3C的表達情況,並通過H評分來進行評判,發現與前面發現的甲基化水平相反,GABRA2,ZNF257和SLC5A8的過度甲基化與這些基因在宮頸癌中的表達降低相關,而RAB3C的水平在宮頸癌和正常組織之間沒有表達差異。
本文重在通過結合基因的甲基化改變與基因差異表達相互結合來進行挑選宮頸癌中特異性的分子標誌物。在這項研究中,作者分析了來自TCGA的宮頸癌樣品中的DNA甲基化和基因表達譜。DNA甲基化譜圖的無監督聚類分析確定了宮頸癌的三種甲基化亞型,包括CIMP高,CIMP中級和CIMP低。接著使用相關分析結果表明,啟動子甲基化與基因表達的局部調控呈負相關。聯合分析TCGA的宮頸癌的差異表達基因與illumina 450K 甲基化晶片信息,排除其他腫瘤中存在的差異性甲基化基因,接著基於信息增益和SBFS設計一種混合特徵選擇方案,以選擇可靠的甲基化標記,最終確定了四個甲基化標記,分別為cg07211381(RAB3C),cg12205729(GABRA2),cg20708961(ZNF257)和cg26490054(SLC5A8)。並通過其他數據集來驗證說明這四種標記物在區分宮頸腫瘤和正常組織方面具有極高的敏感性和特異性。
另外,這篇文章也給了我們一點提示,可以先用熱圖的方式,來做「靠」(臨床意義)部分(fig1),然後結合生信分析中的「挑」找出差異甲基化與差異表達基因(fig 2-3),通過「圈」和「聯」找出高度甲基化伴低表達基因的功能及其相關性(fig3);接著排除多種腫瘤中差異甲基化的基因,基於信息增益、SBFS和logistic回歸,發現改變最明顯和功能最重要的關鍵基因,最終通過臨床診斷模型和多個數據集、免疫組化等(fig 4-5)方式「乾濕結合」來說明論證的價值和意義所在。
好啦,本次文獻解讀與分享就到這裡啦~
後臺回復「巧巧04」,得今天的文獻原文哦~