差異基因富集分析及作圖

2021-02-21 簡生信

前面介紹了怎麼分析差異基因,那麼肯定需要對差異基因進行功能富集分析,今天simplify老師來給大家介紹一下怎麼做差異基因富集分析。

 

這裡利用KOBAS 3.0進行富集分析,這個軟體使用起來很簡單,幾乎看一眼就會,而且它3.0版本2019年進行了更新,裡面收錄的資料庫也比較全比較新。

1、進入網站

http://kobas.cbi.pku.edu.cn/kobas3/genelist/

2、選擇物種(人或小鼠)

3、把差異基因gene symbol複製粘貼進去,這裡可以提供多種ID

4、選擇用來富集的庫,可以直選KEGG一個庫,選多個庫的話富集結果會有很多重複的功能項目。建議pathway和GO分開運行分析,這樣便於區分和後面的作圖。

5、點擊run提交,等待一會會出現下面界面

6、點擊download下載結果文件

7、結果表格如下

8、利用R畫氣泡圖

注意:前面導出的文件開頭和末尾會有一些#注釋的行和空行,記得先去掉再保存。另外Term前面的#取掉。表頭的input number改成gene_number,P-Value改成PValue,Corrected pvalue改成Qvalue。要不然後面讀取文件會報錯。

在這裡我將ptahway和GO富集的修改後的文件分別命名為:pathway_enrichment.txt和GO_enrichment.txt,方便後面腳本讀入。

繪圖代碼如下,直接複製粘貼另存為enrichment_plot.R:

library(ggplot2)
kegg = read.table("pathway_enrichment.txt",header=TRUE,sep="\t",check.names = FALSE)kegg = kegg[1:30,]
g = ggplot(kegg,aes(-1*log10(PValue),Term))+geom_point(aes(size=gene_number,color=-1*log10(Qvalue)))g = g+scale_color_gradient(low="blue",high ="red")g = g+labs(color=expression(-log[10](Qvalue)),size="Genes",x="-log[10]Pvalue",y="Pathway",title="Pathway enrichment")ggsave("pathway_inrichment.pdf", width=6, height=6)
go = read.table("GO_enrichment.txt",header=TRUE,sep="\t",check.names = FALSE)go = go[1:30,]
g = ggplot(go,aes(-1*log10(PValue),Term))+geom_point(aes(size=gene_number,color=-1*log10(Qvalue)))g = g+scale_color_gradient(low="blue",high ="red")g = g+labs(size="Genes",x="-log10(Pvalue)",y="GO term",title="GO enrichment")ggsave("GO_inrichment.pdf", width=7, height=6)

最後直接運行代碼:

Rscript enrichment_plot.R

9、富集結果

Pathway富集結果

GO富集結果

今天就分析到這了,下期繼續。

往期精彩

轉錄組系列分析(一):一行命令完成RNAseq差異分析+畫圖

轉錄組系列分析(二):一行命令完成RNAseq數據標記重要基因

轉錄組系列分析(三):如何利用網絡圖給自己轉錄組數據的文章添彩

相關焦點

  • 除了火山圖,差異表達基因還可以這樣展示
    轉錄組分析中,計算了兩組間差異表達的基因後,通常怎樣表示?提到散點圖,常見的還有另一種展示差異表達基因的樣式:橫縱坐標軸可分別代表兩組基因表達均值,這種風格可以更方便直觀對比基因在兩組中的差異狀態。(備註:若無法成功打開連結,請切換到電腦端網頁點擊下載)示例文件「gene_diff.txt」是一組基因差異表達分析結果,記錄了處理組(treat)和對照組(control)間表達顯著不一致的基因,鑑定標準為p<0.01以及|log2 Fold Change|≥1。
  • GSEA富集分析知多少……
    要弄懂GSEA,還是要追根溯源,看GSEA的首發文章- 《Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles》利用傳統的實驗方法,我們最經典的套路是找到不同組中的差異表達基因,然後將這些差異表達基因富集到具有相似功能的基因集中,
  • webgestalt:基因富集分析的在線工具
    在組學數據分析中,基因富集分析是最常用的方法之一,所有的基因數據分析最終都要落實到功能上去,富集分析作為一種最基礎的功能研究方法,通過go, kegg pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。
  • 基因通路富集分析方法大總結
    一般是高通量實驗,如基因晶片,RNA-Seq,蛋白質組學(質譜結果)的後續步驟。常見的就是GO功能注釋和KEGG通路富集分析。通過基因通路富集分析,我們可以初步分析基因可能參與的生物學過程或者信號通路。下面將手把手為大家介紹6種常用的基因富集通路分析方法,總有一款適合你!
  • GSEA富集分析圖講解
    GSEA分析也是功能分析的一種,GSEA的結果圖想必大家也不陌生,接下來就讓小編帶大家畫一下炫酷的基因集富集分析圖吧~GSEA富集分析可以用GO的基因集也可以用KEGG的基因集,今天來看一下GSEA-KEGG分析首先加載相關的R包###########加載library(topGO)library(enrichplot)library
  • metascape: 最強大的基因富集分析在線工具
    metascape是一個web工具,提供了基因富集分析,蛋白質互作網絡分析等多種功能,對應的文章發表在nature communications上, 連結如下https://www.nature.com/articles/s41467-019-09234-6網址如下
  • 科研工具篇|Webgestalt在線基因富集分析
    在生物信息學數據分析當中,基因富集分析是最常用的方法之一。通過go、kegg、pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。今天為大家介紹一款在線基因富集分析工具Webgestalt,其操作簡便,支持多種富集分析算法,而且涵蓋的功能注釋資料庫較為全面。接下來,就讓我帶大家來一探究竟吧!
  • 一個看似簡單的需求--修改富集分析的dotplot圖
    問題由來我們一般進行富集分析,一般的做法都是:# 先得到上調的差異基因gs_up,可以先不進行pvalue、qvalue的過濾up <- enrichGO(gene          = gs_up,               keyType       = 'ENSEMBL',               OrgDb
  • 差異基因表達分析(上)
    細胞特異性的基因;發育階段特異性的基因;疾病狀態相關的基因;環境相關的基因;…基本方法就是以生物學意義的方式計算基因表達量,然後通過統計學分析表達量尋找具有統計學顯著性差異的基因,從而分析方法尋找差異表達基因有三種方式:第一種是計算
  • 這個函數支持差異基因富集分析,也...
    做富集分析,有幾個通路其實本質上是同一條,想精簡富集的結果,怎麼辦?如果你用clusterProfiler做富集分析,一行代碼就能搞定精簡的問題。今天小丫用clusterProfiler做GSEA,也想精簡。於是?
  • 如何做GO和KEGG富集分析(GSEA)?
    我們做完RNA-seq差異基因表達分析後,一個頭疼的問題就是如何完成GO和KEGG的富集分析。
  • 這個函數支持差異基因富集分析,也支持GSEA
    做富集分析,有幾個通路其實本質上是同一條,想精簡富集的結果,怎麼辦?如果你用clusterProfiler做富集分析,一行代碼就能搞定精簡的問題。今天小丫用clusterProfiler做GSEA,也想精簡。於是?
  • 功能富集分析、基因ID轉換、查找同源基因、SNP注釋一站式服務
    1、GO 功能富集分析功能富集分析包括:Gene ontology, biological pathways, regulatory motifs in DNA, protein databases, human phenotype ontology進入網址:https://biit.cs.ut.ee
  • ...屠強研究組開發Decode-seq方法顯著提高差異表達基因分析的準確性
    鑑定差異表達基因是許多生物醫學研究項目的基礎步驟,利用轉錄組進行差異表達(Differential Expression, DE)分析是目前最主流的方法,得到了廣泛應用。例如,兩個常用於轉錄組DE分析的算法 edgeR 和 DESeq2 已經被引用了超過上萬次。
  • 單基因生信分析2--下遊分析
    前期小王子已經更過單基因生信分析--差異分析&生存分析,今天,小王子跟大家一起學習如何進行下遊挖掘,也就是本期主打的單基因下遊富集通路,以下以
  • GSVA + limma進行差異通路分析
    一般我們做GSEA都是先進行差異基因分析,然後取差異倍數排序結果進行GSEA
  • 差異基因分析方法——p-value
    點擊關注基迪奧,立即漲姿勢~上周,我們分享了用RPKM值計算差異基因的方法,這周我們繼續分享另外一種方法
  • 3*差異分析方法和可視化方法匯總
    這次我們推出的課程更加側重於分析技能和技巧的講解,相信客戶能夠更好的進行復現和重複。2、所涉及的代碼操作,參數全部外置,客戶可以不用讀懂代碼也可以操作。4、所有的課程都提供demo數據測試,並經過了內部審核。Limma、RankRrod、Deseq2、edgeR、t-test。
  • ChIP-Seq數據挖掘系列-3: Motif 分析(3) - 利用ChIP-Seq結果在基因組區域中尋找富集的Motifs
    findMotifsGenome.pl: 在基因組區域中尋找富集Motifs
  • 集美貌與才華於一身,這款在線作圖神器用過的都說好
    掃描下方二維碼免費領取☟☟☟你曾經為作圖而苦惱嗎?