基因通路富集分析方法大總結

2021-02-15 實驗萬事屋

基因通路富集分析 (gene set pathway enrichment analysis) 是在一組基因或蛋白中找到一類過表達的基因或蛋白。一般是高通量實驗,如基因晶片,RNA-Seq,蛋白質組學(質譜結果)的後續步驟。常見的就是GO功能注釋和KEGG通路富集分析。通過基因通路富集分析,我們可以初步分析基因可能參與的生物學過程或者信號通路。下面將手把手為大家介紹6種常用的基因富集通路分析方法,總有一款適合你!

1.David

 

DAVID是最早也是目前最經典的做富集分析的資料庫,它整合了大量生物學數據和分析工具,為大規模的基因或蛋白列表提供系統綜合的生物功能注釋信息。

 

基因通路富集分析步驟圖解:

第一步:打開網址,點擊Functional Annotation。

第二步:輸入基因集,選擇輸入類型

第三步:選擇物種,查看結果(包括GO和KEGG通路結果)

2.String

 

String資料庫是瑞士蘇黎世大學構建的一個搜尋蛋白質之間相互作用的資料庫。既包括蛋白質之間的直接物理相互作用,也包括蛋白質之間的間接功能相關性。它除了包含有實驗數據、從PubMed摘要中挖掘的結果和綜合其他資料庫數據外,還有利用生物信息學的方法預測的結果。

基因通路富集分析步驟圖解:

第一步:打開網站,輸入基因列表和選擇物種;

第二步:選擇資料庫內對應基因名稱;

第三步:結果下載-包括Go和KEGG通路。(如有需要還可以下載蛋白連接的結果)

4.Kobas 

Kobas是北京大學開發的用於注釋和鑑定富集途徑和疾病的資料庫

 

基因通路富集分析步驟圖解:

第一步:打開網站,選擇Gene-list Enrichment

第二步:選擇輸入類型,物種,輸入基因列表,選擇資料庫,後可分析下載數據。

5.Metascape

Metascape是近年來新興的富集分析數據,數據不僅更新快,其覆蓋面也相當廣泛。從資料庫種類來說,Metascape整合了GO、KEGG、UniProt和DrugBank等多個權威的數據資源,使其不僅能完成通路富集和生物過程注釋,還能做基因相關的蛋白質網絡分析和涉及到的藥物分析,致力於為科研工作者提供每個基因全面而詳細的信息。

基因通路富集分析步驟圖解:

第一步:打開網站,輸入基因,選擇物種,開始分析。

第二步:結果下載-包括GO,KEGG分析結果;蛋白互作連接結果,並且都已經做好了圖,非常美觀。

5.Cytosacpe

Cytoscape是一款圖形化顯示網絡並進行分析和編輯的軟體,Cytoscape還能夠為網絡添加豐富的注釋信息,並且可以利用自身以及第三方開發的大量功能插件,針對網絡問題進行深入分析。

 

基因通路富集分析步驟圖解:

第一步:打開軟體,選擇Apps,點擊App Manager

第二步:安裝Apps。在搜索框輸入clueGo

第三步:點擊Apps的clueGo

第四步:輸入基因,選擇資料庫開始分析。

第五步:將網絡圖結果和Excel結果導出。

6.R

R是用於統計分析、繪圖的語言和操作環境。R是屬於GNU系統的一個自由、免費、原始碼開放的軟體,它是一個用於統計計算和統計製圖的優秀工具。至於使用,需要代碼,建議有興趣的小夥伴可以找找網課學習一下。R語言做出來的結果還是很好看的。

相關焦點

  • GSEA富集分析知多少……
    只關注了表達變化非常顯著的基因,可能會丟失掉其它一些表達變化不顯著但是它在一個通路中的調控作用也很重要的基因。2. 傳統的分析中發現一個差異表達基因集合富集到了某一個通路中,所以推測這些基因和這個通路相關,從而控制表型。但是這些基因在這個通路是如何調控的呢,上調還是下調?這些差異表達基因整體的調控模式是什麼樣的?為了解決上面兩個局限,GSEA方法就可以很好的解決這個問題了。
  • 一文教你如何掌握基因功能(GO)和信號通路(Pathway)分析
    大家在進行差異基因表達分析時,會得到一批顯著差異基因,接下來就需要分析這些基因參與了哪些功能,常見的就是GO功能注釋和KEGG(pathway)通路富集分析。那麼,啥叫GO功能注釋呢?啥是KEGG?作為小白的我真是有點混淆呢!今天就給大家詳細介紹一下GO/KEGG的強大之處!
  • webgestalt:基因富集分析的在線工具
    在組學數據分析中,基因富集分析是最常用的方法之一,所有的基因數據分析最終都要落實到功能上去,富集分析作為一種最基礎的功能研究方法,通過go, kegg pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。
  • 這個只需一步就可做富集分析的網站還未發表就被CNS等引用超過350次
    ://metascape.org/) 是一個功能強大的基因功能注釋分析工具,能幫助用戶將當前流行的生物信息學分析方法應用到批量基因和蛋白質的分析中,以實現對基因或蛋白功能的認知。例如,獲取被歸為以「cancer」作為關鍵字的GO生物過程分類的基因。富集 (Enrichment)——對基因列表的功能富集分析,識別具有統計意義的通路。最新的版本還包括蛋白質網絡分析,可以用來識別和獲取具有緊密連接的蛋白質網絡元件 (如Oct4、Sox2和Nanog網絡)。
  • 差異基因富集分析及作圖
    前面介紹了怎麼分析差異基因,那麼肯定需要對差異基因進行功能富集分析,今天simplify老師來給大家介紹一下怎麼做差異基因富集分析。
  • 科研工具篇|Webgestalt在線基因富集分析
    在生物信息學數據分析當中,基因富集分析是最常用的方法之一。通過go、kegg、pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。今天為大家介紹一款在線基因富集分析工具Webgestalt,其操作簡便,支持多種富集分析算法,而且涵蓋的功能注釋資料庫較為全面。接下來,就讓我帶大家來一探究竟吧!
  • GSVA + limma進行差異通路分析
    一般我們做GSEA都是先進行差異基因分析,然後取差異倍數排序結果進行GSEA
  • metascape: 最強大的基因富集分析在線工具
    metascape是一個web工具,提供了基因富集分析,蛋白質互作網絡分析等多種功能,對應的文章發表在nature communications上, 連結如下https://www.nature.com/articles/s41467-019-09234-6網址如下
  • TCGA腫瘤基因譜主要信號通路分析——Cell系列文獻解讀
    為了讓大家更快了解腫瘤中各種主要信號通路及其關係,在2018年6月8日-10日由北京大學腫瘤醫院消化腫瘤內科主辦的CGOG年會中,消化腫瘤內科的章程博士結合團隊研究成果和科研業界最新動態,進行了題為「TCGA腫瘤基因譜主要信號通路分析——Cell系列文獻解讀」的精彩報告,為與會專家分享了TCGA團隊最新發表於Cell系列期刊的關鍵研究成果。
  • 百邁客雲平臺——助您輕鬆搞定GO、KEGG富集圖繪製
    GO、KEGG分類富集圖繪製工具對給定的基因集結合注釋信息繪製GO分類富集圖、KEGG分類富集及通路富集圖。GO分類富集圖是通過對基因進行GO terms 富集度統計學的分析,計算出基因的P_value和Corrected_P-value,定位基因最可能相關的GO term。
  • 單基因生信分析2--下遊分析
    前期小王子已經更過單基因生信分析--差異分析&生存分析,今天,小王子跟大家一起學習如何進行下遊挖掘,也就是本期主打的單基因下遊富集通路,以下以
  • GSEA富集分析圖講解
    GSEA分析也是功能分析的一種,GSEA的結果圖想必大家也不陌生,接下來就讓小編帶大家畫一下炫酷的基因集富集分析圖吧~GSEA富集分析可以用GO的基因集也可以用KEGG的基因集,今天來看一下GSEA-KEGG分析首先加載相關的R包###########加載library(topGO)library(enrichplot)library
  • Nature Plants|多組學數據系統分析擬南芥茉莉酸信號通路
    首先,通過ChIP-Seq技術對全基因組範圍內MYC2/ MYC3的結合位點進行檢測,發現分別有6736個和3982個高可信度的DNA結合位點,分別對應與6178個和4092個靶基因(佔擬南芥基因組23.2%),其中有3847個基因是兩者所共有,通過對此部分基因進行分析發現主要富集在JA和其他激素相關的GO terms上,主要涉及DNA結合和轉錄調控功能。
  • 這個函數支持差異基因富集分析,也...
    做富集分析,有幾個通路其實本質上是同一條,想精簡富集的結果,怎麼辦?如果你用clusterProfiler做富集分析,一行代碼就能搞定精簡的問題。今天小丫用clusterProfiler做GSEA,也想精簡。於是?
  • GWAS+WGCNA分析——挖掘微效位點新思路
    因為這些基因屬於相關的通路或功能,所以它們微弱的效應能夠在某個功能/通路上產生協同累加效應,最終表現出個體表型的多樣性。如果我們以單個基因作為單位進行關聯分析的話,單個基因的顯著性往往很低,難以有效檢測。但如果以整個代謝通路/功能類型作為單位進行關聯以及富集分析,則更容易檢測到這些基因的聯合效應。由於以上1~3的策略,需要通過提高檢測的成本來達到提高檢測功效。
  • 腫瘤基因檢測中不可忽視的細節
    雖然基於 Poly (A) 抓捕的全轉錄組檢測方法看似可以提供相對全面的結果,但是如果捕獲效率和檢測靈敏度不夠高的話,則大部分重要生物學信號可能都會被丟失。 假如我們把上圖的基因數目總結成以下表格,就可以看到高表達的基因在全部兩萬多個基因總數中只佔不到 3%。而中度表達的基因數目稍為超過 10%,而接近 90% 的基因表達量屬於低表達範圍。
  • 這個函數支持差異基因富集分析,也支持GSEA
    做富集分析,有幾個通路其實本質上是同一條,想精簡富集的結果,怎麼辦?如果你用clusterProfiler做富集分析,一行代碼就能搞定精簡的問題。今天小丫用clusterProfiler做GSEA,也想精簡。於是?
  • 文獻解讀︱單靠數據挖掘做生信分析也能發6分SCI(免費領取軟體大...
    -19患者肺組織和外周血單核細胞(PBMC)樣本基因表達的影響,通過差異表達基因分析確定與新冠病毒感染相關的重要通路,再應用WGCNA分析方法進一步確定與新冠肺炎患者的臨床特徵呈高相關性的基因模塊,最後採取三種先進手段預測潛在治療藥物。
  • 功能富集分析、基因ID轉換、查找同源基因、SNP注釋一站式服務
    1、GO 功能富集分析功能富集分析包括:Gene ontology, biological pathways, regulatory motifs in DNA, protein databases, human phenotype ontology進入網址:https://biit.cs.ut.ee
  • 兩對小麥分櫱近等基因系的lncRNA鑑定分析
    前人研究發現,lncRNA-LRK Antisense Intergenic RNA可影響富亮氨酸重複受體激酶基因簇,從而影響水稻分櫱和產量(Wang et al. 2018)。該研究揭示了此前所忽視的長鏈非編碼RNA在分櫱和產量調控方面的重要作用;但由於小麥中特異分櫱材料缺乏、基因組龐大複雜,其分櫱調控lncRNA的發掘工作大受制約、鮮見報導。