metascape: 最強大的基因富集分析在線工具

2020-10-18 生信修煉手冊

metascape是一個web工具,提供了基因富集分析,蛋白質互作網絡分析等多種功能,對應的文章發表在nature communications上, 連結如下

https://www.nature.com/articles/s41467-019-09234-6

網址如下

http://metascape.org/gp/index.html#/main/step1

該網站集成了40多個基因功能注釋資料庫,並且提供了多樣化的可視化方式,對於生物學家而言,通過該網站可以輕鬆的對基因功能進行探索和分析,目前已有451篇文章引用了該工具,其可視化方式如下所示

1. circos plot

2. Enrichment Bar Graph

3. Enrichment Heatmap

4. Enrichment Network

5. Protein Complex Network

6. Membership Pie Chart

集成的功能注釋資料庫如下所示

如上圖所示,利用這些功能注釋的資料庫,主要進行以下幾種分析

  1. ID  Conversion

  2. Gene Annotation

  3. Enrichment Analysis

  4. Interaction Network Analysis

對於單個基因列表,默認進行富集分析和PP分析,如下所示,輸入基因列表,選定物種, 然後點擊Express Analysis即可

結果包含以下兩種

1. 富集分析的柱狀圖

默認使用GO, KEGG, Reactome, CORUM等多個資料庫進行富集分析,結果如下所示

用柱狀圖的形式展示top15個顯著富集的terms, 示意如下

用網絡圖的形式展示富集到的terms之間的關係,示意如下

2. PPI分析

提供了蛋白質相互作用網絡圖,並採用MCODE算法對PPI網絡進行聚類,識別其中的subnetwork,即潛在的蛋白複合體,結果示意如下

如果同時輸入多個基因,還額外提供下兩種可視化方式,第一種是多個富集結果的展示,用熱圖的形式進行展示,示意如下

第二種是輸入的多個基因集之間的overlap分析,結果用circos圖來展示,兩個區域之間的lnks連線代表了對應的overlap,結果示意如下

metascape集成的資料庫最多,而且更新的也非常及時。通過自定義分析,可以實現多個資料庫的功能分析。該資料庫目前支持人,小鼠,大鼠等10個物種的基因分析,是一個非常強大的基因功能分析工具。

·end·

相關焦點

  • webgestalt:基因富集分析的在線工具
    在組學數據分析中,基因富集分析是最常用的方法之一,所有的基因數據分析最終都要落實到功能上去,富集分析作為一種最基礎的功能研究方法,通過go, kegg pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。
  • 科研工具篇|Webgestalt在線基因富集分析
    在生物信息學數據分析當中,基因富集分析是最常用的方法之一。通過go、kegg、pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。今天為大家介紹一款在線基因富集分析工具Webgestalt,其操作簡便,支持多種富集分析算法,而且涵蓋的功能注釋資料庫較為全面。接下來,就讓我帶大家來一探究竟吧!
  • 這個只需一步就可做富集分析的網站還未發表就被CNS等引用超過350次
    ://metascape.org/) 是一個功能強大的基因功能注釋分析工具,能幫助用戶將當前流行的生物信息學分析方法應用到批量基因和蛋白質的分析中,以實現對基因或蛋白功能的認知。可惜現實是目前大家常使用富集分析工具中僅有40%被正常維護,不知讀者目前使用的工具是否屬於幸運的一類。Metascape每月更新背後的40多個資料庫,以確保提供最準確的結果。Metascape沒有學習使用的壁壘,因為沒有比一鍵Express Analysis更簡單了。雖然好用,Metascape實現的主要功能卻是不折不扣。
  • 基因通路富集分析方法大總結
    一般是高通量實驗,如基因晶片,RNA-Seq,蛋白質組學(質譜結果)的後續步驟。常見的就是GO功能注釋和KEGG通路富集分析。通過基因通路富集分析,我們可以初步分析基因可能參與的生物學過程或者信號通路。下面將手把手為大家介紹6種常用的基因富集通路分析方法,總有一款適合你!
  • 差異基因富集分析及作圖
    前面介紹了怎麼分析差異基因,那麼肯定需要對差異基因進行功能富集分析,今天simplify老師來給大家介紹一下怎麼做差異基因富集分析。
  • MEME:motif分析的綜合性工具
    MEME是一個motif分析的工具箱,提供了多種相關工具,網址如下http://meme-suite.org/index.html根據分析目的和功能,將相關工具劃分成了以下4大類別1.Motif Enrichment這部分工具用於分析已知的motif在輸入序列上的富集情況,包含的工具列表如下CentriMoAMESpaMoGOMo常見的應用場景是根據ATAC_seq的peak序列,分析在這些序列中出現富集的已知
  • GSEA富集分析知多少……
    要弄懂GSEA,還是要追根溯源,看GSEA的首發文章- 《Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles》利用傳統的實驗方法,我們最經典的套路是找到不同組中的差異表達基因,然後將這些差異表達基因富集到具有相似功能的基因集中,
  • 48個實用的生信在線工具強烈推薦,不看是你的損失!
    在線工具一般具有「功能強大、操作簡單、無需安裝、用完就走」的特點,輕鬆實現「用別人的伺服器分析自己的數據」。基因結構繪製1.Exon-Intron Graphic Maker工具連結:RNA二級結構2.Mfold工具連結:3.RNAfold工具連結:http://rna.tbi.univie.ac.at
  • 功能富集分析、基因ID轉換、查找同源基因、SNP注釋一站式服務
    看文獻的時候,發現了g:Profiler這個寶藏工具,測試了一下,使用起來超級方便、好用,一定要分享給大家
  • 工具篇丨三大經典在線生存分析工具測評(含教程)
    大師姐在此實名推薦3個在線生存分析神器,同時也是在腫瘤相關文獻中出現率非常高的生存分析工具:GEPIA、Kaplan-Meier Plotter、OncoLnc。多數時候,一個GEPIA可以搞定絕大多數的生存分析需求。但缺點也很明顯:不能自動選取最優Cutoff值(以至於手動嘗試時,常常找不到結果最顯著的分組策略);不能限制研究截止年限(比如只關注患者五年生存期時);不能對特定人種、性別、指定病理分期等的預後情況進行分析等。
  • 一文教你如何掌握基因功能(GO)和信號通路(Pathway)分析
    大家在進行差異基因表達分析時,會得到一批顯著差異基因,接下來就需要分析這些基因參與了哪些功能,常見的就是GO功能注釋和KEGG(pathway)通路富集分析。那麼,啥叫GO功能注釋呢?啥是KEGG?作為小白的我真是有點混淆呢!今天就給大家詳細介紹一下GO/KEGG的強大之處!
  • GSEA富集分析圖講解
    GSEA分析也是功能分析的一種,GSEA的結果圖想必大家也不陌生,接下來就讓小編帶大家畫一下炫酷的基因集富集分析圖吧~GSEA富集分析可以用GO的基因集也可以用KEGG的基因集,今天來看一下GSEA-KEGG分析首先加載相關的R包###########加載library(topGO)library(enrichplot)library
  • 【工具】LEfSe分析在線做
    該網站可以進行16s一些分析,具體的分析工具如上圖的右手邊所示,相當是一個雲平臺。分析如下圖。B、LDA分析 點擊B) LDA Effect Size (LEfSe)就會對數據進行在線的LDA分析,如下圖:
  • 科學網—小小的線粒體與強大的基因測序技術
    「線粒體夏娃」 線粒體擁有自己的遺傳物質,即線粒體DNA(mtDNA),也叫線粒體基因組,多數是環狀結構,少數是線型結構。因物種的不同,線粒體基因組的大小也不相同,一般植物細胞中最大,也更複雜,100~2500 鹼基對(kb);動物細胞中比較小,約為10~39千個kb;哺乳動物的最小,約為16.5kb。
  • 靶基因預測分析已上線
    為此我們特地推出在線靶基因預測雲分析,幫老師排憂解難!(雲平臺地址:https://www.omicstudio.cn/analysis/target_gene/create?analysis_id=4)該工具選用認知度較高的動物靶標預測軟體(Targetscan和Miranda)及植物靶標預測軟體(PsRobot),提供我司靶標預測庫供老師選擇,僅需上傳需預測的miRNA序列(15-26nt)即可一鍵分析,方便快捷。當然,它還不止有這些功能,接下來由我簡單介紹下該工具。
  • 百邁客雲平臺——助您輕鬆搞定GO、KEGG富集圖繪製
    GO、KEGG分類富集圖繪製工具對給定的基因集結合注釋信息繪製GO分類富集圖、KEGG分類富集及通路富集圖。GO分類富集圖是通過對基因進行GO terms 富集度統計學的分析,計算出基因的P_value和Corrected_P-value,定位基因最可能相關的GO term。
  • ATAC-Seq Motif 富集分析
    峰注釋能夠提供峰可能影響的基因和功能區域,但這不夠直接解釋開放區域的作用機制。開放區域可能被轉錄因子結合從而調控了基因的表達,轉錄因子結合的特定序列稱之為 motif, 結合的位點稱為 TFBS(TF binding sites),轉錄因子可以允許 TFBS 有一定的可塑性(variations/flexible),所以 motif 序列不完全是固定死的。
  • 小麥基因定位與基因組研究平臺構建
    近日,中國農業科學院作物科學研究所(以下簡稱作科所)小麥基因資源發掘與利用創新團隊牽頭構建了小麥基因定位與基因組研究平臺-WheatGmap(https://www.wheatgmap.org),為高效克隆小麥功能基因提供了一個有效的數據利用、分析和共享平臺。近日,相關研究成果在線發表於《分子植物》。
  • 泛癌全基因數據分析工具推薦:UCSC XENA
    前兩天我們介紹了一下剛剛發表的泛癌的全基因組在線數據工具匯總的文章。同時也介紹了一下關於ICGC的使用,在那個文章裡面提到了五個在線分析PCAWG的工具,今天就來介紹另外一個:UCSC XENA。  UCSC XENA簡介  之前我們在很多帖子裡面都提到了。
  • 《科學》:借力人工智慧 科學家開發出更強大的基因載體
    腺病毒會感染多種脊椎動物,這其中也包括人類,會誘發人類的上呼吸道感染,而AAV非常特別,目前的科學界共識是它不會導致任何人類疾病,也是目前人類發現的一類結構最簡單的單鏈DNA缺陷型病毒,正是因為其DNA結構上的缺陷,在沒有輔助病毒的參與下(典型的如腺病毒、單純皰疹病毒等),AAV無法引發病毒感染。這樣的特性讓AAV成為了科學家眼中最為理想的基因載體。