在組學數據分析中,基因富集分析是最常用的方法之一,所有的基因數據分析最終都要落實到功能上去,富集分析作為一種最基礎的功能研究方法,通過go, kegg pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。
富集分析的必要性和重要性不言而喻,有很多的成熟的軟體可以來進行這樣的分析,比如clusterProfiler, GSEA等等,然而這些工具的使用還是具備一定的門檻,對於沒有編程經驗的生物學家而言通過這些軟體得到富集分析的結果並不是一件容易的事情。
為了方便廣大科研工作者進行富集分析,有很多的在線工具被開發出來,其操作簡便,更易上手,最著名的當屬DAVID這個網站了,有接近4000次的引用。然而該網站數據更新並不及時,在現在看來,其資料庫版本過於老舊,而且不支持一些新出的功能注釋資料庫。
webgestalt是一個專注於富集分析的在線網站,支持多種富集分析算法,而且涵蓋的功能注釋資料庫較為全面,在今年5月份剛剛升級了版本,對資料庫進行了更新。對應的文章發表在Nucleic Acids Research上,連結如下
https://academic.oup.com/nar/article/47/W1/W199/5494758
網址如下
http://www.webgestalt.org
支持12個物種,324種基因ID格式,功能注釋不僅包括了常見的go,kegg, 還涵蓋了蛋白質相互作用,miRNA靶基因,疾病注釋,藥物靶點等各種注釋信息。支持3種富集分析算法
Overrepresentation Enrichment AnalysisORA
Gene Set Enrichment Analysis(GSEA)
Network Topology-based Analysis(NTA)
官網提供了3種算法的示例,通過示例數據可以快速掌握其用法,無論哪種富集算法,基本上都分以下兩個部分
基本參數指定物種,富集分析的算法,對應的功能注釋資料庫,輸入的基因列表,背景基因列表等信息,示意如下
高級參數用於對輸出結果的過濾,不同富集算法對應的參數列表也稍有不同,ORA算法的參數示意如下
設置好對應參數,直接點擊submit
按鈕,提交即可。不同富集算法和資料庫,結果展示也不盡相同,但是基本的表格數據, 柱狀圖,GSEA的富集圖片等結果都是有的,幾種常見的結果示意如下
webgestalt通過滑鼠點擊就可以輕鬆實現各種富集分析,而且資料庫更新的也非常及時,如果需要進行富集分析,該網站絕對值得推薦和使用。
·end·