在生物信息學數據分析當中,基因富集分析是最常用的方法之一。通過go、kegg、pathway等不同的基因功能注釋資料庫,再結合對應的富集分析算法,可以探究輸入的基因富集在哪些功能上。今天為大家介紹一款在線基因富集分析工具Webgestalt,其操作簡便,支持多種富集分析算法,而且涵蓋的功能注釋資料庫較為全面。接下來,就讓我帶大家來一探究竟吧!
Webgestalt最新版的官網:http://www.webgestalt.org/;1.選擇目標物種:Webgestalt提供12個物種及Others可以選擇。
2.選擇富集方法:Webgestalt支持Over-representation Enrichment Analysis(ORA)、Gene Set Enrichment Analysis(GSEA)、Network Topology-based Analysis(NTA)3種富集分析算法。
3.選擇功能資料庫:WebGestalt提供8個常用資料庫可以選擇。如果用戶從選擇目標生物體的菜單中選擇了Others,用戶需要上傳功能資料庫、相應的基因和參考基因。
4.上傳或粘貼基因列表:首先選擇對應基因列表的ID類型。如果用戶選擇ORA方法,則用戶可以上傳只有一列的txt文件或將基因列表粘貼到文本框。如果用戶選擇GSEA方法,則用戶應上傳帶有兩列的RNK文件:以制表符分隔的基因ID和分數。
5.上傳參考基因列表:如果選擇ORA方法,需要上傳參考基因列表,用戶需要從下拉菜單中選擇參考基因列表,例如基因組或許多微陣列平臺,或者選擇ID類型並上傳自定義的txt文件。GSEA方法不需要參考基因列表。
6.高級參數設置:如設置Maximum Number of Genes for a Category(類別的最小基因數)將刪除大小於此數字的類別。類別大小是基於類別中注釋的基因和用於ORA方法的參考基因列表(或用於GSEA方法的分級基因列表)之間的重疊基因的數量來計算的;設置Maximum Number of Genes for a Category(類別的最大基因數)將刪除大小大於此數字的類別;Significance Level(顯著性水平)參數有兩個選項:FDR意味著將根據FDR(偽發現率)閾值識別富集類別,而Top意味著將基於FDR排序富集類別。
結果展示:
— — — — — — —END — — — — — — —