小夥伴們大家好呀,今天要為大家介紹的是於2020年9月1日發布的資料庫muTarget(http://www.mutarget.com/),分析實體瘤中基因表達變化和突變狀態的資料庫。
muTarget資料庫:連接實體瘤中基因表達變化和突變狀態的平臺
muTarget介紹
muTarget資料庫主要來自癌症基因組圖譜(TCGA)存儲庫,主要包含200多個癌症標本的實體瘤收集到資料庫中。
muTarget資料庫的分析是基於R v3.5.2統計環境,從而進行數據處理步驟和算法開發。使用MAFtools R Bioconductor程序進行匯總。對於特定於癌症的體細胞突變,使用了突變注釋格式(MAF)文件,該文件已排除了質量低下的信號和最有可能代表種系改變的變體。
根據snpEff為規範轉錄本生成的序列本體將每個突變分為三個功能組,包括「所有突變」,「蛋白質編碼突變」和「破壞性突變」。所有突變組都包括基因的任何改變;蛋白編碼突變組包括那些蛋白編碼序列的突變,包括錯義,同義,移碼,翻譯起始和終止密碼子相關突變;破壞性突變組僅包括那些實際上破壞蛋白質結構的突變,即翻譯起始和終止密碼子相關突變和移碼突變。
對於基因表達,使用了由Illumina HiSeq 2000 RNA Sequencing Version 2平臺生成的原始高通量測序(HTSeq)分析RNA-seq數據。使用基於負二項式分布的「DESeq」軟體包對原始計數數據進行了歸一化處理。應用「AnnotationDbi」包來用基因符號注釋Ensembl轉錄本ID。
下面就讓我們來看看這個資料庫吧……
Home
muTarget的主頁界面非常簡潔,配色也突出重點。主頁的正中間是資料庫的使用方法,可以說是非常人性化了。
Seach
檢索和分析方式分為有2種,一種是同通過突變去檢索相關差異化表達的基因,另一種是通過差異表達基因去檢索相關的基因突變。詳細的描述和檢索方式為:
第一種:通過「Genotype」分析,可以鑑定出攜帶突變輸入基因的樣品中表達改變的基因。
以TP53和TP53BP1突變檢索實體瘤類型Bladder cancer, Breast cancer, Brain Lower Grade Glioma, Liver cancer, Melanoma, Gastric cancer為例:
結果展示Liver cancer為例,檢索不僅可以得到突變基因在實體瘤中影響的基因表達目錄以外,還能得到表達的箱線圖。
第二種:通過「 Target」運行,可以識別導致輸入基因表達變化的突變。
以TP53基因為例,去檢索TP53在實體瘤中相關的基因突變。
以liver cancer為例,檢索TP53相關的基因突變,得到以下結果,不僅得到基因突變目錄,也可以得到基因的表達箱線圖。
Download
檢索得到的基因或者突變,都可以進行數據和圖的下載。下載連結直接在表格或者圖的下面,點擊後,表格的下載,得到一個網頁數據,在TXT文件中去掉格式後,可以在excel中粘貼得到完整的表格。
圖的下載,點擊後生成PDF的箱線圖,可以直接下載保存PDF文件。
其他
如果使用這個資料庫,可以直接引用文章。
資料庫還提供了團隊的聯繫方式,有問題可以直接訪問他們的網頁去聯繫科研小組。
這麼方便好用又強大的資料庫,快來pick一下吧……