TCGA|根據somatic mutation繪製突變景觀圖(oncoplot)和基因詞雲

2021-02-21 生信補給站

使用 XENA下載的TCGA-LAML.mutect2_snv.tsv文件繪製基因詞雲和突變景觀圖。


       有小夥伴在https://mp.weixin.qq.com/s/DvX_pKPF9bCcNqc3u6rTuw這個帖子下面留言說使用 maftools 的 genecloud函數繪製基因雲圖時,報錯提示沒有這個函數,然後還提到 http://bioconductor.org/packages/release/bioc/vignettes/maftools/inst/doc/maftools.html  官方文檔中也沒有genecloud,,也許是我的版本比較早所以還有吧,,,

雖然genecloud無法繪製,但是可以使用wordcloud2繪製,同樣很簡單

1.1 加載R包和數據

將XENA下載後的數據TCGA-LAML.mutect2_snv.tsv.gz解壓,然後直接讀入

#一鍵清空
rm(list = ls())
#載入R包
library(tidyverse)
#讀入數據
mut <- read.table("TCGA-LAML.mutect2_snv.tsv",sep = "\t" , header = T,
                  stringsAsFactors = FALSE ,
                  check.names = FALSE)
head(mut,2)

1.2 計算基因頻次,繪製詞雲

#計算每個基因出現的個數
mut2 <- mut %>% filter(effect %in% c("missense_variant","inframe_insertion")) %>%
 select(Sample_ID,gene) %>%
 group_by(gene) %>%
 summarise(Freq = n()) %>%
 arrange(desc(Freq))

head(mut2)

####繪製基因詞雲#####
library(wordcloud2)
#繪製頻次大於等於5的
da <- subset(mut2,Freq >= 5) #、
wordcloud2(da)

1.3 maf文件繪製詞雲圖

如果使用maftools中的maf文件繪製呢?首先根據maftools|TCGA腫瘤突變數據的匯總,分析和可視化得到了laml數據,那麼可以用以下方式獲得基因雲圖

library(wordcloud2)
data2 <- as.data.frame(table(laml@data$Hugo_Symbol))
da2 <- subset(data2,Freq >= 3) #3就是minMut參數的值
wordcloud2(da2)



2.1 提取基因

提取 1.2中突變頻次較高的基因,進行繪製

mut3 <- mut %>% filter(gene %in% da$gene) %>% 
 select(Sample_ID,gene,effect) %>%
 #只選擇"missense_variant","inframe_insertion"兩種類型
 filter(effect %in% c("missense_variant","inframe_insertion")) %>%
 unique()

#轉成繪製熱圖的數據形式(寬型數據)
library(reshape2)
mut3_dcast <- mut3 %>% dcast(Sample_ID ~ gene,value.var='effect') %>%
 dplyr::select(Sample_ID, da$gene) %>%
 column_to_rownames("Sample_ID") %>%
 t()

2.2 ComplexHeatmap繪製突變景觀圖
library(ComplexHeatmap)
library(circlize)

mat <- mut3_dcast
mat[is.na(mat)]<-""
mat[1:6,1:6]

oncoPrint(mat)

2.3 景觀圖調整
#指定顏色, 調整顏色代碼即可
col <- c( "missense_variant" = "blue" , "inframe_insertion" = "green")
#指定變異的樣子,x,y,w,h代表變異的位置(x,y)和寬度(w),高度(h)
alter_fun <- list(
 background = function(x, y, w, h) {
   grid.rect(x, y, w-unit(0.5, "mm"), h-unit(0.5, "mm"),
             gp = gpar(fill = "#CCCCCC", col = NA))
},
 missense_variant = function(x, y, w, h) {
   grid.rect(x, y, w-unit(0.5, "mm"), h-unit(0.5, "mm"),
             gp = gpar(fill = col["missense_variant"], col = NA))
},
 inframe_insertion = function(x, y, w, h) {
   grid.rect(x, y, w-unit(0.5, "mm"), h*0.33,  
             gp = gpar(fill = col["inframe_insertion"], col = NA))
}
)

#指定變異類型的標籤,和數據中的類型對應
heatmap_legend_param <- list(title = "Alternations",
                            at = c("missense_variant","inframe_insertion"),
                            labels = c( "missense_variant","inframe_insertion"))


#設定標題
column_title <- "This is Oncoplot "  
oncoPrint(mat,
         alter_fun = alter_fun, col = col,
         column_title = column_title,
         remove_empty_columns = TRUE, #去掉空列
         remove_empty_rows = TRUE, #去掉空行
         row_names_side = "left", #基因在左
         pct_side = "right",
         heatmap_legend_param = heatmap_legend_param)

更多參數參考ComplexHeatmap|根據excel表繪製突變景觀圖(oncoplot)。


【覺得不錯,右下角點個「在看」,期待您的轉發,謝謝!】


相關焦點

  • Science:首次在體內繪製tRNA基因適應度景觀圖
    構建這種類型的圖譜是研究一種被稱作適應度景觀(fitness landscape)的概念工具的進化生物學家的目標,其中適應度景觀提供一種可視化觀察和預測進化的方法。自從20時間30年代群體遺傳學家Sewall Wright首次提出以來,適應度景觀的觀點就已非常流行。但是繪製詳細的適應度景觀圖是一個嚴峻的挑戰,而且迄今為止創建出的景觀圖相當粗糙。
  • 科學家繪製正常結直腸上皮細胞體細胞突變圖譜
    科學家繪製正常結直腸上皮細胞體細胞突變圖譜 作者:小柯機器人 發布時間:2019/10/24 15:24:38 英國維康桑格研究所Michael R. Stratton小組繪製了正常結直腸上皮細胞的體細胞突變圖譜。
  • 腫瘤全外的點突變有哪些分類呢?| 腫瘤全外專題
    如下圖所示:小師妹最近在學習腫瘤克隆進化的過程中,發現人類的點突變的分類與農學裡的差異較大,為了釐清這裡邊的關係,小師妹覺得非常有必要做一個系統的梳理。這裡邊最常見的分類就是基因區同義突變和非同義突變,然後就是promoter區的SNP突變。另外,農學中取樣的植物組織往往是葉片,也不存在體細胞這一說。醫學相關研究中對突變的分類更加細緻,什麼是體細胞突變(somatic mutation)?|腫瘤全外一文也闡述了體細胞突變(somatic mutation)和胚系突變(germline mutation)的概念。
  • PLoS Genet:誘導性多能幹細胞不會產生導致癌症的基因突變
    當人從胚胎長成小孩、成年人以及變老時,人體內的細胞產生許多微小的基因突變。大多數基因突變不會產生影響,但是一些突變能夠導致癌症。研究人員追蹤了這種捐獻的血細胞和由它產生的iPS細胞的基因變化歷程。 這些研究結果揭示出iPS細胞中產生的基因突變比他們在實驗室培養的血細胞少了10倍,而且在這些iPS細胞發生的基因突變中,沒有一種突變存在於已知導致癌症的基因中。 論文第一作者Foad Rouhani博士說,「在iPS細胞內發現的突變中,沒有一種突變是癌症驅動突變,或者存在於致癌基因中。我們並未發現阻止將iPS細胞用於治療醫學中的不利因素。」
  • PNAS:劣質基因可能導致突變熔毀
    多倫多大學的進化生物學家已經發現,劣質基因個體可能產生更劣質染色體的後代,可能導致世代中某些物種滅絕。此研究發表在PNAS上,指出:相對於高質量基因個體來說,遺傳缺陷生物可能經歷DNA突變量增加。該研究以果蠅為研究對象,因為果蠅的簡單系統是更複雜系統中生物學諸多方面的模仿,因此,此研究發現可能對人類有所啟發。
  • Nature:AKT1基因突變可引發癌細胞增殖
    生物谷報導:美國禮來公司(Eli  Lilly  and  Company)和翻譯基因組學研究院(the  Translational  Genomics  Research  institute)研究人員日前宣布,他們在乳腺癌、結腸癌和卵巢癌中發現一種AKT1基因復發突變(recurring  mutation,生物谷編者譯),這種突變AKT1
  • 第五節 基因突變
    第五節 基因突變   1.突變 突變(mutation)是指遺傳物質發生的可遺傳的變異。廣義的突變可以分兩類:①染色體畸變(chromosome aberration),即染色體數目和結構的改變;②基因突變(gene mutation)。狹義的突變,即一般所指的突變僅指基因突變。
  • 研究揭示腦皮層中體細胞突變情況
    研究揭示腦皮層中體細胞突變情況 作者:小柯機器人 發布時間:2021/1/14 13:55:26 美國波士頓兒童醫院Christopher A. Walsh和哈佛醫學院Peter J.
  • 癌症基因組中的體細胞突變分布隨三維染色質結構而變化
    Andrew Futreal等研究人員合作發現,癌症基因組中的體細胞突變分布隨三維染色質結構而變化。該研究於2020年10月5日在線發表於國際一流學術期刊《自然—遺傳學》。 為了解空間基因組組織與特定突變過程之間的相互作用,研究人員分析了來自42種不同人類癌症類型的3,000個腫瘤-正常對全基因組數據集。分析表明,癌症基因組中體細胞突變負荷的變化與拓撲相關域邊界共同定位。
  • 研究揭示人膀胱體細胞突變和選擇的廣泛異質性
    研究揭示人膀胱體細胞突變和選擇的廣泛異質性 作者:小柯機器人 發布時間:2020/10/3 23:00:10 英國惠康-桑格研究所Iigo Martincorena團隊的一項最新研究,揭示了人膀胱體細胞突變和選擇的廣泛異質性。
  • 醫學英語:基因詞彙
    amber mutation 琥珀型突變   AMP (adenosine monophosphate) 腺一磷酸   ampicillin 氨/青黴素   anchor primer 錨狀引物   annealing 退火   annealing temperature 退火溫度   anticodon
  • 生存曲線一個循環可以畫太太太太太太多多多多多多圖了吧
    上一期的推文我們打開了基因組學的大門,不知道大家對於好看又好吃的棒棒糖圖有沒有留下深刻的印象呢?棒棒糖雖好,但是也不要貪吃哦。今天小編繼續給大家帶來另外一份大餐,我們來進行生存曲線再一次的批量繪製,這一次我們把目光從轉錄組學移到基因組學,我們在基因組學進行基因突變生存曲線的批量繪製,小夥伴們有沒有很心動呢?那懷著愉悅的心情和小編一起來學習一下吧。
  • PNAS:詳細繪製出大腸桿菌DNA突變過程圖譜
    2012年9月19日 訊 /生物谷BIOON/ --來自美國印第安納大學的生物學家和信息學家繪製出一個有機體中迄今為止最為廣泛的突變過程圖譜之一,這有助於揭示出新的關於突變分子性質方面的進化信息和這些可遺傳變化是如何快速發生的。
  • 癌症中U1剪接體RNA發生高頻突變
    他們報告了在幾種腫瘤類型中,U1 snRNA的第三個鹼基處高頻出現的A>C體細胞突變。 U1的主要功能是通過鹼基配對識別5'剪接位點(5'SS)。此突變將U1和5'SS之間的優先A-U鹼基配對更改為C-G鹼基配對,從而創建新的剪接點並改變了多個基因的剪接模式,包括已知的癌症驅動程序。
  • 【科技前沿】劉光慧/湯富酬/曲靜/張維綺合作繪製人類衰老基因景觀圖
    【科技前沿】劉光慧/湯富酬/曲靜/張維綺合作繪製人類衰老基因景觀圖 2021-01-08 17:00 來源:澎湃新聞·澎湃號·政務
  • BRCA基因再探拾遺
    BRCA基因突變分為兩種類型:一種為胚系突變(germlin mutation, gBRCAmut),即精子或卵母細胞中BRCA基因發生突變,只要不是傳說中的「從石頭縫裡蹦出來的孫猴子」,那就是說胚系突變的身體內的每個細胞都攜帶這種突變,無論是腫瘤細胞還是正常細胞,與生俱來,遺傳自父母,並且可遺傳給後代。
  • 關於TP53基因突變和缺失,您需要知道的......
    所謂TP53雙突變主要包括三種類型:半合子突變(一個TP53等位基因丟失,另一個TP53等位基因突變)、複合雜合突變(兩個不同突變分別位於不同的等位基因上)以及因同源重組造成UPD(單親二倍體,兩個TP53等位基因來自同一個親本)的純合突變[4]。 TP53是人類腫瘤中突變頻率最高的基因,有超過50%的人類腫瘤攜帶TP53基因突變,目前發現TP53的體細胞及胚系突變有45000多個。
  • Genome Biology |野生毛果楊基因組揭示了樹齡相關的體細胞遺傳和表觀遺傳變異
    Schmitz課題組聯合多家單位 「A genome assembly and the somatic genetic and epigenetic mutation rate in a wild long-lived perennial Populus trichocarpa」研究論文。
  • Nature:研究建立直接預測基因突變後果的方法
    日前,Nature雜誌在線發表了西班牙研究者在預測基因突變後果的方法方面的研究成果。基因決定論的局限性在臨床上(如雙胞胎的相同基因損傷卻會產生不相同的後果)和在實驗室中(如突變即便是在同質化環境中也會在同基因的動物中產生不同效應)都早已明顯表現出來了。