在基因的表達模式分析中,我們往往需要對量化的多個基因表達數據進行可視化處理,使得我們所關注的基因在物種的不同組織以及同一組織的不同處理下的表達情況一目了然。在日常研究中,我們往往習慣於選擇熱圖實現這一基因表達模式可視化的需求,進而直觀的表述我們的基因表達模式的分析結果。今天我們介紹關於R語言繪製熱圖的一種方法,那就是利用pheatmap包進行熱圖的繪製。
1 安裝pheatmap包有兩種方式:
a.install.packages(「pheatmap」)
b. 通過bioconductor安裝:
source("http://biocoundctor.org/biocLite.R")
biocLite("pheatmap")
2 R包的調用: library(pheatmap)。
3 熱圖的繪製函數就是pheatmap函數,對其參數做以下介紹:
官方的參數初始情況如下圖:
我們看到它的參數設置和其他的heatmap繪製函數基本一致。那麼我們今天主要講裡面幾個主要的參數,具體的熱圖繪製,調用函數的時候注意以下參數默認值即可。
1. color = colorRampPalette(rev(brewer.pal(n= 7, name = "RdYlBu")))(100)
主要是設置heatmap中每個格子的顏色以及顏色的過渡範圍。
2. cellwidth = NA, cellheight = NA
設置heatmap中每個格子的寬度和高度。
3. scale = "none"
其參數有三種:row,column,none(默認)。此參數的意義就是所有的參與熱圖的數值是否做Z-score處理,並且是對數值的每一列處理還是每一行處理。
4. cluster_rows = TRUE,cluster_cols = TRUE
對於行列的數據是否做聚類,TRUE做聚類,反之不做。
5. cutree_rows = NA, cutree_cols =NA
此參數是將熱圖的行列分成幾塊,並相互獨立開。
6. annotation_row = NA,annotation_col = NA
此參數是指對於行列的注釋名稱是否設置,當然這裡設置名稱需要以因子的形式設置
例:annotation_row = data.frame(
GeneClass = factor(rep(c("Path1", "Path2", "Path3"),c(10, 4, 6)))
)
annotation_col = data.frame(
CellType = factor(rep(c("CT1", "CT2"), 5)),
Time = 1:5
)
7. annotation_names_row = TRUE,annotation_names_col = TRUE
此參數是指是否顯示我們設置的行列的名稱,比如上面設置的列名稱CellType。
8. annotation_colors = NA
此參數的功能是設置行列每個因子對應的顏色設置,默認也會提供顏色,只是可能不是自己所要,舉例其設置形式:
ann_colors = list(
Time =c("white", "firebrick"),
CellType =c(CT1 = "#1B9E77", CT2 = "#D95F02"),
GeneClass =c(Path1 = "#7570B3", Path2 = "#E7298A", Path3 ="#66A61E")
)
那麼,展示一個已畫好的熱圖,供大家參考,具體的代碼自行發揮。畢竟繪製heatmap一個函數就可以了。
歡迎大家學習交流: