提到盒須圖(也叫箱線圖),諸位應該並不陌生,但要問這盒須圖中的「盒」和「須」所代表的含義,在看的各位可能不全能說出來,或者說理解有偏差,那我們在作圖前就很有必要來看看盒須圖到底該怎麼看。
我們以簡單的data向量繪製一個盒須圖
設h=第三四分位數值-第一四分位數值(h=79-25=54);
盒形圖最上面的「須」表示數值≤(第三個四分位數值+1.5*h)的最大觀測值,具體來說,79+1.5*54=160,在data中160以下的最大值為99,故對應的值為99,而163和200均超出了160,於是這兩個值便成了所謂的離群值(異常值);
盒形圖下方的「須」表示≥(第一個四分位數值-1.5*h)的最小的觀測值,對於本例,25-1.5*54=-56,data中大於-56的最小值為10,故下方橫線對應值為10。
不知道你會不會有這樣的疑問,上面那個1.5是怎麼來的,這個,這個……這個是函數默認的值,當然我們也可以修改。
setwd("E:/R-work/R語言學習第6天-boxplot")
trans<-read.table("transcript_exp_log2FPKM.txt",header=T,row.names=1,sep="\t")
下面我們要做的就是圖形的美化,美化所用的參數跟之前講的barplot都很類似
res<-boxplot(trans,col=c("DarkOrange","DarkCyan", "DarkOrchid", "RoyalBlue"),boxwex=0.6,main="boxplot",border="black",ylim=c(0,8),xlab="Sample name",cex.lab=1.2,ylab="log2FPKM",cex.main=1.5,las=1)
數據百度盤下載連結: https://pan.baidu.com/s/1slGOz9r 密碼: 599u
That's all. Thank you!
請關注「小張聊科研」:搜索微信號「xzlky2015」,或長按二維碼識別關注。
↓↓↓