R語言中提供了很多實用的函數幫助我們處理統計量。前面的文章中介紹了均值、方差、全距、幾何平均數等的計算方法,還給出了繪製條形圖,直方圖,散點圖,餅圖,箱線圖等的繪製方法,本文將介紹統計學中的另外一種圖的繪製方法:莖葉圖。歡迎感興趣的讀者關注本號,本號會詳細介紹R在各個方面的使用方法。
莖葉圖概述
莖葉圖(Stem-and-Leaf display)又稱「枝葉圖」,它的思路是將數組中的數按位數進行比較,將數的大小基本不變或變化不大的位作為一個主幹(莖),將變化大的位的數作為分枝(葉),列在主幹的後面,這樣就可以清楚地看到每個主幹後面的幾個數,每個數具體是多少。
莖葉圖與直方圖不同,莖葉圖保留原始資料的信息,可以從中統計出次數,計算出各數據段的頻率或百分比。從而可以看出分布是否與正態分布或單峰偏態分布逼近。
R語言中繪製莖葉圖的函數stem
R語言中的基礎包中使用stem函數繪製莖葉圖。其語法格式如下:
stem(x, scale = 1, width = 80, atom = 1e-08)
下面使用一個例子來說明stem函數的具體使用方法:
參數x
參數x是數值向量,用於繪製莖葉圖的數據。
繪製結果如下圖所示:
圖中位於「|」右邊的數字是1位數字構成的,繪製的莖葉圖默認0-4一組,5-9一組。從這個圖中可以看出位於各個統計區間中的數據數量
參數scale
stem函數中的scale參數控制莖葉圖的長度,默認為1。
scale設置的越大,分莖越多,精度越高,如果你的scale較小,他甚至會自動幫你的數據做四捨五入(這樣會降低精度)。
width參數
控制莖葉圖中葉子的寬度,如果為0,則只輸出該莖統計的數字個數。如果為10以內的數,則表示超過指定寬度的統計數量個數,下面的例子可以理解為,統計頻數比0多的數,多幾個就加幾。
這樣,我們很清楚的知道,10~20之間有1個,20~25之間有2個,25~30之間有4個......
當width設置的足夠大,就可以將所有的數字顯示全了,默認為100.
v<-c(30,33,18,27,32,40,26,28,21,28,35,20)
stem(v,scale=1,width=90)
關於stem函數就介紹這麼多,以後還會介紹其它包中提供的繪製莖葉圖的方法,您可以關注本號,實時了解最新的更新內容。