EXCEL是目前應用最廣泛的數據處理工具之一,由於它在數據整理方面甚至要優於大多數的專業統計軟體,因此EXCEL也得到了很多統計工作者的青睞。豐富的繪圖功能是EXCEL軟體一大特色,在EXCEL中可以實現大部分統計圖的繪製,但作為常見的一種統計圖—箱線圖在EXCEL中並沒有它的身影。難道在EXCEL真的無法實現箱線圖的繪製嗎?在實踐中我們發現,儘管箱線圖在EXCEL中不能直接實現,卻可以通過間接的形式加以實現。
一、EXCEL繪製箱線圖的原理
儘管在EXCEL中沒有箱線圖選項,但它裡面有一種與箱線圖很相似的圖形,那就是股票分析中常見的K線圖。箱線圖是由一個箱體和兩條線段組成,它包含一組數據的五個特徵值:最大值、最小值、中位數和兩個四分位數,而K線圖同樣也是由一個箱體和兩條線段構成,但箱線圖中只包含數據系列的四個特徵值,即最高價、最低價、開盤價和收盤價。
用EXCEL繪製箱線圖時,可以用箱線圖中的最大值、最小值、上四分位數和下四分位數分別代替K線圖中的最高價、最低價、開盤價和收盤價,先繪製出K線圖,再在其中加入中位數系列,最後對圖形稍做修改,既是一幅標準的箱線圖。
二、EXCEL繪製箱線圖的過程
下面我們以具體的數據實例[1]講解箱線圖的EXCEL繪製過程。具體數據如圖一,由11名同學的8門課程的考試成績構成,要求編制各科考試成績的箱線圖。這裡需要指出的是,在數據原出處箱線圖是由STATISTIC軟體實現的,這對普通數據修理人員而言會造成很大不便。
圖1 11名學生各科的考試成績數據及5個特徵值
1、箱線圖中五個特徵值的計算
欲用EXCEL繪製上述數據的箱線圖,首先要在EXCEL中利用其函數功能計算出各科成績的5個特徵值,如圖1的下表。計算方法如下:首先在B16、B17、B18、B19、B20單元格分別輸入公式
B16=PERCENTILE(B3:B13,0.25);
B17=MIN(B3:B13);
B18=MAX(B3:B13);
B19=PERCENTILE(B3:B13,0.75);
B20=MEDIAN(B3:B13);
這樣就計算出了英語成績的下四分位數、最小值、最大值、上四分位數和中位數,然後利用EXCEL的快速填充柄將上述5個單元格分別向右拖拽計算出其它幾門課程的5個特徵值。上述5個特徵值系列中的前4個將首先用來作股票K線圖,這4個數據系列的順序是不能改變的,一定要按下四分數、最小值、最大值和上四分位數的順序排列,這是股票圖繪製過程中的特殊要求。將4個系列作成股票K線圖後,再將第5個中位數系列加入其中。
2、繪製出K線圖
在圖1中的數據表中,選擇「A15:I19」單元格,在頂端菜單中選擇「插入」,然後選擇「圖表」,在「圖表類型」中選擇「股價圖」,在「子圖表類型」中選擇右上角的K線圖形式,點擊「完成」按鈕,即作出如圖2所示的K線圖形式。
圖2 4個特徵值的K線圖形式
3、在K線圖中加入中位數系列
下面要做的是將中位數系列加入到圖2中去。將滑鼠指針移向K線圖區域,單擊右鍵,在跳出窗口中選擇「數據源」,在頂端選擇「系列」,在左下角「系列」框的下面選擇「添加」,此時就在上面四個系列中又添加了一個系列。點擊右邊「名稱」框中的箭頭圖標選擇數據表中中位數所在的單元格,點擊「值」框中的箭頭圖標,選擇中位數系列所在單元格區域,此時在「名稱」框與值框中應分別是「=Sheet1!$A$20」與「=Sheet1!$B$20:$I$20」,上述兩步也可以手工寫出,但要注意不能省略其中的Sheet名,點擊「確定」按鈕,這樣就將中位數系列添加到了K線圖中。此時中位數系列在圖形中的位置是箱體與上垂線的交界處,也就是它取代了上四分位數的位置,而上四分位數處於上垂線的中間,當然這在圖形中並不容易看出來。
圖3 添加中位數系列後的K線圖
4、對圖形進行調整,形成箱線圖
將滑鼠指針指向K線圖的箱體與上垂線的交界處,此時就選擇了中位數系列,單擊右鍵,在彈出的窗口中選擇「數據系列格式」,在「圖案」窗口右邊的「樣式」下拉菜單中選擇「—」,將「大小」調整為「10磅」。再點擊頂端的「系列次序」窗口,在「系列次序」框中選擇「中位數」,點擊右邊「上移」按鈕兩次,將中位數系列移到五個數據系列的中間,點擊「確定」按鈕。此時箱體與上垂線的交界處重新變成了上四分位數,而中位數則位於了箱體的內部。
將滑鼠指針指向任一個K線頂端,選擇最大值系列的一個數據點,與中位數的調整類似,單擊右鍵,在彈出窗口中點擊「數據系列格式」,在右邊的「數據標記」的「樣式」下拉菜單中選擇「—」,將「大小」調整為「10磅」,將「前景顏色」設置為「黑色」。如果想調整K線的間距可以點擊頂端的「選項」進行間距寬度的調整,點擊「確定」按鈕。用同樣的方法對K線圖中的最小值系列進行操作。此時的圖形就是一幅標準的箱線圖,見圖4。
圖4 11名學生8門課程的箱線圖