EXCEL箱線圖的作法

2021-02-13 辦公表格君

 EXCEL是目前應用最廣泛的數據處理工具之一,由於它在數據整理方面甚至要優於大多數的專業統計軟體,因此EXCEL也得到了很多統計工作者的青睞。豐富的繪圖功能是EXCEL軟體一大特色,在EXCEL中可以實現大部分統計圖的繪製,但作為常見的一種統計圖—箱線圖在EXCEL中並沒有它的身影。難道在EXCEL真的無法實現箱線圖的繪製嗎?在實踐中我們發現,儘管箱線圖在EXCEL中不能直接實現,卻可以通過間接的形式加以實現。

  一、EXCEL繪製箱線圖的原理

  儘管在EXCEL中沒有箱線圖選項,但它裡面有一種與箱線圖很相似的圖形,那就是股票分析中常見的K線圖。箱線圖是由一個箱體和兩條線段組成,它包含一組數據的五個特徵值:最大值、最小值、中位數和兩個四分位數,而K線圖同樣也是由一個箱體和兩條線段構成,但箱線圖中只包含數據系列的四個特徵值,即最高價、最低價、開盤價和收盤價。

  用EXCEL繪製箱線圖時,可以用箱線圖中的最大值、最小值、上四分位數和下四分位數分別代替K線圖中的最高價、最低價、開盤價和收盤價,先繪製出K線圖,再在其中加入中位數系列,最後對圖形稍做修改,既是一幅標準的箱線圖。

  二、EXCEL繪製箱線圖的過程

  下面我們以具體的數據實例[1]講解箱線圖的EXCEL繪製過程。具體數據如圖一,由11名同學的8門課程的考試成績構成,要求編制各科考試成績的箱線圖。這裡需要指出的是,在數據原出處箱線圖是由STATISTIC軟體實現的,這對普通數據修理人員而言會造成很大不便。

圖1  11名學生各科的考試成績數據及5個特徵值

 

  1、箱線圖中五個特徵值的計算

  欲用EXCEL繪製上述數據的箱線圖,首先要在EXCEL中利用其函數功能計算出各科成績的5個特徵值,如圖1的下表。計算方法如下:首先在B16、B17、B18、B19、B20單元格分別輸入公式

  B16=PERCENTILE(B3:B13,0.25);
  B17=MIN(B3:B13);
  B18=MAX(B3:B13);
  B19=PERCENTILE(B3:B13,0.75);
  B20=MEDIAN(B3:B13);

  這樣就計算出了英語成績的下四分位數、最小值、最大值、上四分位數和中位數,然後利用EXCEL的快速填充柄將上述5個單元格分別向右拖拽計算出其它幾門課程的5個特徵值。上述5個特徵值系列中的前4個將首先用來作股票K線圖,這4個數據系列的順序是不能改變的,一定要按下四分數、最小值、最大值和上四分位數的順序排列,這是股票圖繪製過程中的特殊要求。將4個系列作成股票K線圖後,再將第5個中位數系列加入其中。

  2、繪製出K線圖

  在圖1中的數據表中,選擇「A15:I19」單元格,在頂端菜單中選擇「插入」,然後選擇「圖表」,在「圖表類型」中選擇「股價圖」,在「子圖表類型」中選擇右上角的K線圖形式,點擊「完成」按鈕,即作出如圖2所示的K線圖形式。

圖2  4個特徵值的K線圖形式

 

  3、在K線圖中加入中位數系列

  下面要做的是將中位數系列加入到圖2中去。將滑鼠指針移向K線圖區域,單擊右鍵,在跳出窗口中選擇「數據源」,在頂端選擇「系列」,在左下角「系列」框的下面選擇「添加」,此時就在上面四個系列中又添加了一個系列。點擊右邊「名稱」框中的箭頭圖標選擇數據表中中位數所在的單元格,點擊「值」框中的箭頭圖標,選擇中位數系列所在單元格區域,此時在「名稱」框與值框中應分別是「=Sheet1!$A$20」與「=Sheet1!$B$20:$I$20」,上述兩步也可以手工寫出,但要注意不能省略其中的Sheet名,點擊「確定」按鈕,這樣就將中位數系列添加到了K線圖中。此時中位數系列在圖形中的位置是箱體與上垂線的交界處,也就是它取代了上四分位數的位置,而上四分位數處於上垂線的中間,當然這在圖形中並不容易看出來。

圖3  添加中位數系列後的K線圖


  4、對圖形進行調整,形成箱線圖

  將滑鼠指針指向K線圖的箱體與上垂線的交界處,此時就選擇了中位數系列,單擊右鍵,在彈出的窗口中選擇「數據系列格式」,在「圖案」窗口右邊的「樣式」下拉菜單中選擇「—」,將「大小」調整為「10磅」。再點擊頂端的「系列次序」窗口,在「系列次序」框中選擇「中位數」,點擊右邊「上移」按鈕兩次,將中位數系列移到五個數據系列的中間,點擊「確定」按鈕。此時箱體與上垂線的交界處重新變成了上四分位數,而中位數則位於了箱體的內部。

  將滑鼠指針指向任一個K線頂端,選擇最大值系列的一個數據點,與中位數的調整類似,單擊右鍵,在彈出窗口中點擊「數據系列格式」,在右邊的「數據標記」的「樣式」下拉菜單中選擇「—」,將「大小」調整為「10磅」,將「前景顏色」設置為「黑色」。如果想調整K線的間距可以點擊頂端的「選項」進行間距寬度的調整,點擊「確定」按鈕。用同樣的方法對K線圖中的最小值系列進行操作。此時的圖形就是一幅標準的箱線圖,見圖4。

圖4  11名學生8門課程的箱線圖

相關焦點

  • Excel-箱線圖(數據分布)分析
    來源:CSDN博客箱線圖(Boxplot)也稱箱須圖(Box-whisker通過將多組數據的箱線圖畫在同一坐標上,則可以清晰地顯示各組數據的分布差異,為發現問題、改進流程提供線索。1.什麼是四分位數箱線圖需要用到統計學的四分位數
  • R之箱線圖繪製
    16s分析一直在連載,但是最基礎的莫過於alpha多樣性了,但是箱線圖卻不是alpha多樣性的唯一選擇,箱線圖也不是局限於alpha多樣性,這裡藉助
  • 箱線圖的生物學含義
    箱線圖的組成樣本大小可以通過成比例的調整箱線圖的寬度實現,如上圖b中的第二個箱線圖,箱子的凸凹程度表示樣本量的多少。其次,一些軟體如R使用鉸鏈hinges而非四分位數來作為箱邊界,下鉸鏈和上鉸鏈分別是數據下半部分和上半部分的中位值,這種箱線圖與基於四分位數的箱線圖略有不同。箱線圖的寬度,上下限的位置,凹口尺寸和異常值都需要調整,因此,在文章描述清箱線圖的構造方式是非常重要的。
  • 箱線圖boxplot的多種畫法
    BioNews,專注於報導生命科學領域相關新聞,長按下方二維碼即可關注"BioNews"(id : iBioNews)本文作者:侯衛博箱線圖主要是通過四分位數描述數據分布箱線圖能夠顯示出可能為離群點(範圍±1.5*IQR以外的值,IQR表示四分位距,即上四分位數與下四分位數的差值)的觀測。從箱線圖中,可以大致推斷出數據的集中或離散趨勢。
  • 箱線圖的N種畫法
    箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數據分散情況資料的統計圖。因形狀如箱子而得名。在各種領域也經常被使用。下圖中標示了箱線圖中每條線和點所表示的含義,應用到了分位數的概念。
  • 教你畫雙分類變量的箱線圖
    添加p值的需求這樣的箱線圖,添加p值的需求是很多見的,核心就是stat_compare_means函數,可以很輕易搜到代碼:library(ggpubr)my_comparisons <- list( c("0.5", "1")
  • 擴增子統計繪圖1箱線圖:Alpha多樣性
    其章節設計與《擴增子圖表解讀》對應,為八節課八種常用圖形(箱線圖、散點圖、熱圖、曼哈頓圖、火山圖、維恩圖、三元圖和網絡圖),基本滿足文章常用的圖片種類需求。也適合對公司標準化分析返回結果的進一步統計、可視化及美化,達到出版級別,衝擊高分文章。
  • 箱線圖!Esquisse作圖神器免費教程等你來領!
    本期看點上圖是我們科研菌往期推送過的一期研究腎透明細胞癌中EMT相關分子預後價值的文章(腎癌EMT基因預後標誌物發5+分),文中的Figure1中有很多箱線圖,說的是六個EMT相關分子在腎透明細胞癌樣本的癌組織和癌旁正常組織中的表達差異,看過的文章的小夥伴會發現這些箱線圖是從資料庫中獲取的,非常的模糊。
  • 箱線圖中的極端值為什麼刪除後還是會存在?
    前面的文章《箱線圖中顯示的異常值,應該如何去除?》
  • 一圖看懂箱線圖,順便帶你鞏固matplotlib繪圖流程!
    在我之前發的箱線圖圖鑑中,有讀者表示看不懂箱線圖。今天本文就通過下面這張圖簡單講一下箱線圖沒錯,這張圖也是用matplotlib一點一點的繪製出來的,所以順便鞏固一下matplotlib繪圖的綜合應用。箱線圖怎麼看?
  • 柱狀圖、箱線圖、提琴圖、傑特圖還有蜂窩圖,你要哪個?
    上次提到箱線圖等這些類型的圖可以展示更多的數據特點,很多人並不推薦使用柱狀圖。為了在科研論文中普及箱線圖(boxplot)的使用,nature method還專門發文力推。Visualization samples with box plots文中詳細講解了箱線圖的原理和優點,並與傳統柱狀圖做了對比。
  • 箱線圖的一生(作圖數據的整理)
    前面有篇文章講的就是怎麼用R簡單製作箱線圖,用的是R自帶數據,相對來說還是比較容易理解,主要是R自帶數據是非常完美的,剛好適合做某種特定的分析,那遇到我們自己的數據呢
  • 基於ggplot2包繪製SCI學術箱線圖的保姆級教程
    箱線圖(Boxplot)是一種用作顯示一組數據分散情況資料的統計圖表。箱線圖,又稱箱形圖(boxplot)或盒式圖,不同於一般的折線圖、柱狀圖或餅圖等圖表,其包含一些統計學的均值、分位數、極值等統計量,該圖信息量較大,不僅能夠分析不同類別數據平均水平差異,還能揭示數據間離散程度、異常值、分布差異等。
  • 一文學會用Python繪製經典的棉棒圖、箱線圖和誤差棒圖
    這幾天一直在和大家聊Python數據可視化相關的東東,其中呢,介紹最多的當然是matplotlib庫中的各種繪製函數啦,上次已經和大家談論了關於Python中如何繪製氣泡圖等漂亮圖表的方式,今天呢,咱們繼續聊哦,今天呢,咱們就來聊聊如何繪製經典的棉棒圖、箱線圖和誤差棒圖
  • 控制ggplot2箱線圖的顏色
    > 第七十九題 2021年2月7日控制ggplot2箱線圖的顏色
  • ggplot2|從0開始繪製箱線圖
    繼續「一圖勝千言」系列,箱線圖通過繪製觀測數據的五數總括,即最小值、下四分位數、中位數、上四分位數以及最大值,描述了變量值的分布情況。
  • R語言中使用boxplot函數繪製箱線圖
    箱線圖簡介箱線圖又稱箱形圖或盒須圖,該圖是由5個特徵值繪製而成的圖形。5個特徵值是變量的最大值、最小值、中位數、第1四分位數和第3四分位數。連接兩個分位數畫出一個箱子,箱子用中位數分割,把兩個極值點與箱子用線條連接,即成箱線圖。
  • 散點圖、箱線圖、核密度函數……數據分析必備的9種可視化圖表
    如果x軸是一個時間序列,那麼線圖是一個很好的選擇。我們可能會在數據中看到一些時間上的趨勢。在本例中,只能看到數據是按「物種」列排序的(圖中紫色的步驟),並且其他列的移動平均值遵循該模式(花瓣長度,特別是紅色標記的花瓣長度)。散點圖這是一種將兩個連續變量之間的關係可視化的完美圖表。
  • python學習筆記:同時畫多圖,折線圖,箱線圖,條形圖,柱狀圖等
    #畫一個(x,y)和(x,y1)兩個條形圖疊加在一起的圖,以(x,y)的柱狀圖為底subplot(2,3,4)bar(x,y)y1=[7,8,5,3]#'r'紅色bar(x,y1,bottom=y,color='r')#箱線圖
  • 我是工具控:excel最酷工具箱 — 方方格子
    聽課的時候都明白,一旦幹起工作來還是會繁瑣的excel操作惹得一肚子氣!?方方格子 Excel工具箱它是一款大型全能型 EXCEL插件為什麼稱之大型?(顧名思義開會員)        其中」宏收納箱」,提供了大量常用宏及函數。用戶可繼續收集自己常用以及網絡上的宏和函數,打造屬於自己的「武器庫」。收納箱還提供Excel界面DIY功能。