excel是最常用的辦公軟體之一,是處理報表的一個好工具。對於搞數據分析的小夥伴來說,首選excel來對數據進行處理。
在做數據分析時,經常會遇到一大堆數字類型的資料,這個時候我們就希望把整個數據分布的情況分析一下。比如有張表,含有14個商品的價格,讓你來分析一下整個價格分布。像下圖。
怎麼來分析價格的分布情況呢?最直觀的方式就是找到整個數據分布的區間段,然後再統計出不同區間段的分布數量。那怎麼找出數據的區間段呢?
這裡首先要進行一下數據的探索。比如通過計算得到整個數據資料的最大值、最小值、區間跨度(最大值-最小值),在excel中對應的公式就是max,min,max-min。
通過最大最小值的計算,你就可以得到分段區間的上限和下限。計算出來的結果如下圖。
然後,根據數據情況和業務需要,自己制定取數的區間。不同的業務對數據的分段規則是不一樣的,比如對於成績來說,一般分為60分以下、70分段、80分段、90分段等區間。再比如上面例子是價格,可以先把整個數據按照升序排列,然後數據分布的情況,最後按照下圖的方式確定區間。
接下來就是根據不同區間段來計算期間分布的數量,然後畫出區間圖。下面分別介紹有2個招數。
招數一、寫COUNTIF公式直接算區間數量
excel中有COUNTIF和COUNTIFS兩個公式。
對於單邊的區間,比如小於100的區間,可以寫公式=COUNTIF(B2:B15,&34;)。
對於雙邊的區間,比如計算100-200區間,需要寫公式為=COUNTIFS(B2:B15,&34;,B2:B15,&34;)
以此類推,從下限到上限的所有區間寫好公式,直接就可以計算出結果。然後插入柱狀圖,一幅數據分布圖就畫好了,如圖。
招數二、通過excel表的數據分析模塊,直接畫出直方圖
首先要把excel表的數據分析功能調出來。
具體方法是:單擊「開始」菜單——「選項」,選擇「加載項」,在非活動應用程式加載項下方選擇「分析工具庫"——」轉到「——確定,回到Excel表格,打開數據菜單,這個時候excel的右上角就已經成功添加「數據分析」功能了。
接下來,要設置數據分隔點,如下圖。
最後,選擇數據-數據分析-直方圖。其中輸入區域是數據列,接收區域是數據段,輸出區域要顯示的結果,最後勾選「圖表輸出」,數據的分布表和直方圖立即就出來了,如下圖。
其中x軸的數據列可以進行調整,比如其他這個欄位不想要就直接刪除。最後就展示出來了我們想要的結果,如下圖。
是不是很簡單?你學會了嗎,歡迎交流。