什麼是直方圖
直方圖(histogram),是一種二維統計圖,用於評估連續樣本數據的形狀和展開的圖形。可以在分析之前或在分析的同時創建直方圖,從而幫助確認假設並指導進一步的分析。反映的是數據在特定分組下的分布情況。
直方圖的優缺點
直方圖的優點:任何情況都能使用直方圖。
直方圖的不足:會有信息丟失。
使用Excel數據分析工具繪製直方圖
為了繪製直方圖,我們需要將樣本值劃分成許多區間。默認情況下,條形表示落入每個區間的觀測值個數(頻率)。我們還是以如下採購訂單的單筆訂單成本數據來做直方圖的演示。
需要數據做練習的請在評論中留下你的郵箱,我發送數據。
根據單筆訂單成本數據,求出其最大值和最小值。一般情況下數據的數量應在100個以上,在數量不多的情況下,至少也應在50個以上。本例使用的數據為94個。將數據分成若干組,分組的數量在6-20之間較為適宜。(本例選擇10組)計算組距的寬度。用最大值和最小值之差去除以組數,求出組距的寬度。(有些時候我們可以適當地將最小值和最大值進行放寬,以便於數據更加整齊,本例將會將最小值調整為0,最大值調整為130000)將分組數據錄入到Excel中使用用Excel分析工具庫的數據分析工具進行直方圖的繪製(如下為整個過程的錄屏動畫,供大家參考)
使用圖表工具繪製直方圖
在Excel2016、2019及365版本中,還可以使用如下方式繪製直方圖:
選擇數據。單擊「插入」>「插入統計信息圖表」>「直方圖」。(也可以從「推薦的圖表」中的「所有圖表」選項卡創建直方圖。)
使用 "設計" 和 "格式" 選項卡自定義圖表的外觀。如果你沒有看到這些選項卡,請單擊直方圖中的任意位置以向功能區添加「圖表工具」。
如下是創建過程的演示動畫,供參考:
評價直方圖
大多數情況下,正常形態的直方圖一般符合標準的正態分布圖形,兩邊低中間高。上述做出的直方圖就不是一個標準的形態。
以下是直方圖可幫助您回答的一些問題:
直方圖的使用場景
直方圖的使用場景很多,用途非常廣泛,除了經常用在於數據分布分析外,專業攝影也會用到直方圖。
直方圖反映的是數據分布,通過數據分布能發現很多問題,如數據分布是否合理、是否符合預期,通過一堆看似無規律的數據生成直方圖就能看到數據背後的隱藏的問題。而數據分布是否合理、是否符合預期,需要在特定的業務場景下去說,沒有統一的標準,可以是學習成績分布圖、也可以是產品質量分布圖、還可以是故障問題分布圖……
不同的業務場景對直方圖有不同的應用和解釋。而數據的分布常見的歸納有正態分布、正偏態分布、負偏態分布等。而這些特定業務場景下的應用在遇到特定問題時再具體研究即可。沒必要著急一下子全部都要搞明白.