超級詳細的直方圖應用步驟及分析,一篇搞定直方圖!

2020-12-03 盈飛無限質量開講

直方圖(histogram)

直方圖是從總體中隨機抽取樣本,將從樣本數據加以整理,用於了解數據的分布情況,使我們比較容易直接看到數據的位置狀況、離散程度和分布形狀的一種常用工具。它是用一系列寬度相等、高度不等的長方形來表示數據,其寬度代表組距,高度代表指定組距內的數據數(頻數)。(直方圖適用於連續性數據)

我們要如何解讀直方圖?第一步應先大致了解一下直方圖有哪些作用:

直方圖的作用

直觀地顯示質量特性的分布狀態,對於數據的分布的形狀、中心位置和分散程度一目了然;關注數據和規格的關係,通過測定值與規格值比較,判斷出不良是平均不良還是異常的不良,便於人們確定在何處進行質量改進;(在此對平均不良和異常不良作個解釋:平均不良通常代表的是系統的問題,是整個過程的不良;異常不良卻代表了個別的離散的不良,屬於個別問題。)

比較改善前後的直方圖,可了解平均值、分散、分布形狀的變化,改善的效果如何。解讀直方圖

首先我們要了解直方圖的形狀,通過直方圖的形狀了解過程是否異常。

一.直方圖的形狀

1.常態型:中間高、兩邊低、有集中邊勢,顯示過程正常。

2. 離島型:在右端或左端形成小島。說明一定有異常原因存在,如數據收集方法錯誤、數據來源不同或新手作業違背操作規程等特殊原因,需迅速追尋原因,採取必要措拖。

3. 雙峰型:有兩個高峰出現。兩臺不同的機器或兩種不同原料間存在差異時,或者作業者不同時也可發生此類直方圖。例如,病歷質控的2位質控員對檢查標準掌握有差異時,又或者同一位質控員應用兩種評估標準檢測的結果。出現這類情況時,應將數據層別處理後再製作直方圖。

4. 鋸齒型:圖形的柱形高低不一,呈現缺齒的形狀。這種情況大多因為製作直方圖的方法錯誤(如:數據分組問題、計算組距問題、計算界限問題等)或數據收集方法不正確(如:不同設備數據、不同人收集的數據、不同時段數據造成)產生。

5.偏態形:高處偏向一邊,另一邊低,拖長尾巴。可分偏右型,偏左型。這種偏態分布理論上是規格值無法取得某一數值以下所致,在質量特性上並沒有問題,但我們需要留意拖長的尾端在技術上是否可接受,同時應考量製程能力,如過程能力不夠時需進行改善。

6.高原形:直方圖的柱子高低近似,柱子間高度相差甚微,看起來有點像高原一樣,則稱為高原形。當數據來自幾種平均值差異不大的產品,而這些產品有混在一起時,製作出來的直方圖往往就是高原形,應層別之後再作直方圖比較。

二.與規格比較:過程是否異常除了查看直方圖的形狀,還要結合產品的規格一起來評估。

在這裡先解釋一下什麼是規格,規格通常是根據客戶要求來定的(產品的規格),然後在實際工作中,收集數據計算出控制限。如果客戶沒有給出,就以行業標準為準。

規格又分為雙側規格(同時有上下限的要求)和單側規格(只有上限或下限的要求,如時間數據、分值數據等)

直方圖與規格比較時又分為符合規格不符合規格兩類:

(一)符合規格:

1.理想型:規格值的平均值與產品的分布平均值重合,而且直方圖的下限與上限均在規格值的上下限範圍之內,直方圖的下限與規格值的下限、直方圖的上限與規格值的上限之間的距離為4個標準差左右,這樣的直方圖時最理想的直方圖。

2.一側無餘裕:產品的分布均在規格值範圍內,但是偏向上限或者下限分布,造成單側擁塞,另一邊餘裕很多。若過程再變大(或變小)很可能會有不良發生, 必需設法使製品中心值與規格中心值吻合。

3.兩側無餘裕:產品分布的下限與規格下限重合,分布上界限與規格上限重合,即分布與規格恰好相等。雖沒有不良發生,但過程稍有變動,就有不良品發生的風險。最好是平均值保持原狀,但變異方面採取縮小的對策。

4.餘裕太多:也就是過度集中,該類產品分布的範圍較小,而規格值的範圍太大,也就是說製程的能力遠遠大於規格的要求。看上去非常好的圖型,但如果此種情形是因增加成本而得到, 並非好的現象, 故可考慮縮小規格界限或放鬆質量變異, 以降低成本、減少浪費。

(二)不符合規格:

1.平均值偏左(或偏右):也叫單邊不良形,表示平均位置有偏差,應考慮過程的能力不足,需尋找系統原因,糾正平均值位置,提高品質水平。

2. 分散度過大:也可稱為雙邊不良形。產品的最大值與最小值均超過規格值, 有不良品發生表示標準太大, 製程能力不足。應針對變動的人員、方法等方向去追查, 要設法使產品的變異縮小; 如果是規格訂得太嚴, 應放寬規格。

3.離島現象:有「離島」產品出現,且發生不良現象,說明過程有異常原因存在,應調查離島的原因,判明離群原因(通常為特異原因)並予以去除。

直方圖的製作

製作直方圖的步驟:

第1步:整理數據表,用隨機抽樣的方法抽取數據,一般要求數據在50個以上。

【例】某醫院門診部對內科病人候診時間進行抽樣調查,測量了2月份60位病人的等候時間,經整理如表1

第2步:計算全距(R):也叫極差,是所有數據中最大值與最小值的差。

R=Xmax - Xmin =96 - 1 = 95

第3步:確定組數(k)。組數不可過多過少,過少,會掩蓋數據的分布規律;組數過多,使數據過於零亂分散,也不能顯示出質量分布狀況。組數的確定可有兩種方法:

方法1:可參考表2的經驗數值

方法2:很多情況下,分組數約等於樣本容量的平方根是比較合適的:表1中有60個數據點,應分組數為:k = √60 ≈8

第4步:決定組距(d)。組距是組與組之間的間隔,也即一個組的範圍。因為各組距應相等,於是有:

組距(d)= 全距(R)÷組數(k)= 95÷8=11.875≈12

(為便於計算平均數與標準差,組距常取為5的倍數或10的倍數,或2的倍數)

第5步:決定各組的上下組界。每組的最大值為上限,最小值為下限,上、下限統稱組限

最小一組的上組界=下組界(最小值-測定值最小位數/2)+組距 = 0.5+12 =12.5

……

依此類推,計算至最大一組之組界

第6步:製作頻率表

第7步:畫直方圖(簡單直方圖)

以橫坐標表示各組的中點或組限,縱坐標表示頻數,畫出直方圖

組邊限值

組中值

第8步:加入必要的元素:樣本大小、均值、標準差、規格均值、規格上下限

註:此圖因為時間數據,只有上限要求,因此只有一條規格線

解釋結果:

樣本均值為 30.52,略高於目標值30,但已經很接近了。分布呈右偏斜,說明尚有部份候診時間偏長,且有5例候診時間過長,超過規格上限60分鐘。對此我們可針對超出規格上限的不良事件找尋原因,糾正缺陷,去除不良影響,以改善整體的分布形態,提高過程能力。

軟體繪製直方圖步驟

目前我們可用來繪製直方圖的軟體有EXCEL和MINITAB。由於使用EXCEL製作直方圖過程較複雜,需佔用較多時間去完成。而MINITAB軟體在製圖方面,操作簡單,容易掌握,花費時間少。因此,這裡只介紹使用MINITAB軟體製作直方圖的過程。

第1步:打開MINITAB軟體,在新建工作表裡導入一組數據(可從EXCEL表中複製數據,粘貼到工作表中)。

第2步:菜單欄中選擇「圖形」,在圖形下拉欄點「直方圖」

第3步:點擊「直方圖」後將跳出下面的對話框,因我們只需繪製簡單的直方圖,所以選擇「簡單」圖形,點「確定」鍵。

第4步:進入下面的對話框時,將滑鼠移至左邊方框內雙擊選擇「候診時間」,此時「候診時間」的數據列已選中進入「圖形變量」框內。

第5步:點「確定」鍵進入下一步,直方圖的初型已完成。

在此需要強調一下,因為軟體設定的分組規則與人工計算的方法不一樣,經過反覆驗證發現MINITAB的分組規則是樣本容量在100以下均為11組,樣本容量大於100的分組是20組。所以根據實際情況,我們可區間的參數進行調整。

第6步:調查區間數。

⑴ 單擊柱狀區域,令每個柱子的邊角位出現白色小方格

⑵ 滑鼠點右鍵在出現的菜單框內選擇「編輯條形」,便出現以下對話框:

⑶ 點擊「區間」可見:這裡可以看到區間數為11,下一步我們要將區間數改為8。

⑷ 點中「區間數」前面的選項框,「區間數」右邊的數字框底色變白,裡面的數字可調整。將11改為8,按「確認」鍵。

⑸ 已成功改為8組區間的直方圖:

因為我們取的是時間數據,不會存在0以下的數值,我們看到軟體直動生成的組中值是0,區間下限是-7.5,所以接下來我們還要對區間的上下限設定進行修改。

第7步:調整組限。

⑴ 重複第6步的(1)—(3),進入以下界面:

⑵ 將區間類型的「中點」改為「割點」,確定後可見下圖。如果有需要我們還可對「中點/割點位置」內的數值進行修改。

⑶ 已成功修改了組限的直方圖:

第8步:在圖形中加樣本數、均值、標準差

⑴ 將滑鼠移至圖形中央,點右鍵,在菜單框內選擇「添加」→「分布擬合值」

⑵ 在下面的對話框中選「確定」

⑶ 圖形中增加一條正態分布的概率密度曲線,右側標有樣本數、均值和標準差。

第9步:插入規格均值和規格上下限

⑴ 將滑鼠移至圖形中央,點右鍵,在菜單框內選擇「添加」→「參考線」

⑵ 規格均值線和上下限線是由X軸插入,所以要將光標移到「在數據值處顯示參考線」。

⑶ 如果要設定的目標平均值是30分鐘,目標上限是不超過60分鐘,就在「在數據值處顯示參考線」下端的框內鍵入數值「30」確定後再重複第9步的⑴重新進入上面的對話框,再次在「在數據值處顯示參考線」下端的框內鍵入數值「60」,便可得到下圖:

⑷ 為了清晰定義插入的兩條參考線,還需對「30」和「60」的數值標籤進行編輯。選中數值「30」,點右鍵,選「編輯X線條標籤」。

⑸ 在「文本(T)」下框中鍵入「規格均值=30」。規格上限的標籤設定同此步驟

⑹ 以下便是完整的直方圖:

相關焦點

  • 直方圖是什麼,及直方圖在攝影中的應用
    作為一張圖片的「資料庫」,直方圖裡基本包含了圖片的所有數據,我們可以通過直方圖來了解照片的真實信息。學會直方圖,不論是在前期拍攝,還是在照片的後期修飾,都能起到事半功倍的效果。今天,我們就從以下幾個部分來深入了解直方圖。
  • 你絕對看得懂直方圖!照片直方圖的講解與攝影應用
    ——畢卡索本文有2000+字,是非常詳細的講解,如果你是利用碎片時間閱覽,推薦先點收藏!我是旅意攝影師,建築學碩士,每日原創攝影教程與攝影資訊分享,還有歐洲旅行vlog,關注就不會錯過精彩內容啦!(即使是使用raw格式拍攝也是一樣的,但請查閱你的相機說明書來確定直方圖是否是顯示的raw數據。)
  • 用Excel做數據分析——直方圖
    使用Excel自帶的數據分析功能可以完成很多專業軟體才有的數據統計、分析,這其中包括:直方圖、相關係數、協方差、各種概率分布、抽樣與動態模擬、總體均值判斷,均值推斷、線性、非線性回歸、多元回歸分析、時間序列等內容。下面將對以上功能逐一作使用介紹,方便各位普通讀者和相關專業人員參考使用。
  • OpenCV-Python 直方圖-2:直方圖均衡|二十七
    因此,您需要將這個直方圖拉伸到兩端(如下圖所示,來自wikipedia),這就是直方圖均衡化的作用(簡單來說)。這通常會提高圖像的對比度。我建議您閱讀直方圖均衡化上的Wikipedia頁面,以獲取有關它的更多詳細信息。它很好地解釋了示例,使您在閱讀完之後幾乎可以理解所有內容。相反,在這裡我們將看到其Numpy實現。之後,我們將看到OpenCV功能。
  • 不懂直方圖?直方圖裡面的5個問題,我幫您詳細解答
    不懂直方圖?直方圖裡面的5個問題,我幫您詳細解答 剛開始拿起相機拍攝的照片不是過爆就是欠爆,在直方圖中表現為整體向左或者向右測堆積,波峰出現在偏左測或者偏右測!
  • OpenCV-Python 直方圖-3:二維直方圖|二十八
    目標在本章中,我們將學習查找和繪製2D直方圖。這將在以後的章節中有所幫助。介紹在第一篇文章中,我們計算並繪製了一維直方圖。 之所以稱為一維,是因為我們僅考慮一個特徵,即像素的灰度強度值。 但是在二維直方圖中,您要考慮兩個特徵。
  • 攝影基礎知識:教你如何分析攝影中的直方圖!
    很多剛入門的朋友可能會問,什麼是直方圖?直方圖有什麼作用呢? 對於一個攝影人,直方圖是非常重要的,它能科學的告訴你,一張照片的曝光是否合理。那麼,今天我們來學習直方圖的應用。如何調出直方圖如上圖所示,照片縮略圖的右邊就是我們所說的直方圖,想要看到直方圖,首先要把照片的詳細信息面板調出來;如何調出來呢?方法很簡單,先找到相機中回放的按鈕(圖中箭頭指向的地方),然後再找下你的相機上是否有個「INFO」或者 「DISP」的按鍵,按下這個按鍵照片的詳細信息就出來了。
  • 詳細講解PS中的色階、直方圖,一篇文章讓你恍然大悟
    色階是Photoshop中最為 重要調整工具之一,懂得用好色階面板,對調節圖片明暗程度、校正色調範圍、色彩平衡是非常有幫助的,本文詳細介紹色階面板和教你如何使用色階面板和教你看懂色階直方圖。按住Ctrl+O快捷鍵打開一張照片,然後執行「圖像->調整->色階」命令(快捷鍵Ctrl+L),打開效果如下圖所示:色階詳細介紹:(1)預設:色階面板裡面提供多種預設,比如較暗,較亮等預設,這些我們都可以直接調用使用
  • 直方圖、正態圖,如何解讀才正確?
    直方圖是一種用於展示定量數據分布的常用圖形。通過直方圖,用戶可以很直觀的看出數據分布的形狀、中心位置以及數據的離散程度等。很多軟體也可以為直方圖添加上正態曲線,進一步通過正態曲線判斷數據的正態性。直方圖與柱狀圖的區別需要注意的是,直方圖和我們常見的柱狀圖可不一樣。直方圖用於顯示定量數據的分布;而柱狀圖對比定類數據。在繪製時,直方圖是按照數值大小進行分組排列,前後順序不可變更;柱狀圖則是對分類對象進行分組,而不是根據具體數值進行分組,分組順序可以調整。
  • 質量控制知識點:直方圖的觀察與分析
    監理工程師考試直方圖的觀察與分析資料已經提供給大家,2019年監理工程師考試時間5月18、19日,在考試之前建設工程教育網小編將持續為考生更新監理工程師考試知識點,希望成為大家備考監理工程師考試的得力小幫手。    2019年監理工程師考試《質量控制》知識點:直方圖的觀察與分析資料已經準備好啦,大家快來學習吧!
  • Lightroom直方圖的詳細使用方法,讓修片變得更簡單
    直方圖不管是在前期拍攝,還是後期的處理都是攝影師的強有力幫手。在本教程中,我們將向您詳細介紹在Lightroom中,如何觀察和使用直方圖,為我們的後期處理提供可靠的參考。什麼是直方圖在攝影中,我們常會看到兩種直方圖:圖像直方圖和顏色直方圖。
  • 初一數學知識點:直方圖知識點
    中國教育在線編輯了直方圖知識點,希望對大家有所幫助!  1.頻數與頻率:每個對象出現的次數為頻數,而每個對象出現的次數與總次數的比值為頻率。  2.頻數分布表:運用頻數分布直方圖進行數據分析的時候,一般先列出它的分布表,其中有幾個常用的公式:各組頻數之和等於抽樣數據總數;各組頻率之和等於1;數據總數×各組的頻率=相應組的頻數。
  • 質量工具之直方圖
    直方圖一般用橫軸表示數據類型,縱軸表示數據分布情況,長方形的寬度表示數據範圍的間隔,長方形的高度表示在給定間隔內的數據分布。在質量管理中,如何監控並預測產品質量狀況?如何對質量波動進行分析?直方圖就是把這些問題圖表化處理的工具之一。
  • 頻數直方圖簡稱為直方圖的各種圖形
    頻數直方圖簡稱為直方圖,是用來顯示某一種質量特性數據的分布狀況的。直方圖由一系列寬度相等高度不同的相鄰長方形組成,橫坐標表示產品質量特性值,長方形的寬度就是數據分組的組距間隔,縱坐標表示每組內數據的頻數,也就是每組內產品的數目。
  • QC七工具之直方圖
    ,並以此為基礎繪製而成的一張直方圖。觀察和分析直方圖時應著眼於整個圖形的形狀。在正常型的直方圖裡,中部有一個山峰,左右兩邊逐漸降低,近似對稱。這時,可以大致判定流程處於穩定狀態,圖一所示的直方圖就屬於這種狀態。應用直方圖時,應當注意以下事項:1. 當出現非正常型直方圖,如偏向型直方圖、雙峰型直方圖、孤島型直方圖等時,往往提示流程存在著嚴重的變異源,需要我們進一步調查原因。
  • OpenCV-Python 直方圖-4:直方圖反投影|二十九
    目標在本章中,我們將學習直方圖反投影。理論這是由Michael J. Swain和Dana H. Ballard在他們的論文《通過顏色直方圖索引》中提出的。直方圖反投影與camshift算法等配合使用。我們該怎麼做呢?我們創建一個圖像的直方圖,其中包含我們感興趣的對象(在我們的示例中是背景,離開播放器等)。對象應儘可能填充圖像以獲得更好的效果。而且顏色直方圖比灰度直方圖更可取,因為對象的顏色對比灰度強度是定義對象的好方法。
  • 什麼是直方圖,攝影中直方圖怎麼看?
    圖片中的直方圖顯示了每種顏色(紅色,藍色和綠色)的像素值分布,它們與次要顏色(洋紅色,青色和黃色)重疊,最後顯示了包含所有三種顏色並顯示為灰色的區域。直方圖分析當圖像曝光良好時,直方圖將在中間包含大條形圖,而在邊緣周圍則幾乎沒有信息。
  • 異常血小板直方圖的原因分析解讀
    血小板直方圖是反映血小板體積大小分布的一個曲線圖,正常的血小板直方圖呈偏態分布(如下圖),左移表示血小板體積偏小,右移表示血小板體積偏大。 本文介紹一例異常血小板直方圖的原因分析解讀
  • 怎麼採用SPSS製作「直方圖」?
    直方圖(Histogram)用於描述連續變量的分布狀況。以各矩形的面積表示各組段的頻數(或頻率),各矩形的面積總和為總頻數(或為1)。經常用於探索數據的分布類型。 一、簡單直方圖 案例:用直方圖描述240名受試者「體脂率」的分布狀況。
  • 超越主觀的實質:一種超越直方圖
    超越主觀的實質:一種超越直方圖數據的分析研究是整個統計過程的必不可少的組成部分。分析研究時必須熟練地運用文字與圖形方式表達,並要求無主觀性,適當的利用數學,統計和科學分析的方式進一步挖掘數據背後的信息與規律。