測量值不服從正態分布該怎麼辦?

2021-01-10 中捷佳信企業管理諮詢

在統計過程控制中,為什麼數值不服從正態分布,如果不服從正態分析,我們又該怎麼處理?

問:在統計過程控制的活動中,計量型特徵值不服從正態分布是怎麼回事?

答:正態分布是我們基於樣本信息,對其背後虛構的總體中數值的分布情況進行描述用的,當樣本數據證明背後的總體不服從正態分布時,我們應該先考慮數據的來源。

1、在統計過程控制中,為什麼特徵值不服從正態分布?

一般的,我們用樣本的直方圖去推斷總體中數值的分布情況,如果量具的解析度相對於過程變差而言不夠,則測量出的數值不同數量太少,會影響到對背後總體分布模型的推斷,此時,就會出現不服從正態分布的情況。如下圖所示。

當量具的解析度足夠去分辨特徵值變差時,如果此時數值不是正態分布。

在通常的QC7大手法培訓時,告訴大家,要看直方圖是不是有分層,是否有左傾或右傾趨勢,是否有孤島型等,這些方法都幫助去查找為什麼數值結果不是正態的原因,我們這裡不做詳細展開說明。

對於統計過程控制的數據,通常是按照時間次序抽取的樣本測量得到的數值,通常可以用單值運行圖,去觀察數據,查找為什麼數據不符從正態分布,往往能得到更多信息。如下圖所示:

要強調一點,並不是所有的特徵值理論上就應該是服從正態分布,現實生產過程中,有很多不服從正態分布的實例,下面列一下

單邊公差,一側界限為0的特性

鑑於物理原因,分布是不對稱的(如上面第一張圖)

實例: 表面測量 (粗糙度),失圓度, ...

過程有某種趨勢

經典實例:工具磨損(如上面第二張圖)

特性的「非隨機變差」

自然的原材料易受特殊原因的變差

供應商無法提供均一的品質(如上面第三張圖)

工具更改造成的波動,...

對於這些過程,不服從正態分布是它們固有的特點。我們追求「能力」滿足要求或者追求過程要「受控」,並不是為了追求數值符合正態分布,我們的目的是為了追求特性值儘可能一直靠近目標值「built to nominal」。

當我們知道過程是由於上面這些原因,導致特徵值不服從正態分布,過程是按預計的時間分布模型來生產數據,非正態分布是可以接受的。當然,如果有些特徵值理論是應該符合正態分布,但在過程改進初期,對過程中的關健影響因素沒有透徹了解而導致結果不符合正態分布,這時通常會要求儘可能去調查了解原因,儘可能去改進並讓過程"受控"。

2、非正態分布如何計算過程能力/性能?

(以上是正態時的能力分析公式)

對於非正態分布如何去計算過程能力或過程性能呢?

能力分析是建立隨機採樣的結果上,獲取關於過程表現,以及對未知總體的信息,通常這些分析是基於總體分布已知的情況。對於總體分布模型的推斷,需要先預設一個默認的分布,通過假設檢驗的方法,如果樣本不足以拒絕,就會接受該分布模型,而對於默認分布模型的選擇可以根據測量特徵值的類型來選取,如下圖所示:

當然,關於默認分布模型的選擇,在不同公司根據自身的理解,有不同的標準。

一旦分布模型選擇好了,基於ISO22514國際標準的百分位數法,就可以同樣計算這些過程的能力指數了,這些分析通常可以藉助專業的軟體來自動執行。

3、總結

當在統計過程控制中,發現數值非正態分布時,我們需要從樣本數據本身出發,去尋找非正態分布的原因,第一個想到的就是測量量具的解析度是否具有足夠的,如果量具的解析度都不夠,是不足以去區分測量過程的變差,並建立合理的分布模型的。另一個方面,可以從測量值的時間系列中獲取過程關於時間的表現信息,如果過程是按預計的模式生成的數據,只要過程是受控,不是正態分布也是可以接受的。當然,如果過程的表現不受控,則需要去調查原因,並做出改進。

我們進行過程控制,進行能力分析的目標是為了確保過程的輸出儘可能一直靠近目標值,並不是為了追求正態分布,當實際過程是受控,但測量數值經證明不符合正態分布時,我們可以用不同的分布模型去匹配現實中的數據,默認分布模型不同公司有不同的選擇,通常報告能力指數時,應該把這些信息同時報告給客戶。

相關焦點

  • [道贏·科技] | 鋰電生產製程數據不服從正態分布,正常嗎?
    在日常工作中,正態分布是我們最為常見的數據分布類型。但很多時候,我們會發現自己的數據分布樣式 」千奇百怪「 ,與正態分布相比相去甚遠。那麼,一組數據不服從正態分布,正常嗎?如果不服從正態分布的數據暗示著某些異常的話,發生的又是什麼問題呢?為了回答這些問題,先要從正態分布的產生原理說起......正態分布是如何產生的?
  • 偏度與峰度的正態性分布判斷
  • 正態分布的常用數據 - CSDN
    #尋找真知派#如上一篇文章所述,樣本所屬總體服從正態分布是數據分析和數據挖掘等數據處理的重要前提。如果我們採集的樣本並不能確認其總體是否服從正態分布,那麼數據處理的結果就是不可靠的。因此,對樣本數據進行正態分布檢驗十分必要。
  • 幾種分布概述(正態分布/卡方分布/F分布/T分布)
    其概率密度函數為正態分布的期望值μ決定了其位置,其標準差σ決定了分布的幅度。我們通常所說的標準正態分布是μ = 0,σ = 1的正態分布。當μ=0,σ=1時,正態分布就成為標準正態分布N(0,1)。概率密度函數為:
  • 如果數據分布是非正態的怎麼辦?用切比雪夫不等式呀!
    因為無論是正態分布的性質還是表達式都非常的簡潔:它的均值(mean)、中值(median)和眾數(mode)都相同只需要用兩個參數就可以確定整個分布所以問題在哪呢?這看起來都挺棒的啊,有什麼問題嗎?問題是通常是,你可能會找到特定的數據集分布,這些分布可能不滿足正態性,即正態分布的性質。但由於過度依賴於常態假設,大多數業務分析框架都是為處理正態分布數據集而量身定做的。假設你被要求檢測來自某個流程(工程或業務)的一批新數據是否有意義。所謂「有意義」是指新的數據是否屬於它的「預期範圍」,或者在它的「預期範圍」之內。
  • 數據正態分布的意義 - CSDN
    什麼是正態分布關於什麼是正態分布,早在中學時老師就講過了。通俗來講,就是當我們把數據繪製成頻率直方圖,所構成曲線的波峰位於中間,兩邊對稱,並且隨著往兩側延伸逐漸呈下降趨勢,這樣的曲線就可以說是符合數學上的正態分布。由於任何特徵的頻率總和都為100%或1,所以該曲線和橫軸之間部分的面積也為100%或1,這是正態分布的幾何意義。
  • 正態分布 線性回歸 - CSDN
    採用最小二乘法進行線性回歸時,需要滿足特定的條件:正態性:一定範圍內,給定任意x值,對應的y均服從正態分布獨立:即誤差項間不存在相關,一般時間序列數據會存在自相關線性:因變量和自變量有線性關係同方差性:即模型誤差項的方差相等。
  • 關於正態分布和貝塔分布的案例介紹
    打開APP 關於正態分布和貝塔分布的案例介紹 賈恩東 發表於 2020-10-12 11:25:57 正態分布 正態分布,是一種非常常見的連續概率分布,其也叫做常態分布(normal distribution),或者根據其前期的研究貢獻者之一高斯的名字來稱呼,高斯分布(Gaussian distribution)。正態分布是自然科學與行為科學中的定量現象的一個方便模型。
  • 徹底理解正態分布——強大的數學分析工具
    正態分布也被稱為高斯分布或鐘形曲線(因為它看起來像一個鍾),這是統計學中最重要的概率分布,就像我們在大自然中經常看到的那樣,它有點神奇。例如,身高、體重、血壓、測量誤差、智商得分等都服從正態分布。還有一個跟它相關的,並且非常重要的概念,叫中心極限定理,這將在以後的文章中討論。
  • 副教授懟教務辦改低學生分數服從正態分布要求 校方回應
    答卷很好,我不可能給地方!什麼分數要服從正態分布,抱歉,我只在意學生!同學們喜歡可以擴散。」網傳截圖顯示,吳姓教師疑在朋友圈中稱,「給多少90分以上的人,是試卷的結果,不是教務辦定的指標;什麼時候開始,教務辦開始幹預教學老師的工作了,讓我把分數改掉——我改誰的成績?把50個學生從90分改成80分?理由是啥?成績不服從正態分布?」
  • 成績必須服從正態分布,中南大學教師怒懟教務辦,網友反應一邊倒
    成績必須服從正態分布,中南大學教師怒懟教務辦,網友反應一邊倒 現在,有很多大學要求,學生的成績必須服從正態分布。注意,不是大學成績「呈現為」正態分布,而是「要求」教師打出的成績實現正態分布。如果學生成績不符合正態分布,教師將無法錄入成績,這一規定令無數學生與教師苦不堪言。
  • 正態分布基本概念及Excel實現
    正態分布在統計中至關重要,主要有以下三個原因:正態分布由圖經典鐘形表示。在正態分布中,您可以計算值以一定範圍或間隔出現的概率。但是,由於將連續變量的概率測量為曲線下的面積,因此來自連續分布(例如正態分布)的特定值的確切概率為零。例如,時間(以秒為單位)被測量並且不計數。
  • 一文搞懂「正態分布」所有重要知識點
    連續型隨機變量研究區間概率了解了正態分布的基本思想,我們來看看實際應用中我們需要掌握的要點。首先,正態分布屬於「連續型隨機變量分布」的一類。我們知道,對於連續型隨機變量,我們不關注「點概率」,只關注「區間概率」,這是什麼意思?
  • 「學生的成績一定要服從正態分布」,這是我在大學聽到最狗的話
    我本來是明白這個問題的,結果昨天,我終於知道問題的答案了,原來大學生的成績必須服從正態分布,咱們一直都活在被正態分布支配的世界裡。什麼是正態分布?通俗來說,成績服從正態分布的意思是,大部分人都處於不上不上的分數水平,高分只能有那麼兩三個人。甚至有的學校必須要求老師強制掛掉排名最後的幾位同學,哪怕他們考得並不差。
  • 正態分布和高斯分布的作用_高斯分布的定義_誤差服從高斯分布
    打開APP 正態分布和高斯分布的作用_高斯分布的定義_誤差服從高斯分布 發表於 2017-12-04 16:38:44   正態分布
  • 第五章 正態分布與正常值範圍估計--第一節 正態分布及其性質
    第五章 正態分布與正常值範圍估計 第一節 正態分布及其性質   一群變量值可能用平均數描述集中的位置,用變異指標描述離散情況,而頻數表則把變量值的分布描繪得更具體。為了直觀還可把頻數表畫成直方圖。如第四章中曾將7歲男童坐高的頻數分布繪成圖4.1。
  • 副教授懟教務辦要求「改低學生分數服從正態分布」,中南大學調查
    答卷很好,我不可能給地方!什麼分數要服從正態分布,抱歉,我只在意學生!同學們喜歡可以擴散。」網傳截圖顯示,吳姓教師疑在朋友圈中稱,「給多少90分以上的人,是試卷的結果,不是教務辦定的指標;什麼時候開始,教務辦開始幹預教學老師的工作了,讓我把分數改掉——我改誰的成績?把50個學生從90分改成80分?理由是啥?成績不服從正態分布?」
  • 正態分布圖
    】正態分布,也稱「常態分布」或「高斯分布」,是連續隨機變量概率分布的一種,常常應用於質量管理控制:為了控制實驗中的測量或實際誤差,常以作為上、下警戒值,以作為上、下控制值,這樣做的依據是:正常情況下測量或實驗誤差服從正態分布。
  • 第三節 正態分布和醫學正常值範圍的估計
    第三節 正態分布和醫學正常值範圍的估計   一、正態分布   (一)正態分布的圖形   將表18-1的110名20歲健康男大學生身高頻數分布繪成圖18-1中的(1),可見高峰位於中部,左右兩側大致對稱。
  • 什麼是正態分布圖?
    【正態分布圖】正態分布,也稱「常態分布」或「高斯分布」,是連續隨機變量概率分布的一種,常常應用於質量管理控制:為了控制實驗中的測量或實際誤差,常以作為上、下警戒值,以作為上、下控制值,這樣做的依據是:正常情況下測量或實驗誤差服從正態分布。