有位朋友在微信群中提問:
Z是標準化正態值,是服從標準正態分布的隨機變量X的取值。
這要先從正態分布說起。
數學理論上可以證明,如果某項指標受到很多項隨機因素的幹擾,而每項幹擾都很小,則所有幹擾影響的綜合結果將導致此項指標的分布為正態分布。事實上,很多生產過程的最終指標都具有這種特點,因此相當多的隨機變量本身都應該是正態分布。
正態分布的概率密度函數為:
正態分布用N(μ,σ2)表示,μ和σ2是正態分布的兩個參數,只要確定了這兩個參數,就可以確定唯一的正態分布。
μ=0,σ=1的正態分布就稱為標準正態分布,是正態分布的一個特例。
如果確定某產品質量特性服從正態分布,就可以用正態分布計算過程能力指數、基準Z值(西格瑪水平)和預期的不合格率等。
例:中國成年男子平均身高服從為170釐米,標準差為6釐米的正態分布。如果讓絕大部分(99%)男乘客能無障礙登車,公共汽車門的高度至少應為達到多少?(該例為中國質量協會2014版註冊黑帶考試樣題第41題)
首先我們模擬了一組數據繪製直方圖:
上圖可以理解為收集了100000個中國成年男子身高數據繪製的直方圖。圖中的橫軸為身高,單位是釐米,縱軸是頻率,更準確的說法是頻數,也就是每個區間內的人數。同時圖中還給出了擬合的正態分布,看起來擬合效果很棒。
如果我們讓圖中的曲線與橫軸圍成的面積等於1,這條曲線就叫做正態分布的概率密度曲線:
在這個圖形中,橫軸仍然是身高,單位是釐米,縱軸變成了概率密度。
確定公共汽車門的高度,實際上就是確定橫軸上的某個x值(公共汽車門高度),使得隨機變量X(成年男子身高)低於這個x值的概率為0.99,也就是有99%的成年男子的身高低於這個值。
身高是從左向右逐漸增加,所以這個x值的左邊面積為0.99:
這個數值約為184釐米。有99%的中國成年男子身高低於184釐米,這些人登上車門高度為184釐米的公共汽車是沒有障礙的。
有了統計軟體的幫助,我們很容易計算X值。但在沒有計算機的年代能否計算概率或者X值呢?總不能去算定積分吧?
統計學家給我們算好了表格,我們可以直接查表。但各行各業的數據量綱不同,不可能每個行業甚至每個問題都給出一張表,所以需要先把一般的正態分布變成標準正態分布,然後再查表。
標準正態變換的公式為:
可以理解為隨機變量X比均值大了多少個標準差(Z有可能出現負值,小於均值的X值經過標準正態變換後的Z值就是負值。)
用圖形表示為:
在上圖中有兩條橫軸,一條是X軸,對應的是隨機變量X,是有量綱的;一條是Z軸,對應的是標準化正態值(Z值),是沒有量綱的。兩條軸對應區間的概率是相同的,所以我們可以把一般正態分布求概率或X值的問題變成標準正態分布的求解。
例如,X軸上的176轉換為標準化正態值是1,中國成年男子身高低於176釐米的概率與標準正態分布Z值小於1的概率是相同的,都是0.8413:
所以即使沒有統計軟體的支持,我們把一般正態分布轉化為正態分布後就可以查表了。對於公共汽車門高度的問題,我們已知某個x值左側的面積為0.99,查標準正態分布函數表:
最接近0.99的單元格對應的Z值為2.33,也就是x比均值高2.33個標準差,則:
X=170+2.33×6=183.98≈184,與Minitab計算結果一致。
標準化正態值的另一個作用就是計算過程的基準Z值,基準Z值加1.5就是西格瑪水平。
過程特性無論是連續型數據還是離散型數據,只要知道了過程合格率,把合格率放在標準正態分布的左邊,對應的臨界值就是基準Z值(西格瑪水平)。
(1)正態分布
某過程生產的產品關鍵特性是重量,規格限為[44.5,45.5],單位為kg,已知A過程服從N(45,0.252),請問該過程的西格瑪水平是多少?
先求合格率:
再求西格瑪水平:
基準Z值為1.69,西格瑪水平為3.19。
(2)某瓷磚生產企業出廠檢驗結果顯示,在1-3月份生產的某類瓷磚中抽取了1000塊,檢驗發現200個瑕疵,瑕疵的出現是完全隨機的,有瑕疵點的瓷磚則被認為不合格,則該類瓷磚生產過程的西格瑪水平是多少?
先計算一次合格率:
再計算西格瑪水平:
基準Z值=0.9104,西格瑪水平為2.4104。
友情提示
為方便廣大統計應用工作者討論問題,我們建立了「六西格瑪統計」微信群。歡迎識別小編微信號加為好友,由小編推薦加入「六西格瑪統計」微信群。