基礎準備
將分析階段的主要流程和使用工具用一個循環圖來表示:
本篇介紹驗證分析結果的兩個工具:假設檢驗和方差分析。在統計基礎中都詳細介紹過它們的公式推導,應用和範例,下面主要介紹這兩個工具在六西格瑪分析階段的應用。
假設檢驗
在統計基礎中,系統介紹過假設檢驗,從假設檢驗理論基礎到實際運用。對於這部分內容不知或遺忘者請前往統計基礎導航頁閱讀相應文章回顧,有任何疑問請在文後提問,編者將儘快回復。
分析階段假設檢驗的作用
利用頭腦風暴法可以提出許多可能的原因,那麼它們是否確實是影響關鍵質量特性的真正的原因呢?這就需要用數據進行驗證。假設檢驗便是這樣一種統計分析上具。譬如:
目前的工藝是否符合質量要求?
是否因為採用了某廠的原料使質量變差了?
不同的統計量(Z統計量、t統計量或F統計量等),假設檢驗的方法也不同。分析階段運用得假設檢驗主要是對於正態均值的假設檢驗(t統計量)。
範例分析
用戶反映某零件的一個指標近期不太穩定。由於近期更換了原料,那麼是否因為更換了原料引起的?經分析零件的該指標服從正態分布,用戶要求其均值為5,為了驗證更換原料是否是引起指標不穩定的原因,從生產線上隨機抽得9個零件,測得的指標值為:4.9、5.1、4.6、5、5.1、4.7、4.4、4.7、4.6。那麼新工藝是否滿足用戶的要求呢?
1、提出假設;
這裡質量特性y服從正態分布,如果新原料滿足用戶要求,那麼零件的均值為5;如果不滿足用戶要求,那麼零件的均值不等於5。這就是關於均值的兩個命題,在假設檢驗中把它們稱為「假設」,前一個稱為原假設,後一個稱為備擇假設。記為:
如果原假設為真就認為更換原料不是一個關鍵原因,如果原假設不真就認為更換原料是一個關鍵原因,假設檢驗就是要判斷原假設是否為真,當原假設不真時,就接收備擇假設。
2、選擇檢驗統計量
如上圖所示,在統計基礎系列文章中介紹過,總體標準差未知,對樣本均值的假設檢驗需要用到t統計量,t統計量的計算式如下:
3、給定顯著性水平,確定臨界值
顯著性水平:常用的顯著性水平有0.1、0.05和0.01,它們對應的置信水平就是90%、95%和99%。查t分布表,獲得對應的臨界值。當然,根據單側檢驗和雙側檢驗的區別,同樣的顯著性水平,對應的t臨界值也是不一樣的。在上面例題中,是雙側檢驗。
4、根據樣本計算t值,得出結論
根據樣本和t統計量計算公式,得到的t值,將它與查表得到的t臨界值對比,得到結論:
方差分析
方差分析也是一種假設檢驗方法。它適用於多組數據的比較。譬如某種產品的原料來自三個不同的工廠,利用頭腦風暴法時,有人提出產品質量不穩定的可能的原因之一是原料來源不同,那麼這是否確實是質量不穩定的原因呢?為此需要對來自每一工廠的原料生產的產品測試其性能,收集數據加以驗證。現在有三個工廠的原料,那麼就可以收集三組數據。若假定每組數據來自正態總體,且每一總體的方差相等,各數據是獨立收集的,那麼我們需要比較的便是各個總體的均值是否相等。若他們的均值之間沒有顯著差異,那麼這就不是主要原因,否則這是一個主要原因。檢驗這一問題的統計方法可以採用方差分析方法。用統計的語言來講,方差分析是檢驗多個具有同方差的正態總體均值是否一致的一種統計分析方法。
範例分析
某廠生產中需要使用的一種零件可以由甲、乙、丙二個工廠提供,零件的強度對本廠產品質量是有影響的。為了了解不同工廠的零件的強度有無明顯的差異,現分別從每一個工廠隨機抽取四個零件測定其強度,數據如下表所示,試問三個工廠的零件強度是否相同?該例題的計算過程不表,大家可以參考下面文章,自己動手試算:
方差分析:單因素方差分析
Excel數據分析工具:單因素方差分析
第一篇文章為方差分析的理論介紹,第二篇文章為用Excel進行方差分析。
有效學習應該是一項系統工程,「生活統計學」將發布過的文章系統匯總,製成導航頁,放置於平臺首頁下方的不同欄目中,能夠極大的方便讀者的獲取與系統閱讀:
分享各自行業的數據研究項目及其成果,這是你我共同成長的平臺。
生活統計學QQ群:134373751,內有軟體分享;
微信群:請掃描下方二維碼,2016.8.4之前有效: