首先,我們還是先從一個例子入手
說現有四條生產線,生產同一種型號的墊片,為了了解不同生產線的點皮納的斷裂強度有無明顯差異,現分別從每條生產線隨機抽取5各墊片測定其斷裂強度,數據如下。
問:
四條生產線生產的墊片的平均斷裂強度是否相同?
有時,我們會遇到需要比較多個總體的均值的問題。先來看這個例子;在這個問題中,我們遇到需要比較4各總體均值的問題。這類問題可以用方差分析的方法來解決。
為了表述方便,這裡先給出在以後實驗設計中經常會遇到的幾個概念
因子
對指標有影響的因素稱為因子,通常情況下,我們約定用大寫字母來表示因子。在上例中,生產線對指標墊片的斷裂輕度有影響,因此,生產線便使因子,可以記為A.
水平
在實驗中,因子所出的狀態稱為因子的水平,通常情況下,我們約定用因子的字母加下表來表示。在上例中,有四條生產線,這便是產線這一因子的四個水平。分別記為A1,A2,A3,A4
實驗條件(也稱為處理)
在一次實驗中,每個因子總取一個特定水平,若干因子各取一個特定的水平構成的組合,稱其為一個實驗條件。在上例中,每一個水平都是一個實驗條件。
指標
衡量實驗條件好壞的量,稱為指標,用y表示,它是一個隨機變量。在上例中,墊片的斷裂強度就是實驗指標。
單因子方差分析的模型
假設在一個實驗中只考察一個因子A,它有r個水平,在每一水平下進行m次重複實驗,其結果用yi1, yi2,……yim(i=1,2,…..r)表示。記第i水平下的數據和為Ti,數據均值為y-bar(i),總的均值為y-bar。此時共有n=rxm個數據。常常把數據列成表格形式。
為了對這些數據進行統計分析,需要對數據做幾項假定(或規定)
在水平Ai下,yi1, yi2,……yim是來自正態分布的一個樣本其中諸ui就是要比較的對象。在不同水平下的方差相等,即σ1^2=….=σr^2=σ^2,只要諸實驗是在相同條件下進行,方差相等一般可以滿足。各數據yij相互獨立,這通常只把實驗次序隨機化即可得到滿足。在上述三項假定下,諸總體均值是否先等的問題,歸結為一個假設檢驗的問題,其原假設與被子假設分別為;檢驗這一假設的統計方法就是方差分析。平方和分解
上述n個數據不全相等。他們的波動可以用總的偏差平方和SST表示。引起數據波動的原因不外乎如下兩個;一是由於因子A的水平不同,當假設H0不真時,各個水平下指標的均值不同,這必然會使實驗結果不同,我們可以用組件偏差平方和來表示,也稱因子A的偏差平方和。這裡乘以m是因為每一水平下進行了m次實驗。
二是由於存在隨機誤差,即使在同一水平下獲得的數據間,也有差異,這是除了因子A的水平外的一切原因引起的,我們將它們歸結為隨機誤差,可以用組內偏差平方和表示。可以證明,總偏差平方和等於組件偏差平方和加上組內偏差平方和。
自由度與均方和
上述這些平方和的大小與數據個數有關。一般將,數據個數越多,偏差平方和越大;水平越多,因子A的偏差平方和也越大。所以,為了進行比較,還需要引入自由度的概念。
因子和誤差的均方和
我們將因子或誤差的偏差平方和與相應的自由度之比稱為因子或誤差的均方和。
求取F比與拒絕域
計算統計量F的值,確定F的拒絕域;
計算結果
結論
根據例題條件,計算相應數據,將統計量F比值與判斷條件進行對比,由於統計量F比值大於臨界判斷條件,得出結論,因子A是顯著因子。
這就是單因子方差分析的計算過程。我們將在下節,採用MINITAB工具,了解在MINITAB中做單因子方差分析時的步驟。觀察其結果。
精益六西格瑪管理思想,方法,工具。純乾貨知識分享。歡迎關注討論。和大家一起探討科學管理方法。為提升中國製造業水平儘自己的薪火之力!謝謝。