來源:網絡
單因素方差分析
(一)單因素方差分析概念
是用來研究一個控制變量的不同水平是否對觀測變量產生了顯著影響。這裡,由於僅研究單個因素對觀測變量的影響,因此稱為單因素方差分析。
例如,分析不同施肥量是否給農作物產量帶來顯著影響,考察地區差異是否影響婦女的生育率,研究學歷對工資收入的影響等。這些問題都可以通過單因素方差分析得到答案。
(二)單因素方差分析步驟
第一步是明確觀測變量和控制變量。例如,上述問題中的觀測變量分別是農作物產量、婦女生育率、工資收入;控制變量分別為施肥量、地區、學歷。
第二步是剖析觀測變量的方差。方差分析認為:觀測變量值的變動會受控制變量和隨機變量兩方面的影響。據此,單因素方差分析將觀測變量總的離差平方和分解為組間離差平方和和組內離差平方和兩部分,用數學形式表述為:SST=SSA+SSE。
第三步是通過比較觀測變量總離差平方和各部分所佔的比例,推斷控制變量是否給觀測變量帶來了顯著影響。
(三)單因素方差分析原理總結
在觀測變量總離差平方和中,如果組間離差平方和所佔比例較大,則說明觀測變量的變動主要是由控制變量引起的,可以主要由控制變量來解釋,控制變量給觀測變量帶來了顯著影響;反之,如果組間離差平方和所佔比例小,則說明觀測變量的變動不是主要由控制變量引起的,不可以主要由控制變量來解釋,控制變量的不同水平沒有給觀測變量帶來顯著影響,觀測變量值的變動是由隨機變量因素引起的。
(四)單因素方差分析基本步驟
1、提出原假設:H0——無差異;H1——有顯著差異
2、選擇檢驗統計量:方差分析採用的檢驗統計量是F統計量,即F值檢驗。
3、計算檢驗統計量的觀測值和概率P值:該步驟的目的就是計算檢驗統計量的觀測值和相應的概率P值。
4、給定顯著性水平,並作出決策
(五)單因素方差分析的進一步分析
在完成上述單因素方差分析的基本分析後,可得到關於控制變量是否對觀測變量造成顯著影響的結論,接下來還應做其他幾個重要分析,主要包括方差齊性檢驗、多重比較檢驗。
1、方差齊性檢驗
是對控制變量不同水平下各觀測變量總體方差是否相等進行檢驗。
前面提到,控制變量不同各水平下觀測變量總體方差無顯著差異是方差分析的前提要求。如果沒有滿足這個前提要求,就不能認為各總體分布相同。因此,有必要對方差是否齊性進行檢驗。
SPSS單因素方差分析中,方差齊性檢驗採用了方差同質性(homogeneity of variance)檢驗方法,其原假設是:各水平下觀測變量總體的方差無顯著差異。
2、多重比較檢驗
單因素方差分析的基本分析只能判斷控制變量是否對觀測變量產生了顯著影響。如果控制變量確實對觀測變量產生了顯著影響,進一步還應確定控制變量的不同水平對觀測變量的影響程度如何,其中哪個水平的作用明顯區別於其他水平,哪個水平的作用是不顯著的,等等。
例如,如果確定了不同施肥量對農作物的產量有顯著影響,那麼還需要了解10公斤、20公斤、30公斤肥料對農作物產量的影響幅度是否有差異,其中哪種施肥量水平對提高農作物產量的作用不明顯,哪種施肥量水平最有利於提高產量等。掌握了這些重要的信息就能夠幫助人們制定合理的施肥方案,實現低投入高產出。
多重比較檢驗利用了全部觀測變量值,實現對各個水平下觀測變量總體均值的逐對比較。由於多重比較檢驗問題也是假設檢驗問題,因此也遵循假設檢驗的基本步驟。
介紹幾種常用檢驗統計量的構造方法
(1)LSD方法
LSD方法稱為最小顯著性差異(Least Significant Difference)法。最小顯著性差異法的字畫就體現了其檢驗敏感性高的特點,即水平間的均值只要存在一定程度的微小差異就可能被檢驗出來。
正是如此,它利用全部觀測變量值,而非僅使用某兩組的數據。LSD方法適用於各總體方差相等的情況,但它並沒有對犯一類錯誤的概率問題加以有效控制。
(2)S-N-K方法
S-N-K方法是一種有效劃分相似性子集的方法。該方法適合於各水平觀測值個數相等的情況。
3、其他檢驗
(1)先驗對比檢驗
在多重比較檢驗中,如果發現某些水平與另外一些水平的均值差距顯著,如有五個水平,其中x1、x2、x3與x4、x5的均值有顯著差異,就可以進一步分析比較這兩組總的均值是否存在顯著差異,即1/3(x1+x2+x3)與1/2(x4+x5)是否有顯著差異。這種事先指定各均值的係數,再對其線性組合進行檢驗的分析方法稱為先驗對比檢驗。通過先驗對比檢驗能夠更精確地掌握各水平間或各相似性子集間均值的差異程度。
(2)趨勢檢驗
當控制變量為定序變量時,趨勢檢驗能夠分析隨著控制變量水平的變化,觀測變量值變化的總體趨勢是怎樣的,是呈現線性變化趨勢,還是呈二次、三次等多項式變化。通過趨勢檢驗,能夠幫助人們從另一個角度把握控制變量不同水平對觀測變量總體作用的程度。
關注知識,發現價值
見證學術力量
學術小組QQ群:219246913(500人大群)