在數據分析過程中,為了進行兩組以上均數的比較,往往可以使用方差分析方法。那麼我們一起了解一下方差分析基本概念、 單因素方差分析、 多因素方差分析及協方差分析;同時在spss中的操作演練。

方差分析的基本思想是:通過分析研究不同變量的變異對總變異的貢獻大小,確定控制變量對研究結果影響力的大小。通過方差分析,分析不同水平的控制變量是否對結果產生了顯著影響。如果控制變量的不同水平對結果產生了顯著影響,那麼它和隨機變量共同作用,必然使結果有顯著的變化;如果控制變量的不同水平對結果沒有顯著的影響,那麼結果的變化主要由隨機變量起作用,和控制變量關係不大。
方差分析的前提條件,即不同水平下,各總體均值服從方差相同的正態分布,因此方差分析問題就轉換成研究不同水平下各個總體的均值是否有顯著差異的問題。在spss中經常使用方差齊性檢驗(都是levene檢驗),一般情況下,只要sig值大於0.05就可以認為方差齊性的假設成立,因此方差分析的結果應該值得信賴;如果sig值小於或等於0.05,方差齊性的假設就值得懷疑,導致方差分析的結果也值得懷疑。
方差分析通常用F統計量檢驗:SPSS會自動計算 F 統計值, F 服從 (k-1,n-k) 自由度的 F 分布(k 是水平數, n 為個案數), SPSS依據 F 分布表給出相應的相伴概率值。如果相伴概率值小於顯著性水平 ,則拒絕零假設,認為控制變量不同水平下各總體均值有顯著差異;反之,則認為控制變量不同水平下各總體均值沒有顯著差異。
單因素方差分析:
單因素方差分析測試某一個控制變量的不同水平是否給觀察變量造成了顯著差異和變動。
多因素方差分析:
定義:多因素方差分析中的控制變量在兩個或兩個以上,它的研究目的是要分析多個控制變量的作用、多個控制變量的交互作用以及其他隨機變量是否對結果產生了顯著影響。
多因素方差分析不僅需要分析多個控制變量獨立作用對觀察變量的影響,還要分析多個控制變量交互作用對觀察變量的影響,及其他隨機變量對結果的影響。因此,它需要將觀察變量總的離差平方和分解為3個部分:1. 多個控制變量單獨作用引起的平方和; 2.多個控制變量交互作用引起的離差平方和;3. 其他隨機因素引起的離差平方和。
協方差分析:
定義:協方差分析是將那些很難控制的因素作為協變量,在排除協變量影響的條件下,分析控制變量對觀察變量的影響,從而更加準確地對控制因素進行評價。協方差分析要求協變量應是連續數值型,多個協變量間互相獨立,且與控制變量之間也沒有交互影響。前面單因素方差分析和多因素方差分析中的控制變量都是一些定性變量。而協方差分析中則即包含了定性變量(控制變量),又包含了定量變量(協變量)。
方差分析SPSS演練
數據源
SPSS操作流程:導入數據—分析—一般線性模型—單變量。選擇因變量為英語成績,固定因子組別,協變量入學成績,點擊右側選擇按鈕,勾選需要輸出的結果,包括描述統計、方差檢驗、分布水平圖等。

SPSS結果輸出:


結果解釋:從輸出的主體間效應的檢驗結果表中可以看出,入學成績對目前的成績是沒用影響,在0.05的顯著性水平下拒絕原假設。所以需要剔除協變量在進行方差分析。

結果解釋:從結果來看,0組和2組是沒有顯著性差異的,而1組和0組2組比較是有顯著性差異的。
總結:
方差分析用於兩個及兩個以上樣本均值差異的顯著性檢驗。方差分析的基本思想是:通過分析研究中不同變量的變異對總變異的貢獻大小,確定控制變量對研究變量影響力的大小。通過方差分析,分析不同水平的控制變量是否對結果產生了顯著影響。如果控制變量的不同水平能夠對結果產生顯著影響,那麼它和隨機變量共同作用,必將使結果有顯著變化。
單因素方差分析所解決的是一個因素下的多個不同水平之間的相關問題;多因素方差分析的控制變量在兩個或兩個以上,其主要用於分析多個控制變量的作用、多個控制變量的交互作用以及其他隨機變量是否對結果產生了顯著影響;協方差分析將那些很難控制的因素作為協變量,在排除協變量影響的條件下,分析控制變量對觀察變量的影響,從而更準確地對控制因素進行評價。