文章來源: 丁點幫你
作者:丁點helper
看完單因素方差分析,一般的統計學中並不會直接講two-way(雙因素)方差分析,而是講「隨機區組設計的方差分析」,那這兩者有什麼關係嗎?
從統計方法的角度來看,隨機區組設計的方差分析其實就屬於兩因素(或多因素)方差分析,一種說法認為,為什麼不直接叫兩因素,是因為不把「區組因素」算作一類真正的「因素」,而重點研究隨機分組因素。
我們認為,實際稱雙因素方差分析可能更好理解。不過這裡稱作「隨機區組設計」,也是有其他特別的考慮。
「隨機區組設計」是實驗研究的概念,強調的是科學地獲取數據的方法,減少混雜因素。但從統計方法的角度來看,隨機區組設計的方差分析可以等同於增加了一個新的分組因素,因此,其基本思想實際與單因素方差分析並無區別。
比如,某團隊想研究人們對當前生活滿意度的情況,通過問卷調查收集了人們對生活滿意度的得分(0~100),現在想探究教育程度與滿意度得分的關係(教育程度分為三組:高中及以下、大專及本科、研究生及以上)。
很明顯,這是一個單因素方差分析的問題,即比較教育程度不同的三組人群,他們的滿意度得分的均數是否有差異。
可是除了教育程度以外,其他因素也可能影響人們對生活的滿意度,此時,如果我們考慮加入另一個分類變量,比如性別,則當我們再進行方差分析時,就屬於兩因素(two-way)的情況了。
為了方便表述,這裡我們將「生活滿意度得分」稱之為因變量,用Y表示;將「教育程度」和「性別」稱為「自變量」,分別用「X1」和「X2」表示。
如下表,標準的雙因素方差分析的結果表(或稱隨機區組設計方差分析表),相對於前文中的單因素方差分析表,表格中僅多了一行「區組」。
所以這裡,我們其實可以直接將「處理組」看成「X1」;將「區組」看成「X2」。按照上文單因素方差分析的邏輯直接推廣即可。
比如,在本例中,為了看「教育程度」和「性別」是否會影響人們目前生活的「滿意度得分」,則只需分布看F處理(即F_X1)和F區組(即F_X2)所對應的P值大小判斷兩次即可。
除此以外,由於納入了不止一個因素,所以有時需要考慮因素間的交互作用,這一點我們後續談。