方差分析是一種分析調查或試驗結果是否有差異的統計分析方法,也就是檢驗各組別間是否有差異。本文我們就一起來梳理下方差分析的分析流程。
Step1:數據類型
方差分析用於分析定類數據與定量數據之間的關係情況,可以比較2組或多組數據的差異。分析前首先應根據數據類型判斷使用的方法是否正確。
如果X是定類數據,Y是定類數據,則應該使用卡方分析。 如果X是定類數據,Y是定量數據,且X組別僅為兩組,則應該使用T檢驗。
Step2:方差分析的類型
方差分析按照自變量個數的不同,可以分為單因素方差分析、雙因素方差分析、以及多因素方差分析。
單因素方差分析可以比較一個自變量(比如品牌);而雙因素方差可以比較兩個自變量(品牌和銷售地區);多因素方差可比較三個及以上的自變量,以及可以研究多個自變量對因變量Y的交互影響。
單因素方差分析在問卷研究中常用於分析個人背景信息對核心研究變量的影響(比如不同性別,滿意度是否有顯著差異)。
同時也可用於對聚類分析效果的判斷。在得到聚類類別之後,通過方差分析去對比不同類別的差異,如果全部呈現出顯著性差異,以及研究人員結合專業知識可以對類別進行命名時,則說明聚類效果較好。
而雙因素和多因素方差分析只有在實驗研究中才會使用,一般的問卷數據很少使用。
本文將主要針對單因素方差分析說明。
Step3:正態性檢驗
方差分析要求Y項滿足需要正態性,SPSSAU提供多種檢驗正態性的方法,選擇其中一種方法檢驗即可。
問卷數據很難保證數據的正態性,而正態性檢驗的判斷標準較為嚴格,因為更推薦使用正態圖或P-P/Q-Q圖查看正態性,當數據基本滿足正態性特徵即可接受為正態分布。
散點圖近似呈現為一條對角直線,則說明數據呈現出正態分布。
不滿足正態性
如果出現數據不滿足正態性的情況:
①可以進行對數處理:即使用【生成變量】功能對Y項進行轉換,使數據呈現出正態性。但轉換後的數據分析結果不好解釋,若數據為問卷數據,建議考慮選擇其他方法。
②使用非參數檢驗:如果沒有呈現出正態性特質,可使用非參數檢驗進行分析。
③直接使用方差分析:參數檢驗的檢驗效能高於非參數檢驗,比如方差分析為參數檢驗,所以很多時候即使數據不滿足正態性要求也使用方差分析。
Step4:方差齊檢驗
方差齊是方差分析的前提,方差分析前一般需要對數據進行方差齊性檢驗。
在SPSSAU中找到【通用方法】→【方差】,下拉右側選框,選擇【方差齊檢驗】。
檢驗結果主要關注P值,即p <0.05,代表數據呈現出顯著性,說明不同組別數據波動不一致,即說明方差不齊;反之,p>0.05,說明方差齊。
不滿足方差齊性
理論上講,單因素方差分析應該首先滿足方差齊性,但在實際研究過程中,較多數據出現方差不齊現象,可以將分類數據X進行重新組合處理等。
如果仍然不滿足方差齊性,可使用非參數檢驗。
另外,如果研究的分類數據為兩類,可以考慮使用獨立樣本T檢驗代表方差分析,避免方差不齊無法分析的尷尬。
Step5:SPSSAU操作
案例:不同廣告形式對銷售額的影響,是否有顯著性差異?
①操作步驟:完成上述步驟,即可進行方差分析,點擊【通用方法】→【方差】
* 通用方法裡的方差僅是單因素方差分析,其他如雙因素方差分析在【進階方法】裡。
②結果分析
分析步驟參考SPSSAU輸出結果中的「分析建議」及「智能分析」。
③效應量指標
除此之外,SPSSAU也提供更為深入的檢驗指標,通過效應量可深入研究差異的幅度。
通常情況下,一般不需要展示效應量指標,如需要報告建議查看spssau幫助手冊說明更易理解。
Step6:事後多重比較
單因素方差分析如果呈現出顯著性,說明不同組別之間確實存在顯著差異,但有時我們更想知道具體有哪些組是有差異的。
此時則可以使用事後多重比較(事後檢驗),對兩兩組別進行對比。
* 如果方差分析顯示沒有差異性,則不需要進行事後檢驗。
SPSSAU提供了5種事後檢驗的方法,使用時需要根據自己的數據情況進行選擇,系統默認使用LSD方法,其對差異的判斷最為敏感。
結果中的一行即展示一組兩兩對比的結果,每一行最後的P值,如果顯示P<0.05,即說明兩組數據有顯著差異。
本例中X項一共分為4組,則有6種兩兩對比的組合,也就對應有6個對比結果。根據結果顯示報紙和宣傳品、報紙和體驗、廣播和宣傳品、體驗和宣傳品之間存在顯著性差異,通過平均值對比具體對比差異性。
最後
以上就是方差分析的流程梳理,對於方差分析理論要求較為嚴格,但在實際分析中,很多時候儘管沒有滿足前提條件還是會使用,具體還要結合實際研究進行選擇,以及涉及事後檢驗及效應量問題都建議大家查看相關的幫助手冊說明。