全流程總結方差分析,就靠它了!

2021-01-08 SPSSAU

方差分析是一種分析調查或試驗結果是否有差異的統計分析方法,也就是檢驗各組別間是否有差異。本文我們就一起來梳理下方差分析的分析流程。

方差分析流程圖

Step1:數據類型

方差分析用於分析定類數據與定量數據之間的關係情況,可以比較2組或多組數據的差異。分析前首先應根據數據類型判斷使用的方法是否正確。

如果X是定類數據,Y是定類數據,則應該使用卡方分析。 如果X是定類數據,Y是定量數據,且X組別僅為兩組,則應該使用T檢驗。

Step2:方差分析的類型

方差分析按照自變量個數的不同,可以分為單因素方差分析、雙因素方差分析、以及多因素方差分析。

單因素方差分析可以比較一個自變量(比如品牌);而雙因素方差可以比較兩個自變量(品牌和銷售地區);多因素方差可比較三個及以上的自變量,以及可以研究多個自變量對因變量Y的交互影響。

單因素方差分析在問卷研究中常用於分析個人背景信息對核心研究變量的影響(比如不同性別,滿意度是否有顯著差異)。

同時也可用於對聚類分析效果的判斷。在得到聚類類別之後,通過方差分析去對比不同類別的差異,如果全部呈現出顯著性差異,以及研究人員結合專業知識可以對類別進行命名時,則說明聚類效果較好。

而雙因素和多因素方差分析只有在實驗研究中才會使用,一般的問卷數據很少使用。

本文將主要針對單因素方差分析說明。

Step3:正態性檢驗

方差分析要求Y項滿足需要正態性,SPSSAU提供多種檢驗正態性的方法,選擇其中一種方法檢驗即可。

問卷數據很難保證數據的正態性,而正態性檢驗的判斷標準較為嚴格,因為更推薦使用正態圖或P-P/Q-Q圖查看正態性,當數據基本滿足正態性特徵即可接受為正態分布。

P-P圖

散點圖近似呈現為一條對角直線,則說明數據呈現出正態分布。

不滿足正態性

如果出現數據不滿足正態性的情況:

①可以進行對數處理:即使用【生成變量】功能對Y項進行轉換,使數據呈現出正態性。但轉換後的數據分析結果不好解釋,若數據為問卷數據,建議考慮選擇其他方法。

②使用非參數檢驗:如果沒有呈現出正態性特質,可使用非參數檢驗進行分析。

SPSSAU-非參數檢驗

③直接使用方差分析:參數檢驗的檢驗效能高於非參數檢驗,比如方差分析為參數檢驗,所以很多時候即使數據不滿足正態性要求也使用方差分析。

Step4:方差齊檢驗

方差齊是方差分析的前提,方差分析前一般需要對數據進行方差齊性檢驗。

在SPSSAU中找到【通用方法】→【方差】,下拉右側選框,選擇【方差齊檢驗】。

SPSSAU-方差齊檢驗

檢驗結果主要關注P值,即p <0.05,代表數據呈現出顯著性,說明不同組別數據波動不一致,即說明方差不齊;反之,p>0.05,說明方差齊。

不滿足方差齊性

理論上講,單因素方差分析應該首先滿足方差齊性,但在實際研究過程中,較多數據出現方差不齊現象,可以將分類數據X進行重新組合處理等。

如果仍然不滿足方差齊性,可使用非參數檢驗。

另外,如果研究的分類數據為兩類,可以考慮使用獨立樣本T檢驗代表方差分析,避免方差不齊無法分析的尷尬。

Step5:SPSSAU操作

案例:不同廣告形式對銷售額的影響,是否有顯著性差異?

①操作步驟:完成上述步驟,即可進行方差分析,點擊【通用方法】→【方差】

SPSSAU-方差分析

* 通用方法裡的方差僅是單因素方差分析,其他如雙因素方差分析在【進階方法】裡。

②結果分析

分析步驟參考SPSSAU輸出結果中的「分析建議」及「智能分析」。

③效應量指標

除此之外,SPSSAU也提供更為深入的檢驗指標,通過效應量可深入研究差異的幅度。

通常情況下,一般不需要展示效應量指標,如需要報告建議查看spssau幫助手冊說明更易理解。

Step6:事後多重比較

單因素方差分析如果呈現出顯著性,說明不同組別之間確實存在顯著差異,但有時我們更想知道具體有哪些組是有差異的。

此時則可以使用事後多重比較(事後檢驗),對兩兩組別進行對比。

進階方法-事後多重比較

* 如果方差分析顯示沒有差異性,則不需要進行事後檢驗。

SPSSAU提供了5種事後檢驗的方法,使用時需要根據自己的數據情況進行選擇,系統默認使用LSD方法,其對差異的判斷最為敏感。

SPSSAU-事後檢驗結果

結果中的一行即展示一組兩兩對比的結果,每一行最後的P值,如果顯示P<0.05,即說明兩組數據有顯著差異。

本例中X項一共分為4組,則有6種兩兩對比的組合,也就對應有6個對比結果。根據結果顯示報紙和宣傳品、報紙和體驗、廣播和宣傳品、體驗和宣傳品之間存在顯著性差異,通過平均值對比具體對比差異性。

最後

以上就是方差分析的流程梳理,對於方差分析理論要求較為嚴格,但在實際分析中,很多時候儘管沒有滿足前提條件還是會使用,具體還要結合實際研究進行選擇,以及涉及事後檢驗及效應量問題都建議大家查看相關的幫助手冊說明。

相關焦點

  • 方差分析(ANOVA)全總結
    方差分析(Analysis of Variance,簡稱ANOVA),又稱「變異數分析, 分散分析,분산분석」,是由R.A.Fisher發明,用於兩個及兩個以上樣本均數差別的顯著性檢驗
  • 考點總結|超全的方差分析公式總結,建議收藏!
    文章將分為以下三大部分:第一部分,總結一下方差分析的基本步驟。方差分析的前提:總體正態分布、變異的相互獨立性、各實驗處理內方差要一致(最重要)。方差齊性檢驗方法:方差齊性檢驗的方法——哈特萊(Hartley)檢驗法公式: 2.方差分析的基本步驟:(1)求平方和(2)計算自由度(3)計算均方(方差)(4)計算F值(5)
  • 全流程總結相關分析,讓你條理清晰完成分析
    得到最多的反饋是大家對於常見分析方法,不知道如何選擇,如何分析。雖說越實用的方法,往往也越簡單。但剛開始接觸數據分析時,確實就是會因為一些奇奇怪怪的術語不理解,讓大家產生很難懂學不會的挫敗感。為了幫大家快速度過新手期, 我們整理了一份常見分析方法的流程總結。其中包括每種分析方法的分析流程,以及每個環節中可能出現的問題及應對方法。
  • 方差分析 (ANOVA)-29
    單個因素的 ANOVA▶單向方差分析(ANOVA)是比較兩組以上數據均值的差異的統計方法▶假設性檢驗為:單向ANOVA 總結▶在進行ANOVA分析時,我們通常進行模型假設的檢驗▶簡單概括 單向ANOVA方法    1. 選擇有效(合理)的樣本規模和因素水平    2. 隨機進行實驗並收集數據    3.
  • SPSS方差分析方法與實例演練
    通過方差分析,分析不同水平的控制變量是否對結果產生了顯著影響。如果控制變量的不同水平對結果產生了顯著影響,那麼它和隨機變量共同作用,必然使結果有顯著的變化;如果控制變量的不同水平對結果沒有顯著的影響,那麼結果的變化主要由隨機變量起作用,和控制變量關係不大。
  • 單因素方差分析超完整分析流程
    概念方差分析用於定類數據(X)與定量數據(Y)之間的差異分析,例如研究三組學生(X)的智商平均值(Y)是否有顯著差異。其中X的組別數量至少為2,也可以分析三個或三個以上組別的數據。針對方差分析,正確的錄入格式如下圖所示:03.
  • 方差分析-最全
    下面只是個目錄,請點擊閱讀原文~方差分析(analysis of variation,簡寫為ANOVA)又稱變異數分析或F檢驗,用於兩個及兩個以上樣本均值差別的顯著性檢驗,從函數的形式看,方差分析和回歸都是廣義線性模型的特例,回歸分析lm()也能作方差分析。其目的是推斷兩組或多組數據的總體均值是否相同,檢驗兩個或多個樣本均值的差異是否有統計學意義。
  • 第八章 方差分析--第一節 方差分析的意義
    第八章 方差分析 第一節 方差分析的意義   在第七章我們已介紹了兩個樣本均數相比較的顯著性檢驗方法。如果相互比較的組超過兩個,為同時解決幾個均數的比較問題,通常使用方差分析法。
  • 方差分析常見問題匯總,你想知道的都在這裡
    本文以SPSSAU系統為例,針對方差分析的常見問題進行匯總說明。關於方差分析的分析思路及相關操作可閱讀連結文章:SPSSAU:全流程總結方差分析,只看這篇就夠了。①問題一:t檢驗與方差分析的區別?t檢驗只能進行兩組之間的比較,當分析項X組別超過兩組時,應使用方差分析。②問題二:方差分析是否需要滿足正態性?方差檢驗一般需要進行正態性檢驗,但方差檢驗對數據的正態性的有一定的耐受能力,只要數據近似正態即可接受。如果數據嚴重不正態,則可使用非參數檢驗。
  • 如何看懂SPSS重複測量方差分析的一系列結果
    之前的方差分析是對一個變量的變異進行分解(即所謂的離均差平方和);重複測量的方差分析則是針對多個變量進行的,也可以叫做變異分解,但此時它有了一個新名字,叫方差-協方差矩陣的變異分解。什麼叫協方差?什麼又叫矩陣?
  • 單因素方差分析
    (一)單因素方差分析概念理解步驟  是用來研究一個控制變量的不同水平是否對觀測變量產生了顯著影響。這裡,由於僅研究單個因素對觀測變量的影響,因此稱為單因素方差分析。  例如,分析不同施肥量是否給農作物產量帶來顯著影響,考察地區差異是否影響婦女的生育率,研究學歷對工資收入的影響等。這些問題都可以通過單因素方差分析得到答案。  單因素方差分析的第一步是明確觀測變量和控制變量。例如,上述問題中的觀測變量分別是農作物產量、婦女生育率、工資收入;控制變量分別為施肥量、地區、學歷。  單因素方差分析的第二步是剖析觀測變量的方差。
  • 常用數據分析方法:方差分析及實現!
    方差分析是一種常用的數據分析方法,其目的是通過數據分析找出對該事物有顯著影響的因素、各因素之間的交互作用及顯著影響因素的最佳水平等。本文介紹了方差分析的基礎概念,詳細講解了單因素方差分析、雙因素方差分析的原理,並且給出了它們的python實踐代碼。
  • 全流程總結卡方檢驗,幫你理清分析思路
    如果X是定類數據,Y是定量數據,且X組別多於2組,則應該使用方差分析。如果X是定類數據,Y是定量數據,且X組別僅為兩組,則應該使用T檢驗。SPSSAU操作(1)交叉卡方如上圖,分析不同性別的人群,使用理財產品的情況是否有差別。這裡Y項也可以放入多個標題,一起分析。
  • 從協方差分析看回歸與方差分析的聯繫
    納入協變量的方差分析,即稱協方差分析。一般而言,進行協方差分析的協變量為「定量變量」,比如本例中的「人均月收入」,它一般不是研究者重點研究的變量(本例中重點研究的是教育程度和性別),但因為它會對分析結果造成幹擾,因此在分析過程中必須要將其納入。
  • 你說它為什麼叫方差分析?
    ……方差分析中其最重要的原理為方差的可加性(Additivity)。以圖8.1-1為例,假設存在3組樣本,每組數據內都會存在「均值」,我們可以使用「個案分數」與「均值」計算出該組的方差,稱為「組內方差」,即圖中紅色部分;3組樣本合併成總樣本後,總樣本也存在「總均值」與「總方差」,此時,如果我們將「組均值」當做紅色部分的「個案分數」,將「總均值」當做紅色部分的「組均值」,則可以計算出另一種方差,稱為「組間方差」;將所有「組內方差」與「組間方差」相加會等於「總方差」。
  • 最直觀的方差分析(ANOVA) 術語大全
    方差分析ANOVA詞意:analysis of variance,取單詞的前兩個字母組合而成。2. 方差分析的統計學分析基礎是F分布。提出一個案例來展開概念:為測試兩個治療方法,對焦慮症的治療效果,招募了十個有焦慮症的志願者來做實驗。
  • 單因素方差分析(one-way ANOVA)
    這裡,由於僅研究單個因素對觀測變量的影響,因此稱為單因素方差分析。 例如,分析不同施肥量是否給農作物產量帶來顯著影響,考察地區差異是否影響婦女的生育率,研究學歷對工資收入的影響等。這些問題都可以通過單因素方差分析得到答案。
  • 「spss數據分析系列」方差分析
    上一課我們講的是t檢驗,t檢驗是用於2個類別的均值對比,如果是3分類以及以上的分類的均值對比,則採用方差分析。t檢驗是用的t分布來檢驗時候接受假設,方差分析則用的F分布,如下圖。方差分析的適用條件:1、個樣本的獨立性(指每個單元格內的數據相互獨立):這樣才能保證數據變異的可加性。2、正態性:單元格內的所有總體都是從一個正太總體來面抽出來,這個時候一般由於單元格數量比較少,所以沒法直接分析和觀察,這時候一般採用殘差分析來看。
  • 方差分析(ANOVA)原理
    方差分析(ANOVA)原理微信公眾號:生信小知識關注可了解更多的教程及單細胞知識。
  • 【案例】SPSS統計分析:多因素方差分析
    多因素方差分析,用於研究一個因變量是否受到多個自變量(也稱為因素)的影響,它檢驗多個因素取值水平的不同組合之間,因變量的均值之間是否存在顯著的差異。多因素方差分析既可以分析單個因素的作用(主效應),也可以分析因素之間的交互作用(交互效應),還可以進行協方差分析,以及各個因素變量與協變量的交互作用。