核心區別
其核心的區別在於:數據類型不一樣。
如果是定類和定類,此時應該使用卡方分析;如果是定類和定量,此時應該使用方差或者T檢驗。
方差和T檢驗的區別在於,對於T檢驗的X來講,其只能為2個類別比如男和女。如果X為3個類別比如本科以下,本科,本科以上;此時只能使用方差分析。
1. 方差分析,用於分析定類數據與定量數據之間的關係情況
2. T檢驗,用於分析定類數據與定量數據之間的關係情況.
3. 卡方分析,用於分析定類數據與定類數據之間的關係情況.例如研究人員想知道兩組學生對於手機品牌的偏好差異情況。
進一步細分1)方差分析
根據X的不同,方差分析又可以進行細分。X的個數為一個時,我們稱之為單因素方差;X為2個時則為雙因素方差;X為3個時則稱作三因素方差,依次下去。當X超過1個時,統稱為多因素方差。
單因素方差分析,用於分析定類數據與定量數據之間的關係情況。
在使用單因素方差分析時,需要每個選項的樣本量大於30,比如男性和女性樣本量分別是100和120,如果出現某個選項樣本量過少時應該首先進行組別合併處理。
比如研究不同年齡組樣本對於研究變量的差異性態度時,年齡小於20歲的樣本量僅為20個,那麼需要將小於20歲的選項與另外一組(比如20~25歲)的組別合併為一組,然後再進行單因素方差分析。
如果選項無法進行合併處理,比如研究不同專業樣本對於變量的態度差異,研究樣本的專業共分為市場營銷、心理學、教育學和管理學四個專業,這四個專業之間為彼此獨立無法進行合併組別,但是市場營銷專業樣本量僅為20並沒有代表意義,因此可以考慮首先篩選出市場營銷專業,即僅比較心理學,教育學和管理學這三個專業對某變量的差異性態度。
當對比的組別超過三個,並且呈現出顯著性差異時,可以考慮使用事後檢驗進一步對比具體兩兩組別間的差異情況。
雙因素方差分析,用於分析定類數據(2個)與定量數據之間的關係情況。
例如研究人員性別,學歷對於網購滿意度的差異性;以及男性或者女性時,不同學歷是否有著網購滿意度差異性;或者同一學歷時,不同性別是否有著網購滿意度差異性。
多因素方差分析,通常用於類實驗式問卷研究。
比如研究者測試某新藥對於膽固醇水平是否有療效;研究者共招募72名被試,男女分別為36名,以及男女分別再細分使用新藥和普通藥物;同時高血壓患者對於新藥可能有幹擾,因而研究者將被試是否患高血壓也納入考慮範疇中。
因而最終,X共分為三個,分別是藥物(舊藥和新藥)、性別,是否患高血壓;Y為膽固醇水平。因而需要進行三因素方差分析即多因素方差分析。
在方法選擇上,問卷研究通常會使用方差分析,但某些專業,比如心理學、教育學或者師範類專業等涉及到實驗研究時,更多會使用T檢驗進行分析,另外方差分析與T檢驗還有較多差異,在某些分析中只能使用其中一種。
2)T檢驗
T檢驗共分為三種方法,分別是獨立樣本T檢驗,配對樣本T檢驗和單樣本T檢驗。
獨立樣本T檢驗和單因素方差分析功能上基本一致,但是獨立樣本T檢驗只能比較兩組選項的差異,比如男性和女性。
相對來講,獨立樣本T檢驗在實驗比較時使用頻率更高,尤其是生物、醫學相關領域。針對問卷研究,如果比較的類別為兩組,獨立樣本T檢驗和單因素方差分析均可實現,研究者自行選擇使用即可。
3)卡方分析
卡方檢驗用於分析定類數據與定類數據之間的關係情況。例如研究人員想知道兩組學生對於手機品牌的偏好差異情況,則應該使用卡方分析。
卡方是通過分析不同類別數據的相對選擇頻數和佔比情況,進而進行差異判斷,單選題或多選題均可以使用卡方分析進行對比差異分析。
其他不同一、what1、卡方檢驗 Chi-Square Test
卡方檢驗就是檢驗兩個變量之間有沒有關係。
以運營為例:
卡方檢驗可以檢驗男性或者女性對線上買生鮮食品有沒有區別;
不同城市級別的消費者對買SUV車有沒有什麼區別;
如果有顯著區別的話,我們會考慮把這些變量放到模型或者分析裡去。
2、t檢驗
亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n < 30),總體標準差σ未知的正態分布。
T檢驗是用於兩個樣本(或樣本與群體)平均值差異程度的檢驗方法。它是用T分布理論來推斷差異發生的概率,從而判定兩個平均數的差異是否顯著。
3、方差分析
Analysis of Variance,簡稱ANOVA,又稱「變異數分析」。
從方差分析的目的來看,是要檢驗各個水平(因素中的內容)的均值μ1、μ2、…、μm是否相等(m為水平個數),而實現這個目的的手段是通過方差的比較(即考察各觀察數據的差異)。通俗說,就是有沒有變異。
二、卡方檢驗和方差分析的區別:1、二者的基本思想不同
方差分析基本思想:變異分解,總變異=隨機變異+處理因素導致的變異,又可以分解為總變異=組內變異+組間變異,F=組間變異/組內變異,F的值越大,處理因素的影響越大。
卡方檢驗基本思想:以卡方分布為基礎,計算觀察值和期望值之間的偏離程度。
2、適用的前提條件不同
方差分析:數據具有獨立性、正態性、方差齊性。
卡方檢驗:最小期望頻數均大於1;至少4/5的單元格期望頻數大於5;計算時如果單元格期望頻數小於5要和其他種類合併;樣本觀察值量超過50。
3、適用的場景不同
方差分析:均數間的多重比較(全部兩兩比較)、各組均數的精細比較(可以指定要比較的兩個組,通過設定係數)、組間均數的趨勢檢驗(為了利用分組變量中體現出的次序信息。
目的不是為了擬合線性或非線性的模型,而是希望知道因素的水平改變時均數的變化趨勢)。
卡方檢驗:單樣本卡方檢驗、兩樣本卡方檢驗、兩分類變量間關聯程度的度量、Kappa一致性檢驗、Mcnemar 配對卡方檢驗、分層卡方檢驗。
三、卡方檢驗和t檢驗的區別:卡方檢驗和T檢驗的前提條件(原假設)是對立的:
卡方檢驗:假設沒有相關性
T檢驗:假設沒有差異(相等)