1. 什麼是方差分析
方差分析(ANOVA)是一個假設檢驗的過程,用於評估兩個或多個(總體)處理的平均數的差異,它與t檢驗的差異在於方差分析可以被用來比較兩個或更多的處理,為設計實驗與解釋結果提供了更大的靈活性。
在方差分析中,自變量或準自變量被稱為因素,組成一個因素的各個條件或是數值被稱為這個因素的水平。方差分析既可以用在獨立測量中,也可以用在重複測量研究中。合併不同因素,以及在同一研究內混合不同設計的能力,為研究者提供了發展研究的靈活性。
我們知道每次做一個假設檢驗時都需要選定一個α水平來確定第一類誤差的可能性。做的檢驗越多,遇到第一類誤差的可能性就越大。因此我們需要區分檢驗α水平和試驗α水平(試驗α水平是指試驗中所有的單獨檢驗的第一類誤差的總概率)。當樣本數超過三個以後,我們不能用重複t檢驗的方法來逐一兩兩比較平均數差異,這樣會導致較大的試驗α水平。但是對於方差分析來說,無論有多少不同的平均數需要比較,都可以保證用一個檢驗,一個α水平來評估平均數的差異。
2. 方差分析的邏輯
方差分析的目的是測量變異性的數量(差異的大小)和解釋變異性的由來。首先需要合併所有單獨樣本的數據,從而確定整組數據的總的變異性。然後把總的變異性分成兩個部分,處理間方差和處理內方差來分析和解釋變異性。
2.1 處理間方差
以上圖為例,我們可以清楚的發現數據間較大的變異性是由處理條件間總的差異(溫度)引起的,例如20℃條件下的數據M=4趨向於高出10℃條件下的數據M=1。處理間方差測量的是處理條件間的差異。這種差異可以有兩個選擇性地解釋:
A. 偶然。差異不是由任何處理效應引起的,是一個樣本和另一個樣本間自然存在的差異。偶然差異可能是由個體差異或者試驗誤差導致的。
B. 處理效應。處理間的差異比只是偶然引起的差異要大得多,是由處理效應引起的。
2.2 處理內方差
除了處理條件的總的差異,每個樣本內部還存在變異性,例如20℃條件下所有的數據並不都是相等的,樣本內部的數據依然存在變異性。處理內方差測量的是每個處理條件內的變異性,即測量有多少差異只是由偶然引起的是合理的。也就是說當H0正確是,差異是多大。
分析這兩個部分內部的總的變異性是方差分析的核心。
2.3 F分數
當樣本數超過三個以後,樣本平均數差異的概念很難定義,而且不易計算。解決這個問題的方法是用方差來定義和測量樣本平均數之間的差異。在方差基礎上建立的統計量又稱為F分數。
無論是t分數還是F分數,分數的分子測量了樣本數據的真正差異,分母測量了不存在處理效應時的差異。較大的t分數或者F分數證明了樣本平均數差異比只是偶然引起的差異要大。當F值接近1.00時,表示處理間差異與偶然差異大致相等。當處理效應存在時,F值應該顯著的大於1.00。由於F分數是由兩個方差計算而來,所以F值通常會是正值,當H0為真時,F分布應該集中在1.00左右。F分布的準確形狀決定於F分數中兩個方差的df。對於非常大的df值,F值將集中在1.00左右,對於小一些的df值,F分布會更分散。
在F值得計算中,k表示處理條件的個數,n表示某個處理中數據的個數,N表示數據的總個數,T表示一個特定處理的總和。G表示一個研究的總數據之和。
3. 假設檢驗的步驟:
步驟一:提出假設並選定α水平
步驟二:確定F分數的臨界值
A. 確定自由度
總自由度 df總=N-1
處理內自由度 df內=N-k
處理間自由度 df間=k-1
在F分布表中找到對應的臨界值。
步驟三:計算F分數
A. 分析並計算出SS間和SS內
總的平方和
處理內平方和
處理間平方和
B.計算出MS間和MS內
C. 計算F分數
步驟四:對於H0做出判定
參考書目:行為科學統計,現代心理與教育統計學