我們在閱讀論文時,經常看到(方差分析)F檢驗的結果,比如F(3,19)=3.4,這是什麼意思?我們自己對照描述統計結果時,如何根據SPSS輸出的方差分析表,寫出F括號中的兩個數字?
這是本篇文章要解決的問題。
方差分析的思想
方差分析從名字上看強調「方差」,實際上它分析的是「均值」是否相等,而不是「方差」是否相等。它的思想是將Y的總變異分解為系統誤差和隨機誤差。所以方差分析是通過對數據誤差來源的分析從而判斷不同總體的均值是否相等。
數據的誤差用平方和來表示,總的平方和可以稱為是總方差。那麼總方差依據系統誤差和隨機誤差分解為組間方差與組內方差。
以最簡單的單因素方差分析為例,大家看看方差分析中涉及到的統計計算:
(via:百度文庫)
我在另外一篇文章中,也做了簡要的解釋,文章如下:
簡單理解起來,就是一句話,F統計量的計算是相應平方和除以對應的自由度。以前計算能力弱的時候(統計軟體沒有出現前),在F分布表上查找顯著性水平0.05和0.01的F統計量臨界值,從而判斷假設檢驗的結論。
F統計量結果的表達方式,即F(組間自由度,組內自由度)=具體數值。單因素方差分析中,(見上表)組間自由度為 r-1 ,組內自由度為 n-r ,其中r為因素的分組水平數,n為總樣本數。
單因素解讀舉例
上表為某單因素方差分析表結果,研究不同行業的投訴量有無差別(行業是否影響投訴量),行業因素有4個分類水平,數據的總樣本例23個。
表頭以下兩行數據分別代表組間方差(hy)和組內方差(Residuals)的計算結果。組間自由度 r-1 =4-1=3,組內自由度 n-r =23-4=19。F統計量不用查表了,統計軟體已經幫我搞定,F=3.407。
結果描述為:經方差分析,結果顯示F(3,19)=3.407,P=0.039<0.05,四個行業對消費者投訴量的影響差異具有統計學意義。
雙因素解讀舉例
上表為某雙因素方差分析表結果,研究工人和機器對產品產量的影響,工人因素分類水平4個,機器因素分類水平3個,數據的總樣本例12個。
工人因素的組間自由度為3,機器因素的組間自由度為2,兩個因素的組內誤差自由度為3*2=6。兩個因素的F統計量軟體已經計算到位,分別是6.985和29.102。
結果描述為:不同的工人對產量的影響有統計學意義,F(3,6)=6.985,P<0.05;不同的機器對產量的影響有統計學意義,F(2,6)=29.102,P<0.01。
以上為小兵給大家做出的解讀,歡迎讀者朋友閱讀和指正,有疑問請在文末留言評論。
全文完
文/圖=數據小兵
同類文章推薦
通知:本號推出的視頻課程即日起正式更名為《SPSS統計分析案例實踐與論文寫作》,將從設計理念上進行重大升級,在原有框架上陸續新增各大統計方法論文寫作要點,重點關注關鍵統計結果的解讀,以及統計表格製作、統計結論撰寫等內容。
小兵堅決不做殭屍課程,這門課將長期更新維護,提供一對一答疑,互動討論解決問題,強調一下,小兵給大家開發和維護服務的是網絡視頻課程,不是代做代分析(可以去淘寶),這是有本質區別的。