一、方法簡述
多元逐步回歸有3種篩選自變量的方法:
(1)向前法:這種算法SPSS會建立由一個自變量開始,每次引入一個偏回歸平方和最大且具有統計學意義的自變量,由少到多,直到無具有統計學意義的因素可以代入方程為止,此法也可能納入部分無意義變量;
(2)向後法:這種算法SPSS會先建立一個全因素的回歸方程,再逐步剔除一個偏回歸平方和最小且無統計學意義的自變量,知道不能再剔除為止,這種方法算法較為複雜,一般我們不使用;
(3)逐步法(本次分享):逐步法結合向前法和向後法的優點,在向前引入每一個新自變量之後都要重新對已代入的自變量進行計算,以檢驗其有無繼續保留在方程中的價值,並以此為依據進行自變量的引入和剔除交替進行,直到沒有新的變量可以引入或剔除為止,此法較為準確。
二、數據分析
與多元線性回歸分析一樣,多元逐步回歸分析數據也必須滿足以下4個假設:
(1)需要至少2個自變量,且自變量之間互相獨立(本次6個);
(2)因變量為為連續變量(本案例產量為連續變量);
(3)數據具有方差齊性、無異常值和正態分布的特點(檢驗方法);
(4)自變量間不存在多重共線性。
前2個假設可根據試驗設計直接判斷;假設(3)的檢驗在之前的教程中已有呈現,點擊「檢驗方法」即可查看。
關於假設(4)的檢驗方法如下:
1. 點擊 ①分析 → ②回歸 → ③線性
2.①將pH等6個自變量選入自變量框→②將產量選入因變量框→③④在方法中選擇步進(enter)→⑤點擊統計。
3.在統計窗口選擇共線性診斷,點擊繼續,然後再主頁面點擊確定即可。
4.結果判斷:在結果中我們關注係數表即可,當VIF值大於等於10時,我們認為變量間存在嚴重的共線性,應當剔除部分VIF值較高的自變量,再進行多元逐步回歸分析;當VIF值小於10時,我們認為數據基本符合多元逐步回歸分析的假設(4),即不存在多重共線性問題,可以進行分析。
因此,本案例數據均滿足以上4個假設,可以進行多元逐步回歸分析的運算。