一、殘差是什麼?
在建立回歸模型的過程中,由於觀察人員的失誤或偶然因素的幹擾,常會使我們所得到的數據不完全可信,也就是出現異常數據。有的時候,即使結果中的F檢驗證實回歸方程可靠,也不能排除數據存在上述問題。殘差分析的目的就在於解決這一點。在數理統計中,殘差(residual)是指實際觀察值與估計值(擬合值)之間的差。
二、殘差分析的內容
顯然,有多少對數據,就有多少個殘差。殘差分析就是通過殘差所提供的信息,分析出數據的可靠性、周期性或其它幹擾,主要包括以下內容:
①殘差是否服從均值為零的正態分布;
②殘差是否為等方差的正態分布;
③殘差序列是否獨立;
④藉助殘差探測樣本中的異常值
SPSS 操作流程如下:SPSS-analyze-regression-linear-繪製
以標準化殘差(standardized residual)為縱軸,以不同的值為橫軸(如因變量的估計值、各個自變量的估計值等),可以得到不同的分析工具,如殘差分布圖(residual plot)、(partial regression plots)、殘差直方圖(histogram of residuals)、殘差正態概率分布圖(normal probability plots)等。
1. 用殘差直方圖和殘差正態概率分布圖可以檢查是否滿足誤差項分布的正態性假設。
2. 是否滿足方差齊性假設,典型的形狀是三角形或者菱形的殘差分布圖。因為受到非正態偏差的影響較小,所以Levene test受到比較廣泛的使用。如果不滿足,可以採用加權回歸(WLS)。
3. 殘差的獨立性,只要殘差分布圖存在著一個明確的形狀,就意味著殘差與因變量可能不獨立。同樣的道理,用殘差偏回歸分布圖可以檢查殘差對於任意一個指定的自變量是否獨立。如果存在這種情況,可以用變量變換的辦法來試試能否解決。
三、小結
「殘差圖」以回歸方程的自變量為橫坐標,以殘差為縱坐標,將每一個自變量的殘差描在該平面坐標上所形成的圖形。當描繪的點圍繞殘差等於0的直線上下隨機散布,說明回歸直線對原觀測值的擬合情況良好。否則,說明回歸直線對原觀測值的擬合不理想。
從「殘差圖」可以直觀地看出殘差的絕對數值都比較小,所描繪的點都在以0為橫軸的直線上下隨機散布,回歸直線對各個觀測值的擬合情況是良好的。說明變量X與y之間有顯著的線性相關關係。
如果殘差圖中各點的值差別比較大,說明回歸曲線方程與實際值之間差別也比較大。也可以說,殘差圖的波動幅度,反映了回歸方程與實際值之間的差別程度。
如果您喜歡本篇文章, 請分享到朋友圈,謝謝o(^▽^)o