許栩原創專欄《從入門到高手:線性回歸分析詳解》第七章,回歸方程的精度,R平方與調整後的R平方。
多元線性回歸分析,我們在求出多元線性回歸方程後,這個方程到底怎麼樣,能不能起到效果,需要對求出的回歸方程進行一系列評價和評估。這些評價和評估,首先要做的,是確認回歸方程的精度。
本章,我將分如下三個小節講述回歸方程的精度,歡迎閱讀與探討。我的《線性回歸分析》專欄總目錄見下圖。
1、什麼是回歸方程的精度?
2、衡量回歸方程精度的指標及評定標準。
3、調整後的R2。
一、什麼是回歸方程的精度?
回歸方程的精度,指的是實際的需求點與線性回歸直線的擬合程度。回歸方程的精度越高(擬合程度越高),回歸預測的結果就越準確。
什麼是回歸方程的擬合程度呢?我們來看下面兩個散點圖。
從下圖中可以明顯看出,左圖的點到回歸直線的距離更近一些,也就是左圖的點和回歸直線吻合得更好一些,這吻合得更好一些就是回歸方程的擬合度更好,或者說,回歸方程的精度更高。
回歸方程的精度確認,在求解回歸方程之後進行。即解出了回歸方程,我們首先要確認回歸方程的精度。
當然,回歸方程的精度不能直接以看散點圖的方式判定,這樣過於主觀,我們需要找到衡量回歸方程精度的指標及確定回歸方程精度的評定標準。
二、衡量回歸方程精度的指標及評定標準。
衡量回歸方程精度的指標是R2,也就是判定係數。(判定係數R2本專欄已單獨講過,相關介紹請回看本專欄第二章)。
判定係數R2是一個解釋性係數,在回歸分析中,其主要作用就是評估回歸模型對因變量y產生變化的解釋程度,即回歸方程的精度(也就是回歸方程的擬合程度),或者說,判定係數R2是評估回歸模型好壞的指標。
那麼,具體怎麼去計算和評估呢?——我們確定了要用判定係數R2來衡量回歸方程的精度,那首先得算出相關係數R,我們需要求哪兩個變量的相關係數R呢?
衡量回歸方程的精度,我們第一步需要計算「需求實際值」與「回歸模型預測值」兩個變量的相關係數。
衡量回歸方程精度的指標判定係數R2具體的計算過程,我們以下圖來進行說明。
1、需求實際值就是實際業績,即因變量y。
2、回歸模型預測值是指預測業績y』,是指將自變量代入回歸方程計算出來的預測值。下圖中,我們將氣溫和折扣代入回歸方程,得到每天的預測業績,這預測業績就是回歸模型預測值y』。
3、計算y與y』的相關係數R。我們仍然用CORREL函數進行計算,得出y與y』的相關係數是0.818。
4、計算y與y』的判定係數R2。直接取相關係數R的平方即可,下圖中,判定係數R2=0.8182=0.669。
我們得出了判定係數R2的值,那麼,多大的值才代表回歸方程的精度高呢?這個需要根據實際情況而確定,到目前為止還沒有一個確定的統一標準。一般認為,判定係數R2的值在0.5以上代表回歸方程擬合較好,回歸方程的精度較高。對於這個評定標準,我的建議如下。