線性回歸分析詳解7:多元回歸方程的精度,R平方與調整後的R平方

2020-12-08 許栩原創之管理與職場

許栩原創專欄《從入門到高手:線性回歸分析詳解》第七章,回歸方程的精度,R平方與調整後的R平方。

多元線性回歸分析,我們在求出多元線性回歸方程後,這個方程到底怎麼樣,能不能起到效果,需要對求出的回歸方程進行一系列評價和評估。這些評價和評估,首先要做的,是確認回歸方程的精度。

本章,我將分如下三個小節講述回歸方程的精度,歡迎閱讀與探討。我的《線性回歸分析》專欄總目錄見下圖。

1、什麼是回歸方程的精度?

2、衡量回歸方程精度的指標及評定標準。

3、調整後的R2。

一、什麼是回歸方程的精度?

回歸方程的精度,指的是實際的需求點與線性回歸直線的擬合程度。回歸方程的精度越高(擬合程度越高),回歸預測的結果就越準確。

什麼是回歸方程的擬合程度呢?我們來看下面兩個散點圖。

從下圖中可以明顯看出,左圖的點到回歸直線的距離更近一些,也就是左圖的點和回歸直線吻合得更好一些,這吻合得更好一些就是回歸方程的擬合度更好,或者說,回歸方程的精度更高。

回歸方程的精度確認,在求解回歸方程之後進行。即解出了回歸方程,我們首先要確認回歸方程的精度。

當然,回歸方程的精度不能直接以看散點圖的方式判定,這樣過於主觀,我們需要找到衡量回歸方程精度的指標及確定回歸方程精度的評定標準。

二、衡量回歸方程精度的指標及評定標準。

衡量回歸方程精度的指標是R2,也就是判定係數。(判定係數R2本專欄已單獨講過,相關介紹請回看本專欄第二章)。

判定係數R2是一個解釋性係數,在回歸分析中,其主要作用就是評估回歸模型對因變量y產生變化的解釋程度,即回歸方程的精度(也就是回歸方程的擬合程度),或者說,判定係數R2是評估回歸模型好壞的指標。

那麼,具體怎麼去計算和評估呢?——我們確定了要用判定係數R2來衡量回歸方程的精度,那首先得算出相關係數R,我們需要求哪兩個變量的相關係數R呢?

衡量回歸方程的精度,我們第一步需要計算「需求實際值」與「回歸模型預測值」兩個變量的相關係數。

衡量回歸方程精度的指標判定係數R2具體的計算過程,我們以下圖來進行說明。

1、需求實際值就是實際業績,即因變量y。

2、回歸模型預測值是指預測業績y』,是指將自變量代入回歸方程計算出來的預測值。下圖中,我們將氣溫和折扣代入回歸方程,得到每天的預測業績,這預測業績就是回歸模型預測值y』。

3、計算y與y』的相關係數R。我們仍然用CORREL函數進行計算,得出y與y』的相關係數是0.818。

4、計算y與y』的判定係數R2。直接取相關係數R的平方即可,下圖中,判定係數R2=0.8182=0.669。

我們得出了判定係數R2的值,那麼,多大的值才代表回歸方程的精度高呢?這個需要根據實際情況而確定,到目前為止還沒有一個確定的統一標準。一般認為,判定係數R2的值在0.5以上代表回歸方程擬合較好,回歸方程的精度較高。對於這個評定標準,我的建議如下。

相關焦點

  • 【回歸分析】R、R平方與調整後的R平方
    我們做回歸分析時,離不開一個字母「R」。本文向大家介紹R、R平方與調整後的R平方的概念、在回歸分析中作用以及計算方法。 一、R,相關係數。顧名思義,相關係數,是衡量兩個變量之間相關程度的係數,是判定變量之間線性相關性的一個相對指標。
  • 基於R軟體實現多元線性回歸
    其基本思想是確定一個方程,給出一組預測變量(X)和一個響應變量(Y)之間的線性關係:式中β1-βn代表了預測變量X1-Xn的回歸係數(斜率),β0是線性方程的截距。回歸的目的是找到一組最優的模型參數(斜率和截距值的組合),使響應變量的觀測值和預測值之間的殘差平方和最小化。
  • R語言和Python實現回歸分析
    我們期望回歸平方和佔比越大,那麼我們的模型就越好;但是回歸平方和<=總平方和;一元回歸不存在多重共線性的問題;而多元線性回歸要摒棄多重共線性的影響;所以要先對所有的變量進行相關係數分析,初步判定是否滿足前提---多重共線性時間序列數據會自發呈現完全共線性問題,所以我們用自回歸分析方法;出現多重共線性如何改善:1. 刪除變量對去除多重共線性最為顯著。2.
  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第10章,這是本專欄的最後一章,是專欄的完結篇:用線性回歸分析做預測,多元線性回歸分析預測的十大步驟。線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • 對比R語言和Python,教你實現回歸分析
    我們期望回歸平方和佔比越大,那麼我們的模型就越好;但是回歸平方和<=總平方和;一元回歸不存在多重共線性的問題;而多元線性回歸要摒棄多重共線性的影響;所以要先對所有的變量進行相關係數分析,初步判定是否滿足前提---多重共線性時間序列數據會自發呈現完全共線性問題,所以我們用自回歸分析方法;出現多重共線性如何改善:1. 刪除變量對去除多重共線性最為顯著。2.
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    利用回歸平方和與總離差平方和的比值來說明X與Y的相關性,稱為決定係數,即有:決定係數的開方被稱為相關係數,前面介紹過相關係數r(Excel數據分析工具:協方差與相關係數),計算公式為:兩者的計算結果是完全一致的。相關係數與決定係數都能表示變量之間的線性相關程度,但是相關係數計算更簡便且能表示相關關係的方向。
  • R與生物專題 | 第三十五講 R-多元線性回歸
    在「R與生物統計專題」中,我們會從介紹R的基本知識展開到生物統計原理及其在R中的實現。
  • 多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第五章,多元線性回歸分析:如何求解多元線性回歸方程。在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。
  • spss線性回歸 回歸方程 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:    毫無疑問,多元線性回歸方程應該為:那麼,多元線性回歸方程矩陣形式為:
  • 一元(多元)線性回歸分析之R語言實現
    上篇介紹了《一元(多元)線性回歸分析之Excel實現》,本篇來探討一下回歸分析在R語言中的實現,我們將從更專業的角度對模型進行一些解讀。
  • R語言 | 回歸分析(一)
    根據預測結果的類型,我們將回歸分析主要分為線性回歸(linear regression)、非線性回歸(non-linear regressin)、logistic回歸(logistic regression)等等。
  • (案例)線性/非線性回歸分析Matlab算例
    1762 1960 1902 2013 2446 2736 2825];%因變量時間序列數據%生成一個17*2 矩陣,其中第1 列元素均為1,作為常數項的自變量X=[ones(size(x')),x'];%調用一元回歸分析函數,自變量X 包含常數項和因變量,b 是回歸參數估計值,%bint是置信區間,r 和rint 分別表示殘差及殘差對應的置信區間。
  • 一文看懂線性回歸及相關概念
    最近剛好在看線性回歸,於是想分享下最近的學習心得。首先申明,此文只講大致的理解思路,力求以簡單通俗的方式來表達,因此不適合對數據分析有一定造詣的人士閱讀。同時鑑於本人也是小白,若有錯誤歡迎指正。而R方是用來檢驗線性回歸的擬合程度的,擬合程度越好,則R方越接近於1。那什麼是線性回歸,什麼又叫擬合程度呢?二、一元線性回歸作為初中(或是小學)的知識點,線性方程大家肯定都很熟悉。y=kx+b就是最早接觸到的一元線性回歸方程式。
  • 線性回歸:簡單線性回歸詳解
    【導讀】本文是一篇專門介紹線性回歸的技術文章,討論了機器學習中線性回歸的技術細節。線性回歸核心思想是獲得最能夠擬合數據的直線。
  • R與生物專題 | 第三十四講 R-簡單線性回歸模型(2)
    例如,係數b1的95%置信區間定義為b1 +/- 2*SE(b1),其中:即,間隔[0.042,0.052]中包含b1的真實值的可能性為95%。同樣,可以將b0的95%置信區間計算為b0 +/- 2*SE(b0)。
  • spss多元線性回歸模型 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:毫無疑問,多元線性回歸方程應該為:上圖中的 x1,  x2, xp分別代表「自變量」Xp截止,代表有P個自變量
  • 多元線性回歸、逐步回歸、邏輯回歸的總結
    對了,上次,用Python寫的兩篇回歸擬合分別是:基於最小二乘法的——線性回歸擬合(一)基於梯度下降法的——線性回歸擬合(二)多元回歸分析,生活中用的很多,因為一個因素可能與很多其它因素有關!言歸正傳,這裡考慮用R語言裡面的相關函數做回歸分析。
  • 多元線性回歸t檢驗專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。
  • CFA教材輔導:測試多元回歸的顯著性/修正R方
    更多CFA官方教材詳解,請關注「邊際實驗室」。「邊際實驗室」是一家專注於金融科技、金融大數據領域的工作室,同時提供CFA、FRM等金融考試內容的免費講解。在本節中,我們進一步討論通過回歸的方差分析來衡量模型的解釋程度等問題。如果回歸模型中沒有任何自變量有助於解釋因變量,則斜率係數應全部等於0。但是,在多元回歸中,我們基於每個斜率係數均等於零的t檢驗方法而檢驗所有斜率係數等於0的原假設是沒有意義的,因為這種檢驗未考慮自變量之間相互作用的影響。
  • 一文讀懂多元回歸分析
    一、多元回歸分析簡介用回歸方程定量地刻畫一個應變量與多個自變量間的線性依存關係,稱為多元回歸分析(multiple linear