多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程

2021-01-08 許栩原創之管理與職場

許栩原創專欄《從入門到高手:線性回歸分析詳解》第五章,多元線性回歸分析:如何求解多元線性回歸方程。

在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。

這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。對需求預測而言,多元線性回歸更具有實用性和有效性。

多元線性回歸分析是一種應用範圍很廣的定量預測方法,是使用最多的需求預測方法之一,也是商業領域應用最廣泛的建模技術之一。多元線性回歸分析幾乎可運用於任何商業環境中,當然,包括需求預測。

本章主要內容如下。(專欄總目錄見下圖)

1、多元回歸方程。

2、納入多元回歸方程自變量的確定。

3、求解多元回歸方程。

多元回歸方程。

多元回歸分析,又稱重回歸分析,就是通過多個因素(自變量)對目標(因變量)進行預測的一種手段和方法。

多元回歸分析,可以理解為有兩個或兩個以上自變量的回歸分析。

多元回歸分析自變量和因變量的關係,可以多元方程式的形式表現出來,這個多元方程式就是多元回歸方程。

多元回歸擁有兩個或兩個以上的自變量,多元線性回歸方程式是y=a1x1+a2x2+…+anxn+b。多元回歸方程與一元回歸方程很相似,區別在於一元回歸方程是一個自變量,而多元回歸方程有多個自變量。(見下圖)

下圖式中,y為因變量,即我們要預測的目標變量,x1為自變量1,x2為自變量2,x3為自變量3,…,xn為自變量n,。

a1、a2、a3、…、an分別為x1、x2、x2、…、xn的回歸係數(也叫偏回歸係數),代表每個自變量對因變量影響的程度。

b為截距,為多元線性回歸直線與Y軸交點的縱坐標。

納入多元回歸方程自變量的確定。

前文我說到,影響需求的因素,也就是說自變量有很多個,我們不可能也沒有必要把這些自變量都納入多元回歸方程。何況這些自變量有的影響大,有的影響小,有的重要,有的不重要。這時,我們需要做出選擇,需要採取辦法將影響大的自變量納入多元回歸方程。

採取什麼方法呢?做相關分析。即對每一個自變量和因變量做相關分析,也就是求出每一個自變量和因變量的相關係數R,然後按一定的標準,將相關係數R達到一定標準的納入回歸方程。(這裡涉及到一個「多重共線性」的問題,我將在本專欄的下一章,即第六章詳細講述,本章暫不深入。)

我們可以用Excel函數CORREL計算相關係數R(詳細計算方法請見本專欄第二章《回歸分析的基礎概念之2:確定關係與相關關係,相關係數與判定係數》)。

相關係數R達到多少才可以納入多元回歸方程,我給出如下的標準。(詳見下圖)

上圖說明如下:

1、強相關、中相關直接納入多元回歸方程,即相關係數R比±0.5或更大(小)的自變量直接納入多元回歸方程。

2、弱相關,即相關係數在±0.3—±0.5之間的變量,可考慮納入多元回歸方程。根據其它數據情況(比如多重共線性),以及這個變量的特性及未來發展預期等情況綜合考慮。

3、微弱相關或不相關,即相關係數比±0.3或更小(大)的變量,直接排除在多元回歸方程之外。

下圖,我給出了一個納入多元回歸方程自變量選擇的實例。我仍模擬了「回歸火鍋店」的一組數據,下文的求解多元回歸方程,也將用這個數據。(為便於講解,我只列出了三個自變量。)

相關焦點

  • 【從入門到高手:回歸分析】多元回歸分析:如何求解多元回歸方程
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第五章,多元線性回歸分析:如何求解多元回歸方程
  • 【線性回歸】多變量分析:多元回歸分析
    實際上大部分學習統計分析和市場研究的人的都會用回歸分析,操作也是比較簡單的,但能夠知道多元回歸分析的適用條件或是如何將回歸應用於實踐,可能還要真正領會回歸分析的基本思想和一些實際應用手法!下面我們就來談談多元回歸分析,這張圖是利用多元線性回歸製作的策略分析圖,你可以理解X軸是重要性,Y軸是表現;首先,多元回歸分析應該強調是多元線性回歸分析!
  • 多元線性逐步回歸分析
    一、方法簡述多元逐步回歸有3種篩選自變量的方法:(1)向前法:這種算法SPSS會建立由一個自變量開始,每次引入一個偏回歸平方和最大且具有統計學意義的自變量,由少到多,直到無具有統計學意義的因素可以代入方程為止,此法也可能納入部分無意義變量;(2)向後法:這種算法SPSS會先建立一個全因素的回歸方程,再逐步剔除一個偏回歸平方和最小且無統計學意義的自變量
  • 多元回歸分析入門
    要了解變量之間如何發生相互影響的,就需要利用相關分析和回歸分析。在上一章講述了相關分析有關內容。本章介紹回歸分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析以及邏輯回歸分析等。j基本概念:    相關分析和回歸分析都是研究變量間關係的統計學課題。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • 範例分析:多元線性回歸分析
    基礎回顧簡單線性和多元線性回歸理論基礎請回顧:相關與回歸分析基礎;一元(簡單線性)相關分析與回歸分析
  • 一文讀懂多元回歸分析
    一、多元回歸分析簡介用回歸方程定量地刻畫一個應變量與多個自變量間的線性依存關係,稱為多元回歸分析(multiple linear
  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    本章,我將詳細講解用多元線性回歸分析進行需求預測的十大步驟:數據收集、數據清洗、列出所有的變量、確定納入回歸方程的自變量、確定並消除多重共線性、求解多元線性回歸方程、確認回歸方程的精度、顯著性驗證、計算置信區間、正式預測。一、數據收集。我們做統計,進行數據分析,首先的,都是需要有數據。有數據才能統計,有數據才能進行數據分析。
  • 多元線性回歸預測spss - CSDN
    回歸一直是個很重要的主題。因為在數據分析的領域裡邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進行預測。關於回歸的知識點也許不一定比參數檢驗,非參數檢驗多,但是複雜度卻絕對在其上。回歸主要包括線性回歸,非線性回歸以及分類回歸。本文主要討論多元線性回歸(包括一般多元回歸,含有虛擬變量的多元回歸,以及一點廣義差分的知識)。
  • 線性回歸分析詳解7:多元回歸方程的精度,R平方與調整後的R平方
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第七章,回歸方程的精度,R平方與調整後的R平方。多元線性回歸分析,我們在求出多元線性回歸方程後,這個方程到底怎麼樣,能不能起到效果,需要對求出的回歸方程進行一系列評價和評估。這些評價和評估,首先要做的,是確認回歸方程的精度。本章,我將分如下三個小節講述回歸方程的精度,歡迎閱讀與探討。我的《線性回歸分析》專欄總目錄見下圖。
  • 多元線性回歸與模型診斷
    一、多元線性回歸1.
  • r語言 多元回歸模型_r語言多元回歸模型殘差分析 - CSDN
    1、多元線性回歸模型1.1多元回歸模型與多元回歸方程設因變量為y,k個自變量分別為,描述因變量y如何依賴於自變量和誤差項ε的方程稱為多元回歸模型。其一般形式可表示為:式中,為模型的參數,ε為隨機誤差項。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:    毫無疑問,多元線性回歸方程應該為:那麼,多元線性回歸方程矩陣形式為:
  • SPSS大戰多元回歸分析
    多元回歸分析應用於各個領域,主要有經濟、醫學、農學等。今天小編為大家分享一篇SPSS大戰多元回歸的數據分析實例。線性回歸數據來自於國泰安數據服務中心的經濟研究資料庫。網址:http://www.gtarsc.com/p/sq/。數據名稱為:全國各地區能源消耗量與產量,該數據的年度標識為2006年,地區包括我國30個省,直轄市,自治區(西藏地區無數據)。
  • SPSS多元線性回歸案例:回歸分析方法實戰
    1.線性回歸(Linear Regression)線性回歸通常是人們在學習預測模型時首選的技術之一。在這種技術中,因變量是連續的,自變量可以是連續的也可以是離散的,回歸線的性質是線性的。線性回歸使用最佳的擬合直線(也就是回歸線)在因變量(Y)和一個或多個自變量(X)之間建立一種關係。
  • 原創案例:Matlab多元線性回歸分析-逐步回歸
    在多元線性回歸分析中,逐步回歸法是對多個變量進行分析的有效方法。逐步回歸的基本思想是逐個引入自變量,保留影響顯著的變量,剔除影響不顯著的變量,最終使得回歸方程擬合度趨於完美。在Matlab中,函數stepwise的功能就是對需要分析的變量進行逐步回歸,最後得出回歸方程各個擬合信息。Stepwise的簡單用法是stepwize(X,Y),X是由若干個自變量列向量組成的矩陣,Y是由因變量構成的列向量。
  • 多元線性回歸t檢驗專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。
  • r語言多元線性回歸相關性_多元線性回歸調整相關性 - CSDN
    多元線性回歸多元線性回歸的核心問題:應該選擇哪些變量???RSS(殘差平方和)與R2  (相關係數的平方)選擇法:遍歷所有可能的組合,選出使RSS最小,R2  最大的模型。
  • 機器學習之多元線性回歸模型梯度下降公式與代碼實現(篇二)
    上一篇我們介紹了線性回歸的概述和最小二乘的介紹,對簡單的一元線性方程模型手推了公式和python代碼的實現。機器學習之線性回歸模型詳細手推公式與代碼實現(篇一)今天這一篇來介紹多元線性回歸模型多元線性回歸模型介紹在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸
  • 逐步回歸分析調整後r2和模型的顯著性f值_多元線性回歸方程的顯著...
    線性回歸分析的步驟如下:(1)根據預測目標,確定自變量和因變量圍繞業務問題,明晰預測目標,從經驗、常識、以往歷史數據研究等角度,初步確定自變量和因變量。(2)繪製散點圖,確定回歸模型類型通過繪製散點圖的方式,從圖形化的角度初步判斷自變量和因變量之間是否具有線性相關關係,同時進行相關分析,根據相關係數判斷自變量與因變量之間的相關程度和方向,從而確定回歸模型的類型。(3)估計模型參數,建立回歸模型採用最小二乘法進行模型參數的估計,建立回歸模型。