許栩原創專欄《從入門到高手:線性回歸分析詳解》第四章,一元線性回歸分析。
實際場景中,對需求影響的因素很多,也就是說自變量很多,很少能用單一的變量,也即一元回歸分析來做好預測。回歸分析在預測裡的應用,主要是多元回歸。但是,我們必須學會和掌握一元回歸分析,因為,一元回歸是多元回歸的基礎,我們只有學會和掌握了一元回歸,才能夠繼續去學習和掌握多元回歸。
《從入門到高手:線性回歸分析詳解》專欄總目錄見上圖。
一元線性回歸方程。
線性回歸,是假設因變量和自變量之間存在線性關係,線性關係可以用一元或多元線性方程式的形式表現出來,這個方程式就是線性回歸方程。
一元線性回歸只有一個變量,方程式是y=ax+b。(見上圖)
式中,y為因變量,x為自變量。
a為回歸直線的斜率,也稱為回歸係數。回歸係數(regression coefficient)表示自變量x 對因變量y 影響程度的參數。回歸係數越大(絕對值),代表自變量x 對因變量y 的影響程度越大。
回歸係數與相關係數的正負方向相同,即正相關關係的回歸係數為正數,表示因變量y 隨著自變量x 增大而增大;負相關關係的的回歸係數為負數,表示因變量y 隨著自變量x 增大而減少。
b為截距。截距分為橫截距和縱截距,橫截距是直線與X軸交點的橫坐標,縱截距是直線與Y軸交點的縱坐標。
在回歸方程中,b是指的縱截距,即回歸直接與Y軸交點的縱坐標(見上圖)。
求解一元線性回歸方程。
上圖我模擬了一組數據,記錄了回歸火鍋店冬天的氣溫和銷售業績。
上圖中氣溫和銷售業績是一組數據,是一個數據集。回歸分析其實就是尋找一條最能「擬合」這組數據的直線,尋找一條最佳直線。(所謂「擬合」,在回歸分析中,是指找出一條穿過數據集的,並且使這組數據集上的每個數據點到直線距離最近的直線。)
這個最佳的直線就是我們需要求解的線性回歸直線y=ax+b,即我們需要求出回歸方程中回歸係數a和截距b分別為多少。
常見的求解回歸係數a和截距b(求解回歸方程)的方法,一般有散點圖法、最小二乘法和Excel函數求解法。前兩個是從原理方面解出回歸方程,後者是用Excel函數為工具解出回歸方程(不管原理)。
從原理方面求解回歸方程比較複雜(比如最小二乘法),而Excel函數可以非常簡單解出回歸方程,本專欄以基於需求預測講回歸分析,即回歸分析主要是為了需求預測,我們對原理可以不用了解,只需要知道如何解出方程即可。
所以,本篇僅講解用Excel函數求解一元線性回歸方程方法。
用Excel求解線性回歸方程有三種方法:LINEST函數求解、散點圖功能自動求解和Excel數據分析工具求解。
1、LINEST函數求解。