什麼是回歸?什麼是回歸分析?回歸分析預測的分類方法有哪些?

2020-12-22 許栩原創之管理與職場

大家好,歡迎來到許栩原創專欄《從入門到高手:線性回歸分析詳解》,本篇是專欄的第三篇文章,回歸分析的歷史、概念和分類。

本專欄第一章和第二章,我分別講解了學習回歸分析之前必須了解的兩個基礎概念:變量和相關性。本章,講解回歸分析的相關概念和的分類,主要包括以下四個內容。(本專欄總目錄見下圖。)

1、為什麼叫「回歸」?

2、什麼是回歸分析?

3、回歸分析預測法。

4、回歸分析的分類。

一、為什麼叫「回歸」?

19世紀英國科學家弗朗西斯·高爾頓(Francis Galton)的著作《遺傳的天賦》出版後,儘管他的大表哥查爾斯·羅伯特·達爾文(Charles Robert Darwin)給予了很高的評價,但他的觀點得到大多數的反感和批評。

對《遺傳的天賦》持批評意見的人認為,儘管遺傳因素對智力的影響是真實存在的,但是高爾頓過分誇大了它的作用。於是,高爾頓決心研究父母遺傳決定子女命運的程度。從可量化的身高開始,即父母身高對子女身高的影響。

很快,高爾頓發現了一個異乎尋常的現象:如果父母較高,他們孩子的身高也較高,但很可能不如他們父母的身高;而當父母較矮時,情況正好相反,雖然孩子也比較矮,但是不會比他們的父母矮

人們把高爾頓發現的這種現象叫做「回歸平均值」,這是「回歸」的最初來源。

為什麼叫「回歸」?當父輩高於(或低於)平均身高時,他們子輩的身高比他更高(或更低)的概率小於比他更低(或更高)的概率,反映子輩有向他們父輩的平均身高回歸的趨勢

二、什麼是回歸分析?

《遺傳的天賦》出版二十年後,高爾頓在《自然的遺傳》一書中指出,從整體情況看,成年子女的身高與他們父母相比更加趨於平均水平,從理論上講,回歸是一個必然的事實。【高爾頓在試驗和研究的過程中發明了「散點圖」並提出了「相關係數」的概念(具體過程我這裡就不細表)。】

後來,高爾頓很快發現,回歸現象不僅僅在父母和子女身高上出現,相關係數的應用也並有僅限於遺傳研究領域。在生活中,隨時間產生起伏變化的任何東西,幾乎都會受到回歸效應的影響。高爾頓認為,只要兩個量彼此之間可能有關係,就可以用相關係數來進行分析。

回歸分析就是在相關分析的基礎上發展而來。

回歸分析,是對兩個或兩個以上變量之間的相關關係進行定量研究的一種統計分析方法。

1、回歸分析研究的是兩個或兩個變量之間的關係,單一的變量不存在回歸分析。

2、回歸分析研究的是相關關係,當兩個變量之間不存在相關關係時,就沒有進行回歸分析的必要。(注,再重複一遍上兩講講過的話題,相關關係不僅僅限於因果關係。)

3、回歸分析是定量研究方法,是一種統計分析方法。

三、回歸分析預測法。

本專欄講的回歸分析,主要目的是用回歸分析做預測,那麼,什麼是回歸分析預測呢?

回歸分析預測法,是在分析自變量和因變量之間相關關係的基礎上,建立變量之間的回歸方程,並將回歸方程作為預測模型進行預測的一種預測方法。

回歸分析預測法,主要是發現需求(因變量)和影響需求的因素(自變量)之間的關係,從而利用這些關係來幫助預測未來的需求。

相關焦點

  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • 16種常用的數據分析方法-回歸分析
    2 回歸分析 研究自變量與因變量之間關係形式的分析方法,它主要是通過建立因變量y 與影響他的自變量Xi 之間的回歸模型,來預測因變量y 的發展趨勢。
  • 什麼是多重共線性?多元回歸分析中消除多重共線性的3個實用方法
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第六章,多重共線性:消除多重共線性的3個簡單並實用的方法。前五章,我講述了回歸分析的相關概念和分類,以及一元線性回歸與多元線性回歸的基礎模型(回歸方程與求解回歸方程),但在實際需求預測中,回歸方程本身還存在較多的不確定性,不宜直接以求解回歸方程得出預測結果。
  • 七種回歸分析方法,個個經典
    什麼是回歸分析? 回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。例如,司機的魯莽駕駛與道路交通事故數量之間的關係,最好的研究方法就是回歸。
  • 回歸分析的基礎概念1:什麼是變量、自變量、因變量和「啞變量」
    大家好,我是許栩,歡迎來到我的專欄《從入門到高手-線性回歸分析詳解》,這是專欄的第一篇文章,介紹幾個回歸分析的基礎概念:變量、自變量、因變量和「啞變量」。常用的定量預測方法包括時間序列預測法與回歸分析預測法。
  • 多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程
    在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。
  • SPSS方法|嶺回歸分析
    選擇 k 值的一般原則主要有: ①各回歸係數的嶺估計基本穩定; ②用最小二乘估計時符號不合理的回歸係數, 其嶺估計的符號將變得合理; ③回歸係數的大小要與實際相符, 即從專業上講對因變量影響較大的自變量其係數的絕對值也較大; ④均方誤差增大不太多。
  • 多變量回歸模型分析應用概述
    因為有混雜因素的存在,在分析因素與結果變量間的關聯時,需要採用多變量分析技術,在控制多個混雜因素的影響後來闡述因素與疾病結果間的關聯。二、常用的多變量回歸分析方法及選擇  多變量回歸分析是定量估計變量間關係的統計過程,研究多個自變量與一個因變量關聯的統計規律。
  • 如何用線性回歸模型做數據分析?
    編輯導語:在日常工作中,很多時候都會用到數據分析的方法,線性回歸模型看起來非常簡單,但實際上它的十分重要;本文作者分享了關於如何用線性回歸模型做數據分析的方法,我們一起來學習一下。一、什麼是線性回歸線性回歸是利用線性的方法,模擬因變量與一個或多個自變量之間的關係;對於模型而言,自變量是輸入值,因變量是模型基於自變量的輸出值,適用於x和y滿足線性關係的數據類型的應用場景。
  • Python數據分析|線性回歸
    Python數據分析學習筆記,今天分享下利用Python對業務進行數據預處理,並利用線性回歸進行數據預測。貳數據預處理初步觀察發現有一些列的數據是空的,它們對於數據分析沒有意義,考慮去掉。並且後續進行一定的數據預處理。①去掉無效列:運用drop函數去掉無效的數據列,並再次調用head函數觀察數據。
  • 我用Excel發現了數據分析的本質:回歸分析
    最近很多人都問我,為什麼感覺數據分析越學越亂,經常是學了一大堆名詞,真正遇到問題的時候卻更多是直接套用模型,很難將這些理論聯繫起來。這其實就回歸到了一個至關重要的問題:數據分析的本質是什麼?事物都是萬變不離其宗的,一切外在的方法都是為了事物本質而服務的,數據分析自然也不例外,今天我們就來探討一下數據分析的本質。
  • R語言從入門到精通:Day12--R語言統計--回歸分析
    關注  從許多方面來看,回歸分析都是統計學的核心。它其實是一個廣義的概念,通指那些用一個或多個預測變量(也稱自變量)來預測響應變量(也稱因變量) 的方法。通常,回歸分析可以用來挑選與響應變量相關的預測變量,可以描述兩者的關係,也可以生成一個等式,通過預測變量來預測響應變量。
  • 七種常用回歸技術,如何正確選擇回歸模型?
    本文解釋了回歸分析的內涵及其優勢,重點總結了應該掌握的線性回歸、邏輯回歸、多項式回歸、逐步回歸、嶺回歸、套索回歸、ElasticNet回歸等七種最常用的回歸技術及其關鍵要素,最後介紹了選擇正確的回歸模型的關鍵因素。什麼是回歸分析?回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。
  • 光伏組件熱模型係數的確定方法和回歸分析
    如果現場有條件的話,也可以安裝相應的設備進行數據採集,並通過回歸分析來獲得熱損耗係數,這樣發電量仿真的準確性就大大提高。下面提供幾個步驟供參考:1)組件戶外試驗平臺的搭建:一般來說,光伏組件正南朝向安裝,同時在組件的附近安裝環境監測儀,採集組件的背板溫度、風速、風向、環境溫度、光伏斜面的輻照度。2)統計時間段可採用一年或多年,後臺導出輻照度、風速、組件溫度、環境溫度數據。
  • 線性回歸分析詳解7:多元回歸方程的精度,R平方與調整後的R平方
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第七章,回歸方程的精度,R平方與調整後的R平方。多元線性回歸分析,我們在求出多元線性回歸方程後,這個方程到底怎麼樣,能不能起到效果,需要對求出的回歸方程進行一系列評價和評估。這些評價和評估,首先要做的,是確認回歸方程的精度。本章,我將分如下三個小節講述回歸方程的精度,歡迎閱讀與探討。我的《線性回歸分析》專欄總目錄見下圖。
  • Cox等比例回歸模型實例分析
    Previously on Cox比例風險回歸模型,Cox比例風險回歸模型是一種半參數模型,可研究多個定性/定量變量對結局和生存時間的影響,主要的前提條件是協變量對生存率的影響不隨時間的改變而改變,分析前必須進行檢驗假定(如伴時Cox回歸模型)。
  • 用Excel求解回歸方程的3種方法:LINEST、散點圖和數據分析工具
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第四章,一元線性回歸分析。實際場景中,對需求影響的因素很多,也就是說自變量很多,很少能用單一的變量,也即一元回歸分析來做好預測。回歸分析在預測裡的應用,主要是多元回歸。
  • Excel中數據分析之回歸分析怎麼用
    已知8組對應數據,建立標準曲線,並且對此曲線進行評價,給出殘差等分析數據。  這是一個很典型的線性擬合問題,手工計算就是採用最小二乘法求出擬合直線的待定參數,同時可以得出R的值,也就是相關係數的大小。在Excel中,可以採用先繪圖再添加趨勢線的方法完成前兩步的要求。  選擇成對的數據列,將它們使用「X、Y散點圖」製成散點圖。
  • 回歸系列(四)|一個完整的線性回歸是怎樣做的
    多重線性回歸一般也叫「多元線性回歸」,我更支持「多重」的叫法,因為「多元」一般也指「因變量Y」有多個。通過前面的文章,我們知道做線性回歸就是要構建Y與X的線性關係,主要目的有兩個,一是確定X對Y的影響程度(即回歸係數的計算);二是通過X來預測Y。這裡最重要的一條準則是:Y需要是定量變量,就是類似於「收入」、「得分」等。
  • spss線性回歸 回歸方程 - CSDN
    >線性回歸,首先應用於定距變量之間,本質上是分析一個因變量和一組自變量之間的相關關係,既可以解釋,也可以做預測。線性回歸的適用條件【案例】今天用到的是一個分析交通運輸需求的數據集。在這個案例中,需要預測的是因變量Y「每周乘客數量」,自變量分別是X1至X4。