什麼是回歸?什麼是回歸分析?回歸分析預測的分類方法有哪些?

2020-12-17 許栩原創之管理與職場

大家好,歡迎來到許栩原創專欄《從入門到高手:線性回歸分析詳解》,本篇是專欄的第三篇文章,回歸分析的歷史、概念和分類。

本專欄第一章和第二章,我分別講解了學習回歸分析之前必須了解的兩個基礎概念:變量和相關性。本章,講解回歸分析的相關概念和的分類,主要包括以下四個內容。(本專欄總目錄見下圖。)

1、為什麼叫「回歸」?

2、什麼是回歸分析?

3、回歸分析預測法。

4、回歸分析的分類。

一、為什麼叫「回歸」?

19世紀英國科學家弗朗西斯·高爾頓(Francis Galton)的著作《遺傳的天賦》出版後,儘管他的大表哥查爾斯·羅伯特·達爾文(Charles Robert Darwin)給予了很高的評價,但他的觀點得到大多數的反感和批評。

對《遺傳的天賦》持批評意見的人認為,儘管遺傳因素對智力的影響是真實存在的,但是高爾頓過分誇大了它的作用。於是,高爾頓決心研究父母遺傳決定子女命運的程度。從可量化的身高開始,即父母身高對子女身高的影響。

很快,高爾頓發現了一個異乎尋常的現象:如果父母較高,他們孩子的身高也較高,但很可能不如他們父母的身高;而當父母較矮時,情況正好相反,雖然孩子也比較矮,但是不會比他們的父母矮

人們把高爾頓發現的這種現象叫做「回歸平均值」,這是「回歸」的最初來源。

為什麼叫「回歸」?當父輩高於(或低於)平均身高時,他們子輩的身高比他更高(或更低)的概率小於比他更低(或更高)的概率,反映子輩有向他們父輩的平均身高回歸的趨勢

二、什麼是回歸分析?

《遺傳的天賦》出版二十年後,高爾頓在《自然的遺傳》一書中指出,從整體情況看,成年子女的身高與他們父母相比更加趨於平均水平,從理論上講,回歸是一個必然的事實。【高爾頓在試驗和研究的過程中發明了「散點圖」並提出了「相關係數」的概念(具體過程我這裡就不細表)。】

後來,高爾頓很快發現,回歸現象不僅僅在父母和子女身高上出現,相關係數的應用也並有僅限於遺傳研究領域。在生活中,隨時間產生起伏變化的任何東西,幾乎都會受到回歸效應的影響。高爾頓認為,只要兩個量彼此之間可能有關係,就可以用相關係數來進行分析。

回歸分析就是在相關分析的基礎上發展而來。

回歸分析,是對兩個或兩個以上變量之間的相關關係進行定量研究的一種統計分析方法。

1、回歸分析研究的是兩個或兩個變量之間的關係,單一的變量不存在回歸分析。

2、回歸分析研究的是相關關係,當兩個變量之間不存在相關關係時,就沒有進行回歸分析的必要。(注,再重複一遍上兩講講過的話題,相關關係不僅僅限於因果關係。)

3、回歸分析是定量研究方法,是一種統計分析方法。

三、回歸分析預測法。

本專欄講的回歸分析,主要目的是用回歸分析做預測,那麼,什麼是回歸分析預測呢?

回歸分析預測法,是在分析自變量和因變量之間相關關係的基礎上,建立變量之間的回歸方程,並將回歸方程作為預測模型進行預測的一種預測方法。

回歸分析預測法,主要是發現需求(因變量)和影響需求的因素(自變量)之間的關係,從而利用這些關係來幫助預測未來的需求。

相關焦點

  • Logistic(邏輯)回歸分析及癌症分類預測案例
    Logistic(邏輯)回歸分析一、邏輯回歸數學背景1、邏輯回歸(Logistic回歸)分析概要如果現在想對某件事情發生的概率進行預估,比如一個非醫用口罩,在疫情期間是否有人願意買?這裡的Y變量是「是否願意購買」,屬於分類數據,所以不能使用回歸分析。如果Y為類別性(定性)數據,研究影響關係,正確做法是選擇Logistic回歸分析。
  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • 你知道回歸分析的本質是什麼嗎?別稀裡糊塗做回歸分析了!
    這個回歸方程是一個函數,它不能準確反映父親身高和子代身高的關係,但是卻可以大致判斷,並且在一個群體水平計算父親身高對子女的影響的平均值,可以反映父親身高與子女身高的因果關係。「回歸」逐漸成為根據一種變量(父母身高)預測另一種變量(子女身高)或多種變量關係的描述方法,成為百年來經久不衰的統計學方法。 ▌什麼是模型?
  • 16種常用的數據分析方法-回歸分析
    2 回歸分析 研究自變量與因變量之間關係形式的分析方法,它主要是通過建立因變量y 與影響他的自變量Xi 之間的回歸模型,來預測因變量y 的發展趨勢。
  • 「回歸分析」知識點梳理
    在本文中,我們將討論什麼是回歸分析,它是如何工作的。回歸分析是作為數據科學家需要掌握的第一個算法。它是數據分析中最常用的預測建模技術之一。即使在今天,大多數公司都使用回歸技術來實現大規模決策。要回答「什麼是回歸分析」這個問題,我們需要深入了解基本面。
  • 七種回歸分析方法,個個經典
    什麼是回歸分析? 回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。例如,司機的魯莽駕駛與道路交通事故數量之間的關係,最好的研究方法就是回歸。
  • 機器學習的回歸是什麼
    一、什麼是回歸(Regression)說到回歸想到的是終結者那句:I'll be back,在數理統計中,回歸是確定多種變量相互依賴的定量關係的方法。(Unary Linear Regression)也叫一元線性回歸,一元線性回歸是分析只有一個自變量。
  • 什麼是多重共線性?多元回歸分析中消除多重共線性的3個實用方法
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第六章,多重共線性:消除多重共線性的3個簡單並實用的方法。前五章,我講述了回歸分析的相關概念和分類,以及一元線性回歸與多元線性回歸的基礎模型(回歸方程與求解回歸方程),但在實際需求預測中,回歸方程本身還存在較多的不確定性,不宜直接以求解回歸方程得出預測結果。
  • 【進階】使用Excel進行回歸分析,預測真實值
    回歸分析(regressionanalysis)是確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法。我們在得到兩組數據之間的相關程度之後,就可以使用回歸分析進行預測了,換言之,相關分析是回歸分析的基礎和前提,回歸分析是相關分析的深入和繼續。但只有當數據之間存在高度相關時,進行回歸分析尋求相關的具體形式才有意義。
  • Logistic回歸分析-分類因變量最常用且首先考慮的分析方法
    一、重要概念一)基本表達式 當因變量為分類變量時,最常用且首先考慮的回歸分析方法應為logistics回歸,也稱為logit回歸,因logistic回歸模型表達式為,由表達式可知logit P與變量間存在線性關係,P/(1-P)稱為發生比(odds)即觀測事件發生的概率與未發生的概率的比值。
  • 機器學習:回歸分析——多元線性回歸分析
    我們把包括兩個或兩個以上自變量的回歸稱為多元線性回歸。生活中的現象常常是與多個因素相聯繫的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際。所以相比一元線性回歸,多元線性回歸的實際意義更大。
  • 邏輯(Logistic)回歸分析-補充
    邏輯回歸(Logistic Regression)是在臨床研究中應用最為廣泛的統計方法之一,很多研究會在單因素分析的基礎上,進行一定的多因素分析(如線性回歸或邏輯回歸)。在本微信公眾號中已經有邏輯回歸的SPSS操作介紹了,詳見第33期,(加入微信公眾號"bysyrcce",回復"33"可查看)這裡我僅對其作一補充。邏輯回歸是分類資料統計分析的一種重要方法,是一種研究多水平(包括兩水平)的反應變量與其影響因子(又稱自變量)間關係的回歸分析。
  • 如何用EXCEL線性回歸分析法快速做數據分析預測
    回歸分析法,即二元一次線性回歸分析預測法先以一個小故事開始本文的介紹。十三多年前,筆者就職於深圳F集團時,曾就做年度庫存預測報告,與筆者新入職一臺籍高管Edwin分別按不同的方法模擬預測下一個年度公司總存貨庫存。令我吃驚的是,本人以完整的數據推算做依據,做出的報告結果居然與僅入職數周,數據不齊全的Edwin制定的報告結果吻合度達到99%以上。仍清楚記得,筆者曾用得是標準的周轉天數計算公式反推法,而Edwin用的正是本文重點介紹的二元一次線性回歸分析法。
  • 回歸分析的基礎概念1:什麼是變量、自變量、因變量和「啞變量」
    大家好,我是許栩,歡迎來到我的專欄《從入門到高手-線性回歸分析詳解》,這是專欄的第一篇文章,介紹幾個回歸分析的基礎概念:變量、自變量、因變量和「啞變量」。常用的定量預測方法包括時間序列預測法與回歸分析預測法。
  • 一文讀懂多元回歸分析
    多元回歸分析是多變量分析的基礎,也是理解監督類分析方法的入口!實際上大部分學習統計分析和市場研究的人的都會用回歸分析,操作也是比較簡單的,但能夠知道多元回歸分析的適用條件或是如何將回歸應用於實踐,可能還要真正領會回歸分析的基本思想和一些實際應用手法!
  • Logistic回歸分析之二元Logistic回歸
    在研究X對於Y的影響時,如果Y為定量數據,那麼使用多元線性回歸分析(SPSSAU通用方法裡面的線性回歸);如果Y為定類數據,那麼使用Logistic回歸分析。結合實際情況,可以將Logistic回歸分析分為3類,分別是二元Logistic回歸分析、多元有序Logistic回歸分析和多元無序Logistic回歸分析,如下圖。
  • 多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程
    在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。
  • 如何用邏輯回歸做數據分析?
    ,傳送門:如何用線性回歸做數據分析?接下來,我將用最簡單通俗的語言來為大家介紹邏輯回歸模型及其應用。邏輯回歸是解決二分類問題的監督學習算法,用來估計某個類別的概率。其直接預測值是表示0-1區間概率的數據,基於概率再劃定閾值進行分類,而求解概率的過程就是回歸的過程。
  • 快速數據分析教程:無序多分類Logistic回歸
    當Y只有兩個選項時,可以使用二分類Logistics,當Y有三項或更多時,則應該使用多分類Logistics回歸,比如願意購買,出行方式偏好,總統候選人選擇偏好等。有一市場研究公司想預測最終誰會勝出,因此收集到共1847名民眾信息,包括選擇偏好,性別,年齡,學歷等信息進行研究,研究性別,年齡和學歷對於總統候選人選擇的影響情況,最終做出科學預測。
  • Excel數據分析篇:線性回歸
    一、什麼是回歸分析(Regression)1、定義確定兩種或兩種以上變量間相關關係的一種統計分析方法。