python多重線性回歸分析

2021-01-19 CSDN技術社區

python多重線性回歸分析多重線性回歸分析

定義

多重線性回歸模型:Mulitiple Linear Regression

多元線性回歸模型:Multivariate Linear Regression

數據準備

#多重線性回歸

#數據準備

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

df

根據預測目標,確定自變量和因變量

#多重線性回歸

#數據準備

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

#多重線性回歸

#數據準備

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

繪製散點圖,確定回歸模型類型

#多重線性回歸

#數據準備

import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

#營銷費用 作為x軸

#銷售額 作為y軸

#繪製散點圖

df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')

#多重線性回歸

#數據準備

import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

#營銷費用 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')

#客流量 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')

估計模型參數,建立線性回歸模型

#多重線性回歸

#數據準備

import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

#營銷費用 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')

#客流量 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')

#導入sklearn.linear_model 模塊中的LinearRegression函數

from sklearn.linear_model import LinearRegression

#使用線性回歸模型進行建模

lrModel= LinearRegression()

#使用自變量x和因變量y訓練模型

lrModel.fit(x,y)

#多重線性回歸

#數據準備

import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

#營銷費用 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')

#客流量 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')

#導入sklearn.linear_model 模塊中的LinearRegression函數

from sklearn.linear_model import LinearRegression

#使用線性回歸模型進行建模

lrModel= LinearRegression()

#使用自變量x和因變量y訓練模型

lrModel.fit(x,y)

#使用訓練得到的模型的coef_屬性,即可得到模型的參數b,

#使用訓練得到的模型的intercept_屬性,即可得到模型的參數a

#查看參數

lrModel.coef_

# 查看截距

lrModel.intercept_

對回歸模型進行驗證

#多重線性回歸

#數據準備

import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

#營銷費用 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')

#客流量 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')

#導入sklearn.linear_model 模塊中的LinearRegression函數

from sklearn.linear_model import LinearRegression

#使用線性回歸模型進行建模

lrModel= LinearRegression()

#使用自變量x和因變量y訓練模型

lrModel.fit(x,y)

#使用訓練得到的模型的coef_屬性,即可得到模型的參數b,

#使用訓練得到的模型的intercept_屬性,即可得到模型的參數a

#查看參數

lrModel.coef_

# 查看截距

lrModel.intercept_

#計算模型的精度

lrModel.score(x,y)

利用回歸模型進行預測

#多重線性回歸

#數據準備

import matplotlib

import matplotlib.pyplot as plt

import pandas as pd

df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')

#定義自變量

x=df[['營銷費用(萬元)','客流量(萬人次)']]

#定義因變量

y=df[['銷售額(萬元)']]

#計算相關係數

df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])

df['客流量(萬人次)'].corr(df['銷售額(萬元)'])

#營銷費用 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')

#客流量 作為x軸

#銷售額 作為y軸,繪製散點圖

df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')

#導入sklearn.linear_model 模塊中的LinearRegression函數

from sklearn.linear_model import LinearRegression

#使用線性回歸模型進行建模

lrModel= LinearRegression()

#使用自變量x和因變量y訓練模型

lrModel.fit(x,y)

#使用訓練得到的模型的coef_屬性,即可得到模型的參數b,

#使用訓練得到的模型的intercept_屬性,即可得到模型的參數a

#查看參數

lrModel.coef_

# 查看截距

lrModel.intercept_

#計算模型的精度

lrModel.score(x,y)

#使用predict函數,把自變量作為參數傳入

pX=pd.DataFrame({'營銷費用(萬元)':[20],'客流量(萬元)':[5]})

pX

時間內容備註2020/7/7python 多重線性回歸分析增加數學公式

這兩次開始使用在線Markdown進行內容編輯,效果比過去好多了。

數據分析時,需要輸入數學公式,可以使用typora

效果:

今天也用Markdown 作甘特圖讓工作日井然有序

推薦:typora+Markdown保存.md文件。

相關焦點

  • 多重線性回歸
    python多重線性回歸分析多重線性回歸分析定義多重線性回歸模型:Mulitiple Linear Regression多元線性回歸模型:Multivariate Linear Regression數據準備#多重線性回歸#數據準備
  • 多重線性回歸實例 - CSDN
    在上一期SPSS的推文中我們講了一些關於線性回歸的基本知識,還利用一個簡單的實例進行了簡單線性回歸的分析,今天我們就來講講多重線性回歸(也叫多元線性回歸),有關多元線性回歸的概念我在上一期的推文中也已經講過,這裡就不提了。可瀏覽上一篇SPSS的推文:SPSS第二期——線性回歸(上),兩篇對照起來看,或許能學到更多知識。
  • Python數據分析|線性回歸
    Python數據分析學習筆記,今天分享下利用Python對業務進行數據預處理,並利用線性回歸進行數據預測。④先以我們後續需要用來做線性回歸的列「內容閱讀量」為標準,將不含該值的數據行去除:調用dropna函數,並執行info函數看數據情況。
  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第10章,這是本專欄的最後一章,是專欄的完結篇:用線性回歸分析做預測,多元線性回歸分析預測的十大步驟。線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • SPSS多元線性回歸分析
    該研究想建立變量(pH、SOM、SAN等)與產量之間的回歸方程,此時我們可以考慮採用多元線性回歸分析。值得注意的是,多元線性回歸分析需要數據滿足以下4個假設:(1)需要至少2個自變量,且自變量之間互相獨立(本次6個);(2)因變量為為連續變量(本案例產量為連續變量);(3)數據具有方差齊性、無異常值和正態分布的特點(檢驗方法);(4)自變量間不存在多重共線性。
  • 原理+代碼|Python實戰多元線性回歸模型
    其中多元共線性這個問題將貫穿所有的機器學習模型,所以本文會「將原理知識穿插於代碼段中」,爭取以不一樣的視角來敘述和講解「如何更好的構建和優化多元線性回歸模型」。多重線性回歸模型的主要假設之一是我們的預測變量(自變量)彼此不相關。我們希望預測變量(自變量)與反應變量(因變量)相關,而不是彼此之間具有相關性。
  • 如何用線性回歸模型做數據分析?
    編輯導語:在日常工作中,很多時候都會用到數據分析的方法,線性回歸模型看起來非常簡單,但實際上它的十分重要;本文作者分享了關於如何用線性回歸模型做數據分析的方法,我們一起來學習一下。線性回歸應用於數據分析的場景主要有兩種:驅動力分析:某個因變量指標受多個因素所影響,分析不同因素對因變量驅動力的強弱(驅動力指相關性,不是因果性);預測:自變量與因變量呈線性關係的預測;模型數學形式:=0+11+22++
  • 線性回歸分析思路總結!簡單易懂又全面!
    線性回歸是一種研究影響關係的方法,在實際研究裡非常常見。本文就來梳理下線性回歸分析的分析流程,閒話少說,我們開始吧!線性回歸回歸分析實質上就是研究一個或多個自變量X對一個因變量Y(定量數據)的影響關係情況。當自變量為1個時,是一元線性回歸,又稱作簡單線性回歸;自變量為2個及以上時,稱為多元線性回歸。
  • 回歸分析之Python實現
    回歸分析  Python實現      在統計學中,回歸分析(regression analysis)指的是確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法。回歸分析按照涉及的變量的多少,分為二元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關係類型,可分為線性回歸分析和非線性回歸分析。本文只探討線性回歸分析。---
  • 多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第五章,多元線性回歸分析:如何求解多元線性回歸方程。在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。
  • 什麼是多重共線性?多元回歸分析中消除多重共線性的3個實用方法
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第六章,多重共線性:消除多重共線性的3個簡單並實用的方法。前五章,我講述了回歸分析的相關概念和分類,以及一元線性回歸與多元線性回歸的基礎模型(回歸方程與求解回歸方程),但在實際需求預測中,回歸方程本身還存在較多的不確定性,不宜直接以求解回歸方程得出預測結果。
  • 回歸系列(四)|一個完整的線性回歸是怎樣做的
    作者:丁點helper 來源:丁點幫你前面的文章主要介紹了回歸的一些關鍵詞,比如回歸係數、樣本和總體回歸方程、預測值和殘差等,今天我們結合一個案例來看看如何做完整的回歸分析,準確而言,是多重線性回歸(Multiple Linear Regreesion)。
  • 一文輕鬆看懂線性回歸分析的交互作用!
    作者:丁點helper來源:丁點幫你前幾天的文章,我們聚焦在回歸分析,今天來看看在回歸分析中常常要研究的一類難點問題——交互作用的探究。交互(interaction),字面上不太好理解,但是從數學表達上卻很簡單。
  • 多元線性回歸預測spss - CSDN
    回歸一直是個很重要的主題。因為在數據分析的領域裡邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進行預測。關於回歸的知識點也許不一定比參數檢驗,非參數檢驗多,但是複雜度卻絕對在其上。回歸主要包括線性回歸,非線性回歸以及分類回歸。本文主要討論多元線性回歸(包括一般多元回歸,含有虛擬變量的多元回歸,以及一點廣義差分的知識)。
  • spss線性回歸 回歸方程 - CSDN
    我是一隻正在迭代的分析獅天天。最近看了B站UP主好好玩量化的視頻《回答沈逸老師,新冠疫情下越民主死越多嗎?》,用到的分析方法就是線性回歸,決定猛學習一下,再來評判視頻裡的結論。>線性回歸,首先應用於定距變量之間,本質上是分析一個因變量和一組自變量之間的相關關係,既可以解釋,也可以做預測。
  • 了解線性回歸的數學原理:線性回歸背後的微積分
    線性回歸通常是任何機器學習課程的起點。目的是預測輸入變量與目標變量之間的線性關係。天真的情況是穿過空間原點的直線。在這裡,我們僅限於二維空間,即笛卡爾平面。讓我們從y = mx格式開始逐步發展,然後從y = mx + c回歸開始。
  • 多重回歸中的共線性問題
    上期我們講的線性回歸中需要注意的問題(可回復「線性」查看),在多重線性回歸中,除要滿足上述要求外,還要滿足各自變量間沒有共線性,在線性回歸中
  • eviews 線性回歸模型 - CSDN
    分享經典書籍: A Modern Approach to Regression with R.pdf  連結: https://pan.baidu.com/s/14NJt7CrOpUUe2hYyrJn_rg  提取碼: 7fv6  多元線性回歸
  • 多元線性回歸係數檢驗 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。
  • SPSS方法|嶺回歸分析
    :嶺回歸分析是在構建多重線性回歸模型時, 對基於「最小二乘原理」推導出的估計回歸係數的計算公式作一下校正,使回歸係數更穩定。當自變量之間存在較強的多重共線性時,求得的多重線性回歸模型很不穩定; 尤其是某些自變量回歸係數的正負號與實際問題的專業背景不吻合時,嶺回歸分析可以很好地解決這一問題。