定義
多重線性回歸模型:Mulitiple Linear Regression
多元線性回歸模型:Multivariate Linear Regression
數據準備#多重線性回歸
#數據準備
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
df
根據預測目標,確定自變量和因變量#多重線性回歸
#數據準備
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
#多重線性回歸
#數據準備
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
繪製散點圖,確定回歸模型類型#多重線性回歸
#數據準備
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
#營銷費用 作為x軸
#銷售額 作為y軸
#繪製散點圖
df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')
#多重線性回歸
#數據準備
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
#營銷費用 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')
#客流量 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')
估計模型參數,建立線性回歸模型#多重線性回歸
#數據準備
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
#營銷費用 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')
#客流量 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')
#導入sklearn.linear_model 模塊中的LinearRegression函數
from sklearn.linear_model import LinearRegression
#使用線性回歸模型進行建模
lrModel= LinearRegression()
#使用自變量x和因變量y訓練模型
lrModel.fit(x,y)
#多重線性回歸
#數據準備
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
#營銷費用 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')
#客流量 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')
#導入sklearn.linear_model 模塊中的LinearRegression函數
from sklearn.linear_model import LinearRegression
#使用線性回歸模型進行建模
lrModel= LinearRegression()
#使用自變量x和因變量y訓練模型
lrModel.fit(x,y)
#使用訓練得到的模型的coef_屬性,即可得到模型的參數b,
#使用訓練得到的模型的intercept_屬性,即可得到模型的參數a
#查看參數
lrModel.coef_
# 查看截距
lrModel.intercept_
對回歸模型進行驗證#多重線性回歸
#數據準備
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
#營銷費用 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')
#客流量 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')
#導入sklearn.linear_model 模塊中的LinearRegression函數
from sklearn.linear_model import LinearRegression
#使用線性回歸模型進行建模
lrModel= LinearRegression()
#使用自變量x和因變量y訓練模型
lrModel.fit(x,y)
#使用訓練得到的模型的coef_屬性,即可得到模型的參數b,
#使用訓練得到的模型的intercept_屬性,即可得到模型的參數a
#查看參數
lrModel.coef_
# 查看截距
lrModel.intercept_
#計算模型的精度
lrModel.score(x,y)
利用回歸模型進行預測#多重線性回歸
#數據準備
import matplotlib
import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')
#定義自變量
x=df[['營銷費用(萬元)','客流量(萬人次)']]
#定義因變量
y=df[['銷售額(萬元)']]
#計算相關係數
df['營銷費用(萬元)'].corr(df['銷售額(萬元)'])
df['客流量(萬人次)'].corr(df['銷售額(萬元)'])
#營銷費用 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('營銷費用(萬元)','銷售額(萬元)',kind='scatter')
#客流量 作為x軸
#銷售額 作為y軸,繪製散點圖
df.plot('客流量(萬人次)','銷售額(萬元)',kind='scatter')
#導入sklearn.linear_model 模塊中的LinearRegression函數
from sklearn.linear_model import LinearRegression
#使用線性回歸模型進行建模
lrModel= LinearRegression()
#使用自變量x和因變量y訓練模型
lrModel.fit(x,y)
#使用訓練得到的模型的coef_屬性,即可得到模型的參數b,
#使用訓練得到的模型的intercept_屬性,即可得到模型的參數a
#查看參數
lrModel.coef_
# 查看截距
lrModel.intercept_
#計算模型的精度
lrModel.score(x,y)
#使用predict函數,把自變量作為參數傳入
pX=pd.DataFrame({'營銷費用(萬元)':[20],'客流量(萬元)':[5]})
pX
時間內容備註2020/7/7python 多重線性回歸分析增加數學公式這兩次開始使用在線Markdown進行內容編輯,效果比過去好多了。
數據分析時,需要輸入數學公式,可以使用typora
效果:
今天也用Markdown 作甘特圖讓工作日井然有序
推薦:typora+Markdown保存.md文件。