详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程

时间:2021-05-22

一、导入excel文件和相关库

import pandas;import matplotlib;from pandas.tools.plotting import scatter_matrix; data = pandas.read_csv("D:\\面积距离车站.csv",engine='python',encoding='utf-8')

显示文件大小

data.shapedata

二.绘制多个变量两两之间的散点图:scatter_matrix()方法

#绘制多个变量两两之间的散点图:scatter_matrix()方法font = { 'family' : 'SimHei'}matplotlib.rc('font', **font)scatter_matrix( data[["area","distance", "money"]], figsize=(10, 10), diagonal='kde') #diagonal参数表示变量与变量本身之间的绘图方式,kde代表直方图#求相关系数矩阵data[["area", "distance", "money"]].corr()x = data[["area", "distance"]]y = data[["money"]]

三、导入sklearn

from sklearn.linear_model import LinearRegression#建模lrModel = LinearRegression()#训练模型lrModel.fit(x, y)#评分R2=lrModel.score(x, y)print("R的平方:",R2)#预测lrModel.predict([[10, 110],[20, 110]])#查看参数lrModel.coef_#查看截距lrModel.intercept_

结果如下:


回归方程为:y=41.51x1-0.34x2+65.32

四、python全部代码

import pandas;import matplotlib;from pandas.tools.plotting import scatter_matrix;data.shape#绘制多个变量两两之间的散点图:scatter_matrix()方法font = { 'family' : 'SimHei'}matplotlib.rc('font', **font)scatter_matrix( data[["area","distance", "money"]], figsize=(10, 10), diagonal='kde') #diagonal参数表示变量与变量本身之间的绘图方式,kde代表直方图#求相关系数矩阵data[["area", "distance", "money"]].corr()x = data[["area", "distance"]]y = data[["money"]]from sklearn.linear_model import LinearRegression#建模lrModel = LinearRegression()#训练模型lrModel.fit(x, y)#评分R2=lrModel.score(x, y)print("R的平方:",R2)#预测lrModel.predict([[10, 110],[20, 110]])#查看参数lrModel.coef_#查看截距lrModel.intercept_

到此这篇关于详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程的文章就介绍到这了,更多相关Jupyter notebooks sklearn多元回归方程内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章