前面我们学习了多元线性回归的原理,本节课用Python实现多元线性回归。
数据读取
#数据读取
import pandas as pd
bank_data=pd.read_csv("../../data/BankData.csv",index_col="分行编号")
bank_data.head()
运行结果:
#定义X
X=bank_data.iloc[:,1:]
X.head()
运行结果:
#定义y
y=bank_data.iloc[:,0]
y.head()
运行结果:
分行编号
1 0.9
2 1.1
3 4.8
4 3.2
5 7.8
Name: 不良贷款(亿元), dtype: float64
建模
from sklearn.linear_model import LinearRegression
mlModel=LinearRegression()
mlModel.fit(X,y)
运行结果:
LinearRegression()
获得判定系数
mlModel.score(X,y)
运行结果:
0.797603989084478
获得回归方程
print(mlModel.coef_)
print(mlModel.intercept_)
运行结果:
[ 0.04003935 0.14803389 0.01452935 -0.02919287]
-1.021639762985917
回归方程:
y=0.04x_1+0.15x_2+0.015x_3-0.03x_4
预测
y_pred=mlModel.predict(X)
print(y_pred)
运行结果:
[ 1.23717617 3.94464939 5.14051401 3.00138093 7.84784677 -0.09702264
4.51985246 9.39625551 1.59121198 1.56664319 0.77304537 4.02462456
1.75068325 4.80854023 8.04946297 2.81605615 -1.54019795 2.215896
0.37443472 4.15541063 11.88804787 2.21886608 3.11263773 8.2465296
2.15745504]