多元线性回归案例:分析不良贷款形成的原因

前面我们学习了多元线性回归的原理,本节课用Python实现多元线性回归。

数据读取

#数据读取
import pandas as pd

bank_data=pd.read_csv("../../data/BankData.csv",index_col="分行编号")
bank_data.head()

运行结果:

#定义X
X=bank_data.iloc[:,1:]
X.head()

运行结果:

#定义y
y=bank_data.iloc[:,0]
y.head()

运行结果:

分行编号
1    0.9
2    1.1
3    4.8
4    3.2
5    7.8
Name: 不良贷款(亿元), dtype: float64

建模

from sklearn.linear_model import LinearRegression

mlModel=LinearRegression()
mlModel.fit(X,y)

运行结果:

LinearRegression()

获得判定系数

mlModel.score(X,y)

运行结果:

0.797603989084478

获得回归方程

print(mlModel.coef_)
print(mlModel.intercept_)

运行结果:

[ 0.04003935  0.14803389  0.01452935 -0.02919287]
-1.021639762985917

回归方程:

y=0.04x_1+0.15x_2+0.015x_3-0.03x_4

预测

y_pred=mlModel.predict(X)
print(y_pred)

运行结果:

[ 1.23717617  3.94464939  5.14051401  3.00138093  7.84784677 -0.09702264
  4.51985246  9.39625551  1.59121198  1.56664319  0.77304537  4.02462456
  1.75068325  4.80854023  8.04946297  2.81605615 -1.54019795  2.215896
  0.37443472  4.15541063 11.88804787  2.21886608  3.11263773  8.2465296
  2.15745504]

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注