Logistic回归是指机器学习算法,用于预测分类因变量的概率.在逻辑回归中,因变量是二元变量,由编码为1的数据组成(布尔值为真和假).
在本章中,我们将重点关注开发回归模型在Python中使用连续变量.线性回归模型的示例将侧重于从CSV文件中进行数据探索.
分类目标是预测客户是否会订阅(1/0)定期存款.
import pandas as pdimport numpy as npfrom sklearn import preprocessingimport matplotlib.pyplot as pltplt.rc("font", size=14)from sklearn.linear_model import LogisticRegressionfrom sklearn.cross_validation import train_test_splitimport seaborn as snssns.set(style="white")sns.set(style="whitegrid", color_codes=True)data = pd.read_csv('bank.csv', header=0)data = data.dropna()print(data.shape)print(list(data.columns))
按照以下步骤在Anaconda Navigator中使用"Jupyter Notebook"实现上述代码 :
步骤1 : 使用Anaconda Navigator启动Jupyter笔记本.
第2步&减号;上传csv文件以系统方式获得回归模型的输出.
第3步 : 创建一个新文件并执行上面提到的代码行以获得所需的输出.