建立回归模型

敏捷数据科学构建回归模型 - 从简单和简单的步骤学习敏捷数据科学，从基本到高级概念，包括简介，方法概念，数据科学过程，敏捷工具和安装，敏捷中的数据处理，SQL与NoSQL，NoSQL和数据流编程，收集和显示，数据可视化，数据丰富，使用报告，预测的作用，使用PySpark提取功能，构建回归模型，部署预测系统，SparkML，修复预测问题，提高预测性能，创建更好的场景敏捷和数据科学，敏捷实施。

Logistic回归是指机器学习算法，用于预测分类因变量的概率.在逻辑回归中，因变量是二元变量，由编码为1的数据组成(布尔值为真和假).

在本章中，我们将重点关注开发回归模型在Python中使用连续变量.线性回归模型的示例将侧重于从CSV文件中进行数据探索.

分类目标是预测客户是否会订阅(1/0)定期存款.

import pandas as pdimport numpy as npfrom sklearn import preprocessingimport matplotlib.pyplot as pltplt.rc("font", size=14)from sklearn.linear_model import LogisticRegressionfrom sklearn.cross_validation import train_test_splitimport seaborn as snssns.set(style="white")sns.set(style="whitegrid", color_codes=True)data = pd.read_csv('bank.csv', header=0)data = data.dropna()print(data.shape)print(list(data.columns))

按照以下步骤在Anaconda Navigator中使用"Jupyter Notebook"实现上述代码 :

步骤1 : 使用Anaconda Navigator启动Jupyter笔记本.

Jupyter Notebook First

Jupyter Notebook Second

第2步&减号;上传csv文件以系统方式获得回归模型的输出.

Jupyter Notebook Third

第3步 : 创建一个新文件并执行上面提到的代码行以获得所需的输出.

Jupyter Notebook Fourth

Jupyter Notebook Fifth