开发手册 欢迎您!
软件开发者资料库

建立回归模型

敏捷数据科学构建回归模型 - 从简单和简单的步骤学习敏捷数据科学,从基本到高级概念,包括简介,方法概念,数据科学过程,敏捷工具和安装,敏捷中的数据处理,SQL与NoSQL,NoSQL和数据流编程,收集和显示,数据可视化,数据丰富,使用报告,预测的作用,使用PySpark提取功能,构建回归模型,部署预测系统,SparkML,修复预测问题,提高预测性能,创建更好的场景敏捷和数据科学,敏捷实施。

Logistic回归是指机器学习算法,用于预测分类因变量的概率.在逻辑回归中,因变量是二元变量,由编码为1的数据组成(布尔值为真和假).

在本章中,我们将重点关注开发回归模型在Python中使用连续变量.线性回归模型的示例将侧重于从CSV文件中进行数据探索.

分类目标是预测客户是否会订阅(1/0)定期存款.

import pandas as pdimport numpy as npfrom sklearn import preprocessingimport matplotlib.pyplot as pltplt.rc("font", size=14)from sklearn.linear_model import LogisticRegressionfrom sklearn.cross_validation import train_test_splitimport seaborn as snssns.set(style="white")sns.set(style="whitegrid", color_codes=True)data = pd.read_csv('bank.csv', header=0)data = data.dropna()print(data.shape)print(list(data.columns))

按照以下步骤在Anaconda Navigator中使用"Jupyter Notebook"实现上述代码 :

步骤1 : 使用Anaconda Navigator启动Jupyter笔记本.

Jupyter Notebook First


Jupyter Notebook Second

第2步&减号;上传csv文件以系统方式获得回归模型的输出.

Jupyter Notebook Third

第3步 : 创建一个新文件并执行上面提到的代码行以获得所需的输出.

Jupyter Notebook Fourth


Jupyter Notebook Fifth