部署预测系统

灵活的数据科学部署预测系统 - 了解灵活的数据科学开始从基本与实例先进的概念，包括简介，方法论概念，数据科学流程，敏捷工具和安装，数据处理敏捷，SQL与NoSQL的，NoSQL的简单，简单的步骤和数据流编程，收集和显示，数据可视化，数据丰富，使用报告，预测的作用，使用PySpark提取功能，构建回归模型，部署预测系统，SparkML，修复预测问题，提高预测性能，创建更好的场景敏捷和数据科学，敏捷实施。

在这个例子中，我们将学习如何创建和部署预测模型，这有助于使用python脚本预测房价.用于部署预测系统的重要框架包括Anaconda和"Jupyter Notebook".

按照以下步骤部署预测系统 :

第1步 : 实现以下代码以将csv文件中的值转换为关联值.

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport mpl_toolkits%matplotlib inlinedata = pd.read_csv("kc_house_data.csv")data.head()

上面的代码生成以下输出 :

以上代码生成

第2步 : 执行describe函数以获取csv文件属性中包含的数据类型.

data.describe()

描述功能

步骤3 : 我们可以根据我们创建的预测模型的部署删除相关值.

train1 = data.drop(['id', 'price'],axis=1)train1.head()