敏捷数据科学 - 预测的作用

敏捷数据科学预测的作用 - 从简单和简单的步骤学习敏捷数据科学，从基本到高级概念，包括简介，方法概念，数据科学过程，敏捷工具和安装，敏捷数据处理，SQL与NoSQL，NoSQL和数据流编程，收集和显示，数据可视化，数据丰富，使用报告，预测的作用，使用PySpark提取功能，构建回归模型，部署预测系统，SparkML，修复预测问题，提高预测性能，创建更好的场景敏捷和数据科学，敏捷实施。

在本章中，我们将了解预测在敏捷数据科学中的作用.交互式报告揭示了数据的不同方面.预测形成敏捷冲刺的第四层.

第四层

在进行预测时，我们总是参考过去的数据并将其用作未来迭代的推论.在这个完整的过程中，我们将数据从批处理历史数据转换为有关未来的实时数据.

预测的作用包括以下 :

预测有助于预测.一些预测基于统计推断.一些预测是基于权威人士的意见.
统计推断涉及各种预测.
有时预测是准确的，有时候预测是不准确的.

Predictive Analytics

预测分析包括预测建模，机器学习和数据挖掘等各种统计技术，分析当前和历史事实，对未来和未知事件进行预测.

预测分析需要培训数据.训练有素的数据包括独立和相关的功能.依赖特征是用户试图预测的值.独立特征是描述我们想要根据依赖特征预测的事物的特征.

特征研究称为特征工程;这对于做出预测至关重要.数据可视化和探索性数据分析是特征工程的一部分;这些构成了敏捷数据科学的核心.

Feature Engineering

进行预测

有两种方法可以在敏捷数据科学中进行预测和减去;

回归
分类

完全建立回归或分类取决于业务需求及其分析.连续变量的预测导致回归模型和分类变量的预测导致分类模型.

回归

回归考虑包含特征的示例，从而，产生数字输出.

分类

分类接受输入并产生分类分类.

注意 : 定义统计预测输入并使机器学习的示例数据集称为"训练数据".