开发手册 欢迎您!
软件开发者资料库

敏捷工具和安装

敏捷数据科学敏捷工具和安装 - 从简单和简单的步骤开始学习敏捷数据科学,包括简介,方法概念,数据科学流程,敏捷工具和安装,敏捷数据处理,SQL与NoSQL,NoSQL和数据流编程,收集和显示,数据可视化,数据丰富,使用报告,预测的作用,使用PySpark提取功能,构建回归模型,部署预测系统,SparkML,修复预测问题,提高预测性能,创建更好的场景敏捷和数据科学,敏捷实施。

在本章中,我们将了解不同的Agile工具及其安装.敏捷方法的开发堆栈包括以下一组组件 :

事件

事件是发生或与其一起记录的事件功能和时间戳.

事件可以有多种形式,如服务器,传感器,金融交易或操作,我们的用户可以在我们的应用程序中使用.在这个完整的教程中,我们将使用JSON文件来促进不同工具和语言之间的数据交换.

收集器

收集器是事件聚合器.他们以系统的方式收集事件,以存储和汇总庞大的数据,排队等待实时工作人员采取行动.

分布式文件

这些文件包括多节点(多个节点)以特定格式存储文档.我们将在本教程中关注MongoDB.

Web应用程序服务器

Web应用程序服务器通过可视化将数据作为JSON通过可视化实现,并且开销最小.这意味着Web应用程序服务器有助于测试和部署使用敏捷方法创建的项目.

现代浏览器

它使现代浏览器或应用程序能够呈现数据作为我们用户的交互式工具.

本地环境设置

为了管理数据集,我们将专注于包含工具的python的Anaconda框架用于管理excel,csv和更多文件.安装Anaconda框架的仪表板如下所示.它也被称为"Anaconda Navigator" :

管理数据集

导航器包括"Jupyter框架",这是一个有助于管理数据集的笔记本系统.启动框架后,它将在浏览器中托管,如下所述 :

jupyter framework