在本章中,我们将了解理解过程所需的数据科学过程和术语.
"数据科学是数据接口,算法开发和技术的结合,以便解决分析复杂问题".
数据科学是一个跨学科的领域,包括科学方法,过程和系统,其中包括与传统研究相关的机器学习,数学和统计知识.它还包括黑客技能和实质性专业知识的组合.数据科学从数学,统计学,信息科学和计算机科学,数据挖掘和预测分析中汲取原则.
下面提到了构成数据科学团队一部分的不同角色;/p>
客户
客户是使用该产品的人.他们的兴趣决定了项目的成功与否,他们的反馈在数据科学中非常有价值.
业务发展
这个数据科学团队在早期客户中签约,无论是第一手还是通过创建登陆页面和促销活动.业务开发团队提供产品价值.
产品经理
产品经理重视创造最佳产品,这在市场上很有价值.
交互设计师
他们专注于数据模型周围的设计交互,以便用户找到合适的价值.
数据科学家
数据科学家以新的方式探索和转换数据,以创建和发布新功能.这些科学家还结合来自不同来源的数据来创造新的价值.他们在与研究人员,工程师和网络开发人员一起创建可视化方面发挥着重要作用.
研究人员
正如名称所示,研究人员参与研究活动.它们解决了数据科学家无法做到的复杂问题.这些问题涉及机器学习和统计模块的强烈关注和时间.
适应变化
数据科学的所有团队成员都需要适应根据要求进行新的变革和工作.应采用敏捷方法和数据科学进行一些修改,如下所示&减;
选择专家的通才.
小团队对大型团队的偏好.
使用高级工具和平台.
连续和迭代地共享中间工作.
注意
在敏捷数据科学团队中,一个由通才组成的小团队使用可扩展的
的高级工具,并通过迭代细化数据进入越来越高的价值状态.
考虑以下与数据科学团队成员工作相关的例子 :
设计师提供CSS.
Web开发人员构建整个应用程序,了解用户体验和界面设计.
数据科学家应该研究和研究构建Web服务,包括Web应用程序.
研究人员在代码库中工作,该代码库显示解释中间结果的结果.
产品经理尝试识别并理解所有相关领域的缺陷.