数据科学家的角色通常与预测建模,开发分段算法,推荐系统,A/B测试框架以及经常使用原始非结构化数据等任务相关联.
他们的工作性质要求对数学,应用统计和编程有深刻的理解.数据分析师和数据科学家之间存在一些共同的技能,例如,查询数据库的能力.两者都分析数据,但数据科学家的决定可以对组织产生更大的影响.
这是数据科学家通常需要的一组技能;
在统计软件包中编程,例如:R,Python,SAS,SPSS或Julia
能够清理,提取和探索来自不同来源的数据
统计模型的研究,设计和实施
深度统计,数学和计算机科学知识
在大数据分析中,人们通常会混淆数据科学家的角色与数据架构师的角色.实际上,差异很简单.数据架构师定义数据将存储在其中的工具和架构,而数据科学家则使用此架构.当然,如果需要特殊项目,数据科学家应该能够设置新工具,但基础设施定义和设计不应该成为他任务的一部分.