数据分析是一个检查,清理,转换和建模数据的过程,目的是发现有用的信息,提出结论并支持决策
.
数据分析的类型
存在多种数据分析技术,包括商业,科学,社会科学等各种领域,具有多种名称.主要数据分析方法是 :
数据挖掘
商业智能
统计分析
Predictive Analytics
文本分析
数据挖掘
数据挖掘是对大量数据的分析,用于提取以前未知,有趣的数据模式,异常数据和依赖关系.请注意,目标是从大量数据中提取模式和知识,而不是从数据本身中提取数据.
数据挖掘分析涉及人工智能交叉点的计算机科学方法,机器学习,统计和数据库系统.
从数据挖掘中获得的模式可以被视为输入数据的摘要,可用于进一步分析或获得更准确的预测结果通过决策支持系统.
商业智能
商业智能技术和工具用于获取和转换大量非结构化业务数据,以帮助识别,开发和创造新的战略商机.
商业智能的目标是允许轻松解释大量数据以识别新机会.它有助于实施基于洞察力的有效战略,为企业提供具有竞争力的市场优势和长期稳定性.
统计分析
统计学是对数据的收集,分析,解释,表达和组织的研究.
在数据分析中,使用了两种主要的统计方法 :
描述性统计 : 在描述性统计中,来自整个人口或样本的数据用数字描述符汇总,例如 :
平均值,标准连续数据的偏差
频率,分类数据的百分比
推理统计 : 它使用样本数据中的模式来绘制关于所代表的人口的推论或考虑随机性.这些推论可以是 :
回答是/否有关数据的问题(假设检验)
估算数据的数值特征(估算)
描述数据中的关联(相关)
建模数据中的关系(例如回归分析)
预测分析
Predictive Analytics使用统计模型分析当前和历史数据,以预测(预测)未来或未知事件.在商业中,预测分析用于识别有助于决策的风险和机会.
文本分析
文本分析,也称为文本挖掘或文本数据挖掘是从文本中获取高质量信息的过程.文本挖掘通常涉及构造输入文本的过程,使用统计模式学习等方法在结构化数据中导出模式,最后评估和解释输出.
数据分析过程
数据分析由统计学家约翰·图基于1961年定义为"分析数据的程序,解释此类程序结果的技术,规划数据收集的方法,使分析更容易,更精确或更准确,以及适用于分析数据的(数学)统计的所有机器和结果."
因此,数据分析是从各种获取大型非结构化数据的过程来源并将其转换为对 : 有用的信息;
回答问题
测试假设
决策
反驳理论
使用Excel进行数据分析
Microsoft Excel提供了多种分析和解释数据的方法和方法.数据可以来自各种来源.可以通过多种方式转换和格式化数据.它可以使用相关的Excel命令,函数和工具进行分析 - 包括条件格式,范围,表格,文本函数,日期函数,时间函数,财务函数,小计,快速分析,公式审计,查询工具,假设分析,解算器,数据模型,PowerPivot,PowerView,PowerMap等
您将使用Excel学习这些数据分析技术,作为两部分的一部分 : 去;