目录标题
- 数据分析
- 企业数据的分析的三个方向:
- 离线分析(Batch Processing)
- 实时分析(Real Time Processing |Streaming):
- 机器学习(Machine Learning)
- 数据分析的流程
- 明确分析的目的和思路
- 目的
- 思路
- 数据分析方法
- PEST
- 5W2H
- 数据收集
- 数据的预处理
- 数据分析
- 数据展现
- 报告的撰写
- 总结
数据分析
企业数据的分析的三个方向:
现状分析(实时数据的分析)
原因分析(历史数据的分析)
预测分析(结合数据预测未来)
每个数据分析的发展方向对应着以下数据分析的分析技术:
离线分析(Batch Processing)
面向过去,面向历史,分析已经存在的数据;
在时间维度明显成批次性变化,所以也叫做批处理
实时分析(Real Time Processing |Streaming):
面向当下,分析实时产生的数据;
所谓的实时是指从数据产生到数据芬妮下到数据应用的时间间隔非常的短,可以细分到秒级和毫秒级别,实时分析也就是流式处理
机器学习(Machine Learning)
基于历史数据和当下产生的实时数据预测未来发生的事情
侧重于数学算法的运用,如分类,聚合,关联,预测。
数据分析的流程
明确分析的目的和思路
目的
目的是整个分析流程的起点,为数据的收集,处理及分析提供清晰的指引方向;
思路
思路是使分析框架体系化,使各个分析点之间具有逻辑性关系,保证分析维度的完整性,分析结果的有效性以及正确性,需要数据分析方法论进行支撑;
数据分析方法
数据分析的方法有:PEST分析方法,5W2H分析方法
PEST
PEST分析方法:EST分析是指宏观环境的分析,P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology)。在分析一个企业所处的外部环境的时候,通常是通过这四个因素来分析企业集团所面临的状况
5W2H
5W也就是w开头的5个字母组成的分别是:
(1)WHAT——是什么?目的是什么?做什么工作?
(2)WHY——为什么要做?可不可以不做?有没有替代方案?
(3)WHO——谁?由谁来做?
(4)WHEN——何时?什么时间做?什么时机最适宜?
(5)WHERE——何处?在哪里做?
2H也是一样分别是:
(1)HOW ——怎么做?如何提高效率?如何实施?方法是什么?
(2)HOW MUCH——多少?做到什么程度?数量如何?质量水平如何?费用产出如何?
数据收集
数据从无到有
数据传输搬运
数据分类:
业务数据、日志数据、爬虫数据、互联网公开的数据
数据的预处理
数据预处理需要对收集到的数据进行加工整理,形成适合数据分析的样式2,主要包括数据清洗、数据转化、数据提取、数据计算;
数据的预处理可以保证数据的一致性和有效性,让数据变成一个干净整洁的结构化数据
数据分析
利用适当的数据分析工具,提取有用的信息,形成有效的结论,需要掌握各种数据分析的方法,还要熟悉分析软件的操作
数据展现
数据展现也就是数据的可视化,指的是分析结果使用图表展示,因为人类是视觉动物,图表的形式更容易被人类记住;
数据可视化属于数据应用的一种
数据分析的结果不仅仅是可视化的展示,话可以进行数据的挖掘,即席查询等等
报告的撰写
要写明对整个数据分析过程的一个总结和呈现
把数据分析的原因、过程和结果以及建议完整的呈现出来
要有明确的结论,最后是建议以及解决方案
总结
1、一切围绕于数据,一切结果源于数据
2、核心步骤:采集、处理、分析、应用
文章内容来自网络,侵权联系删除