出版时间:2022年
作者曾在互联网大厂做数据分析。从举例可以洞见作者的工作经历。
点评:作者在数据分析领域非常资深,尝试在书中提供一个数据分析工作框架参考。书本内容有点感觉是ppt的集合,辅以案例说明。不过,干货还是很多。
一、数据治理
1、什么是数据治理
数据治理是逐步实现数据价值的过程。具体来说,数据治理是指将零散的用户数据通过采集、传输、储存等一系列标准化流程变成格式规范、结构统一的数据,并构建严格规范的综合数据管控机制;对这些标准化的数据进行进一步加工分析,形成具有指导意义的业务监控报表、业务监控模型,以辅助业务方进行决策。
2、数据治理的流程
3、数据治理的部分岗位职责
- 数据分析师:负责数据的即时查询和指标体系、报表体系的建设以及输出各项业务报告;
- 数据产品经理:负责数据产品原型设计以及推动数据产品的实现和落地;
- 数据挖掘与算法工程师:基于业务问题开发数据模型以辅助业务方进行决策。
二、数据思维
1、数据思维应用场景
如:构建有效的监控体系和客观的评价标准,用合理的分析方法探究原因以及评价效果,综合运用统计学知识对活动效果进行评估。
2、如何培养数据思维
(1) 熟悉业务及常用的数据分析方法,最好建立自己的分析体系
- 对比分析是得出数据结论最简单有效的方法。(单独出一篇说明)
- 分群思维是贯穿数据分析全链路的分析思维。(单独出一篇说明)
- 相关性分析师探索变量关系的方法,但是相关性不代表因果性。需要掌握必要的因果推断方法。(单独出一篇说明)
(2)面对具体问题,多问为什么,树立目标意识,找出需求背后的潜在分析点
切忌沦为业务方的“取数工具人”。要多沟通,挖掘数据需求背后的真实用意,主动提出更多数据分析,切实解决业务问题。
(3)建立标准,通过客观的标准代替主观的判断
数据分析师排查业务问题的步骤:
用假设检验,代替预设立场——>与特定标准进行比较——>排查原因——>定位问题。
(4) 基于分析结果,为业务方提出切实可行的解决方案
数据分析师提出合理建议会经历的三个阶段:给数据,给报告,给观点。给观点比较难,不仅需要熟练的分析技巧、缜密的数据思维,还需要对业务有极深的了解。
数据分析师需要避免的几种提建议的方式:
三、数据埋点
在数据产生过程,数据分析师需要关注三个问题:
第一,用户的哪些行为会被采集到,是在客户端还是在服务器被采集到;
第二,实现用户数据采集的技术有哪些以及它们之间的异同;
第三,采集到的用户数据是如何实现上报的。
数据埋点流程:
埋点设计6步骤:
四、数据标签体系(典型:用户画像)
用户画像是数据标签体系的一种。用户画像,是把用户的多维度标签按照一定规律进行组合,以提高数据分析师的分析效率,更好地辅助运营人员进行决策。
《用户画像》 传送门
1、数据标签体系的作用
用户洞察、个性推荐、渠道优化、营销增强等。
2、数据标签的分类
从计算方式层面分类,可以分为统计类标签、规则类标签、模型类标签(如机器学习类标签)。
数据分析师负责统计类标签、规则类标签的构建和维护;算法工程师负责模型类标签的维护。
按更新时间分类:离线标签、实时标签。
数据标签可以根据不同的业务需求和业务形态进行层级分类,分类原则遵照MECE原则(相互独立、完全穷尽)
3、数据标签体系构建流程
五、数据指标体系
xxx