本文参考了数据万花筒的文章,结合我自己工作经验。希望给大家一些帮助。
指标异常排查,是数据分析师的工作重点之一,是各行各业数据分析师都绕不开的话题。
本文试图回答:
1、指标波动的影响因素有哪些?
2、如何快速定位异常来源?
一、指标波动的影响因素
(一)数据错误
数据错误,可能造成指标伪异常。
1、指标数据是手动统计,因为粗心造成错误。
统计正确,是数据分析师的基本素养。
2、指标数据是系统报表自动生成的,在传输过程产生错误。
- 由于监控报表的数据不是底层数据库数据,故数据传输出错会导致指标伪异常。
- 造成数据错误的因素有两个:数据调度问题和数据入库问题。
- 可通过统计底层数据的方式来校验数据,从而发现数据问题。
- 可根据数据传输流程回溯每个关键节点,从而发现数据问题所在环节。
比如,我在工作当中多次遇到,由于研发脚本bug导致数据错误,出现指标伪异常。
(二)预期内的波动
1、指标周期性波动
数据分析师要充分认识指标的周期性波动。因周期性带来的指标波动是正常波动。
当然,违反周期性的波动,往往暴露行动不足的问题,应引起关注。
比如,根据投放逻辑,在一个周期内,投放成功率的趋势是前高后低的。那么,在投放后期,投放成功率低是正常现象。但在投放前期,投放成功率低是不正常的,需要异常排查。
2、内部已发生的动作
以下两种情况会导致指标波动,在预期内的波动则属于正常现象。数据分析师要警惕得出正确的废话。
第一,业务活动常常带来指标波动,如促销活动。数据分析师要多八卦,了解业务动作,帮助理解数据,判断指标波动是否正常。
当然,如果促销不如预期,那么就要分析为什么?这属于促销效果评估问题。
第二,研发上线新策略引起指标波动,如改变冷启动的参数。数据分析师要与研发保持及时沟通,对任何可控变量的改变,要提前推演对监控指标的影响。
(三)不可预期的波动
1、外部因素
政策、竞争对手等外部因素,也会影响指标波动。
对于这些不可控的外部因素的影响,特别是负面的影响,数据分析师可以评估其影响范围和影响周期,反馈给业务方以帮助其决策。
2、内部行动不足
当排除指标波动的一切正常因素后,如果指标波动出现了异常,需要诊断数据波动的真正原因。往往是行动不足导致的。
指标异常排查的真正价值,在于发现问题,提供可行性建议,从而可通过改变行动达到优化指标表现。
二、如何快速定位异常来源
1、逻辑树
利用逻辑树的拆解方法能够快速地确定数据异动的原因,可以辅助决策或改变行动,如帮助业务优化方案,或帮助研发迭代产品。
2、指标体系闭环
快速定位问题,离不开指标体系。数据分析师,要有闭环思维,不断更新指标体系,提高工作质量与效率。
感谢原作者的思考总结:原文传送门