大家好,我是阿粥
我看过很多分析师的简历。
这么多年过去了,简历项目经历里,仍然有不少提到用SQL或者Python进行RFM建模。
项目细节描述各有千秋,但核心逻辑大体绕不开“基于Python对用户数据进行RFM建模,分成x类人群以支撑精细化运营,最终提升xx指标xx%”。
一、有什么问题?
模型本身没任何问题,有问题的是人。
如果没有深刻理解RFM模型从哪里来,到哪里去,只是生硬的套个分析模版。
那不是建立模型,而是把一堆杂乱的数据处理成了另一堆没用的数据。
只能证明Excel、SQL、Python的熟练度。
二、回顾一下RFM模型
我相信大多数分析师都很熟悉,但为了照顾所有读者,这里花30秒重温一下。
RFM模型是一种非常经典的用户分群、价值分析模型。
它有着极强的适用性,被广泛应用于以电商为代表的各行业。
同时,这个模型以直白著称,R、F、M这三个字母就代表了它的三个核心指标。
1. R(Rencency,最近一次购买间隔):每个用户有多少天没有回购了,可以理解为用户最近一次购买到现在隔了多少天。
2. F(Frequency,消费频率):每个用户购买了多少次。
3. M(Monetary,消费金额):有人用每个用户累计购买金额,也有人用每个用户平均每次购买金额。
这三个维度是RFM模型的精髓所在,帮助我们把混杂一体的用户数据分成标准的8类,然后根据每一类用户人数占比、金额贡献等不同的特征,进行人、货、场三重匹配的精细化运营支撑。
三、RFM为何经久不衰?
RFM的传播和应用之所以能如此之广,离不开它的可解释性和易上手性。
其可解释性之强,足以让任何不懂数据的业务人员在3分钟内理解并初步认可模型的基本逻辑。
开始念叨“不错,高价值活跃用户应该重点维护,流失用户要立即挽回”。
其易上手性,在于只需3个字段(用户ID、下单时间和下单金额),用任何工具(Excel、SQL、Python等)都能实现。
当然,用Python实现和复用更加高效。对于新手来说,从零实现,更是一次模型的启蒙之旅。
看着数据从表格变成模型结果,颇有一种“模型在手,天下我有”的飘然感。
四、RFM的潜在风险
业务好理解,模型易实现,梦幻般地一拍即合,天造地设。
但实际,稍不留神,便一拍两散。
看到简历上写RFM的朋友,面试时我会“特别关照”一些相关问题,水分多少,一问便知:
1. 为什么模型中的R值用30天或者60天的间隔来区分?对应的业务合理性在哪里?
2. 用平均金额还是累计金额作为M更好?
3. 分类之后RFM具体是如何应用的?和不分类效果对比如何?又应当怎样去优化呢?
问题看似简单,其实也不难,但面试中回答令我满意的寥寥无几。
市面上关于RFM模型应用技巧类的资料很多,但鲜见对于模型的深层思考。
上面几个问题,只是我提过的众多问题中的三个。
在这里提出来,只是希望抛砖引玉,引发大家对于模型的更多思考。
如果大家对答案感兴趣,可以点赞转发留言催更,催更多的话我下周内来交作业!
业务分析师切勿过于沉浸于模型构建本身,而忽略了模型背后所隐藏的重要业务信息。毕竟,从长期来看,后者无疑是更重要的。
最后,以上部分内容我在《Python电商数据分析实战:从电商实际案例出发洞悉数据分析全流程》的第11章『用户分群实战与加强版RFM模型』的理论部分也系统的讲解过。
本书的章节目录,按照从后往前顺序,感兴趣的朋友可滑动查看,全书贯彻了理论+实战的主线:
<<< 点击大图后,右滑查看更多 >>>
附上我专属的粉丝限时5折购书渠道,感兴趣的同学可以直接入手: