某电商平台用户行为分析与挖掘
背景:电商是当今用户最大的交易市场之一,电商行业也逐渐成熟, 所有市场中可售卖的商品全都在平台中存在,并且在网络和疫情的影 响下,在线上的消费行为满足全年龄段用户。 用户的交易行为推动 了电商的发展。对于电商平台来说,通过用户的交易行为、交易金额、 交易频率、交易时间等信息,分析用户的行为,可促进二次营销,精 准营销,促活等。请根据提供的数据进行数据的分析与建模工作。
一、数据说明:
字段 注释
订单 ID 订单的唯一标识
商家 ID 商家的唯一标识
用户 ID 用户的唯一标识
付款日期 22 年 1 月-22 年 6 月
使用状态 1:已使用该商家优惠券;0:领取 未使用;None:未领取
实付金额 实际支付的金额,单位元
邮费 邮寄费用
省份 用户所在省份城市 用户所在城市
数量 购买商品数量
二、任务及思路:
首先看整个题目和问题,最终目的是通过用户的交易行为、交易金额、 交易频率、交易时间等信息,分析用户的行为,可促进二次营销,精准营销,促活;题目中要求建模来定位给那些用户发放优惠券,而发优惠券正是促销手段的一种。
1.对电商平台用户的消费行为进行统计分析并可视化。(15 分)
这一问就是描述性统计分析和可视化,当然题目要求是很明确的,所以围绕这个要求展开统计分析用户的消费行为数据就可以。
注意到有订单时间,所以可以统计所有订单下、近(1/3/5/10)年/月/日维度下的数据:
用户维度下,统计各用户的消费金额总额、每笔订单平均金额的分布情况,用户地址分布情况、各地址下的消费金额、消费数量分布情况;订单维度下,每笔订单的购买数量分布、实付金额分布、邮费分布(包邮比例)、优惠券使用率等等;商品维度下,各类商品购买数量的分布情况、各类商品单价(金额/数量)的分布情况;商家维度下,各商家商品总销售量、销售金额的分布情况;优惠券,优惠券使用状态分布、使用率,不同商家、不同商品下优惠券的使用率;
另外,在统计分布过程中、如果遇到异常值(极大、极小、或者分布不符合逻辑的情况),需要单独查看是否数据正确;比如注意到数据中实付金额有负数的情况、应该是优惠券额度较大、实付金额应该为0,这部分异常数据也需要单独统计。
可视化的部分尽量让他好看些,可以用专门的可视化工具作图(好看、优势更大),推荐一个:
pyecharts动态交互图表
2. 有这么一句话在业界广泛流传:“数据和特征决定了机器学习的 上限,而模型和算法只是逼近这个上限而已”。特征工程是指利用领域知识从原始数据中提取有效特征,从而达到提高机器学习过程的结 果的质量的目的。请根据用户的交易行为数据构造用户、商户和优惠券等有效特征。(20 分)
特征挖掘部分需要围绕最终目的展开,这里最终需要建模定位给哪些用户发优惠券,所以这一问就要先确定好这个赛题的最终建模思路 ......
......
三、免费获取完整思路
关注威信公众号 Python风控模型与数据分析,回复 23年数据分析大赛A题思路 免费获取完整思路;编写不易,辛苦多多关注