淘宝婴儿用品购买情况分析报告

news2024/11/27 2:38:35

一.分析背景和目的

随着购物网站的发展,人们的网络购物行为占比也快速增加。为了能够获取更多的用户,提升商家的销售量,需要从产品和用户不同的角度进行分析,进而得到有价值的信息,指导商家进行获客和营销。本文就以淘宝天猫上婴儿用品购买数据为例,通过对产品和用户进行分析,得出结论并提出可实施的建议

数据集内容为淘宝天猫上用户2012年7月至2015年2月购买婴儿用品的购买记录

数据包含两个表,每个表的列名及含义如下:

二.分析思路

(一)根据数据集里包含的数据,提出以下问题进行分析:

1.产品角度

1)成交总数量的波动情况如何

  • 单次购买量波动情况
  • 购买次数波动情况

2)热销产品,销量最少的产品是哪些

2.用户角度

1)男女婴儿对不同商品类别的需求有无差异

2)不同年龄婴儿对不同商品类别的需求有无差异

下面的图展示了具体的分析思路及要用到的分析方法。之后在分析过程中会再详细展示如何用这些分析方法进行分析的

(二)数据清洗

1.将所有数据复制到新的表格里,在新的表格里进行数据清洗

2.

  • 冻结首行,将列标题的英文字段转换成汉字字段
  • 检查是否有重复值:首先对表一用户ID和购买行为编号两列进行重复值突出显示,筛选出用户ID重复项,在此基础上筛选购买行为编号重复项,发现购买行为编号无重复值,故表1无重复值,无需删除。对表二用户ID列进行重复值突出显示,发现没有重复值,无需删除
  • 隐藏不需要分析的列:隐藏掉购买行为编号,商品属性两列

3.查找缺失值

通过对各未隐藏列单元格计数,发现每列单元格数目相同,无缺失值,不做处理

4.一致化处理

  • 通过数据分列功能将购买时间和生日日期戳转换为ymd日期格式
  • 性别列,将1,2表达方式换为男女,通过IF函数实现,返回结果错误的,将其删掉

5.将两个表内容合在一起,通过vlookup函数实现。通过整合两个表发现,表一中的用户只有少部分有登记婴儿性别和出生日期。所以之后在分析问题时,如果有涉及到婴儿信息字段的,将只对登记了婴儿信息的用户购买行为进行分析

算出购买行为发生时婴儿的年龄(考虑到婴儿年龄跨度较小,并且考虑到不同年龄对商品需求差异可能会较大,故将婴儿的年龄及月份都计算列示出来,以便于后面的分析)

先通过dateif(出生时间,购买时间,“M”)计算购买时的月份,发现有的结果显示为负值,说明用户在婴儿未出生时就开始购买商品。之后将年龄用int和mod函数进行处理,得出岁数和未满一年的月份

6.处理异常值

  • 以月龄为单位,计算的四分位数结果如下

可以看出极端异常值为120,表中超过120的有4条信息:129/130/141/339,将其作为异常值删掉

  • 对所有商品的单次购买数量求四分位数,得出结果如下:

可以看出单次购买数量的最小值,四分位数都是1,最大值是10000,如果根据极端异常值来判断异常值,则单次购买数量大于1的都将作为异常值被删掉,这又显然不符合实际情况,因为确实存在用户单次购买数量大于1的情况

三.分析内容

(一)产品角度

1.成交总量

图1:所有商品总销售量随时间变化情况

图2:所有商品每年销售量按月分布情况

从上面两个图可以看出,每月的销售量同比都在增加,说明平台的销售量每年都在增长的。每年中的11月份销量达到最大,每年的5月也是一个高峰期。每年的2月销量是一年中最低的(因为2015年2月份只有1~5号的数据,所以2015年2月的销量很低)

接下来分析11月和5月销量增大以及2月份销量下滑的原因

先使用多维度拆解分析方法,对总销售量这个指标进行拆解,按照指标构成进行拆解。总销售量=\sum用户单次购买量,这里面其实有两个变量,用户单次购买数量和购买次数

再用假设检验分析方法,来逐个验证是哪个指标影响了总销售量

先假设是用户单次购买数量造成了销售量的波动,即用户在11月和5月单次购买数量增长很多。在2月单次购买数量下降很多,求出每个月用户单次购买数量的平均值,得出:
图3:用户每月单次平均购买量

可以看出婴儿的平均购买量为2.54,整体看来波动并不是很大,所以总销售量的波动原因不是用户的单次购买数量波动造成的

接下来假设总销量的变动是购买次数引起的,将所有用户购买次数按月分布,得到:

图4:用户购买次数按月分布情况

可以看出,购买次数在11月有较大增长,2月达到每年的最低,购买次数与总销售量的波动是一致的,可以判断出销售量的波动是由购买次数的波动造成的。所以在分析销量波动原因的时候可以分析购买次数的波动原因

下面分析11月份购买次数增加的原因

将2012~2014每年11月份的购买次数用折线图绘制出来,得到:

图5:用户2012~2014年11月份购买次数

可以看出,每年的11月11日的购买次数激增,当天的购买次数都远超当年日平均购买次数,并且每年的增长幅度逐渐增大。这是因为淘宝天猫在做双十一促销活动,所以这一天的购买次数特别高,并且随着双十一购物节深入人心以及经济的增长,每年的购买力度涨幅也逐年增大

同样将2013~2014年5月份每天的购买次数展示出来,得到下图:

图6:2013~2014年5月份每天购买次数分布情况

 

 可以看出,2013和2014年5月的购买次数基本都在每年日平均购买次数上面,这说明5月份的购买次数之和将在全年购买次数分布中是一个小高峰

两条5月的购买次数每天的走势基本是一致的,三次增长的时间和原因如下:

下面分析每年2月份购买次数下降的原因

将2013~2015年每年的1~2月份每天的购买次数展示出来,得到

图7:2013~2015每年1~2月份每天的购买次数分布情况

可以看出,2013和2014年1~2月的购买次数基本都在全年日平均购买次数下面,这两个月的购买次数总和在全年分布中将是一个谷底

再看购买次数最低的时间和原因

2015年春节是在2月19日,原数据中只有到2月5日的数据,可以看出2015年的购买次数还未出现较大下滑。如果数据完整,可以合理预计2月19日的购买次数也是最低点

对购买次数指标再进行拆解,购买次数中包含了新用户购买次数和老用户购买次数,那么购买次数的变化主要是新用户带来的,还是老用户带来的

因为数据有限,我们假设在已有的购买记录中,第一次出现的用户ID都为新用户,第二次及之后出现的用户为老用户,将新老用户购买次数按月展示出来,得到:

图8:新老用户购买次数按月分布情况

可以看出,老用户购买次数极少。因为活跃用户数=新用户购买人数+老用户购买人数(极少),所以活跃用户数约等于新用户购买人数了。老用户购买次数极少也就说明了复购用户数极少,这个要结合更多的信息去判断原因,比如是不是这几种商品类别都是耐用品,不需要多次购买。如果是易耗品的话,复购用户这么少,就需要商家提高产品粘性

总成交量的变化不是由用户单次购买量引起的,因为用户平均单次购买量比较平稳。那么对于不同的商品类别,用户单次购买量是否同样比较平稳呢?将每种商品类别的季度婴儿平均购买量展示出来,得到:

图9:每种商品类别婴儿平均购买量(按季度)

 具体到某一类别的商品,季度平均购买量有着不同的增减趋势

下图能比较清晰地展示以上分析过程

2.热销产品,销量最少的产品

图10:各商品类别销售量

可以看出,商品类别28的销量最多,此商品类别可能是易耗品,也可能是婴儿必需品,商品类别122650008销量最少,此类别商品可能是耐用品,也可能是非必需品,需要结合更多信息进行分析。另外也需要看销量最低的商品是否有质量问题,或者产品不符合用户需求,据此进行改善

(二)用户角度

1.男女婴儿购买商品差异情况

图11:男女婴儿购买商品总数量情况

图12:男女婴儿不同商品类别购买数量分布情况

从上面两个图可以看出,女婴儿对商品的总购买量是大于男婴儿的,整体比男婴儿购买量多出66%。在商品类别喜好上,女婴儿购买50008168和50014815最多,男婴儿购买28和50008168最多。其中50014815类别的商品女婴儿的需求量远大于男婴儿,这个商品类别可能是以女婴儿为目标用户

2.不同年龄段婴儿购买商品差异情况

图13:不同年龄段婴儿商品购买数量差异

可以看出,0~3岁婴儿购买数量最多,-1~5岁,每个年龄婴儿对不同类别商品的购买量展示出来,得到:

图14:-1~5岁各年龄婴儿对不同商品类别的购买量分布情况

可以看出,这几种商品类别,基本都是在0~1岁婴儿中销售量最多。0岁婴儿购买50014815商品类别最多。

四.结论与建议

从以上的分析中,可以得出以下结论及建议:

1.总成交量的变化是由新用户的购买次数变化引起的,购买次数的变化对大型节日比较敏感,而对周末的休息日不敏感。复购用户极少,如果是耐用品,复购用户数少是可以理解的。如果是易耗品,商家应寻找原因并改进

2.商品类别38的平均需求量呈上升趋势,商家应根据新用户数和平均需求量的增长情况预计未来的总需求量,以备足库存。商品类别50014815的平均需求量在下降,商家应分析下降原因进行改善或停售

3.热销商品类别是28,商家应继续保持宣传促销。销量最低的商品类别是122650008,商家应分析原因进行改善或停售

4.女婴儿的商品需求量整体要比男婴儿多出66%,并且男女在各个商品类别上的需求也有差异。商家应根据商品类别男女婴儿需求差异,进行差别化的营销策略

5.0~3岁婴儿的商品购买量最多,不同商品类别在不同年龄段的销售量也不一样,商家应采取适龄儿童营销策略

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1177514.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

行情分析——加密货币市场大盘走势(11.6)

大饼昨日下跌过后开始有回调的迹象,现在还是在做指标修复,大饼的策略保持逢低做多。稳健的依然是不碰,目前涨不上去,跌不下来。 以太周五给的策略,入场的已经止盈了,现在已经达到1884,已经全部吃…

Qwt 使用QwtCompass绘制指南针

1.概述 QwtCompass是Qwt库中的一个类,用于绘制一个指南针样式的仪表盘。它是基于QwtDial类的衍生类,提供了一些额外的功能和样式,用于显示方向和角度。 以下是类继承关系: ​ 2.常用方法 void setScaleArc (double minArc, dou…

6张图让你了解openRA 下载及编译

下面的3张图是免费赠送的用vs解决方案编译的方法

C语言每日一题(24)回文素数题解

BC158 [NOIP1999]回文数 题目描述 若一个数(首位不为零)从左向右读与从右向左读都一样,我们就将其称之为回文数。 例如:给定一个10进制数56,将56加65(即把56从右向左读),得到121是…

MoeCTF 2023 Reverse题解

Reverse入门指北 搜索main函数跟进 双击跟进aMoectfF1rstSt3 得到flag base_64 python反编译 - Online Tools 使用在线软件反编译 就是一个变换编码表的base64加密 直接用现有的工具解密 UPX! 查壳,加了UPX壳,直接用官网工具脱壳 打开字符串窗口&am…

网络安全(黑客)-0基础小白自学

1.网络安全是什么 网络安全可以基于攻击和防御视角来分类,我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 2.网络安全市场 一、是市场需求量高; 二、则是发展相对成熟…

智能安全帽功能-EIS智能防抖摄像头4G定位视频语音气体检测

智能安全帽是一种集成多种智能功能的产品,例如实时定位、语音对讲、健康监测和AI智能预警等。这些丰富的功能能够更好地帮助工人开展工作,并提升安全保障水平。智能安全帽在各个行业中的应用越来越广泛。尤其在工程建设领域,项目管理和工作安…

数据库系统原理与实践 笔记 #7

文章目录 数据库系统原理与实践 笔记 #7数据库设计和E-R模型(续)转换为关系模式具有简单属性的实体集的表示复合属性多值属性联系集的表示模式的冗余—合并 实体-联系设计问题设计问题联系属性的布局 扩展的E-R特性特化概化属性继承特化/概化的设计约束聚集E-R图表示方法总结E-…

掌握文件批量改名的技巧:实现跨文件夹文件统一命名及编号的实用方法“

在日常工作中,我们经常需要处理大量的文件,而这些文件的名字可能各不相同,给我们的管理工作带来了很大的不便。为了解决这个问题,今天我们为您推荐一款全新的文件批量改名工具,它可以帮助您在不同文件夹里的文件进行统…

Tomcat,jdk下载配置(发布项目)

Tomcat,jdk下载, 远程连接 启动以下服务 高级设置 允许别人连接进来 网上搜索jdk下载即可 双击下一步即可 下一步 输入java,看有没有安装成功 这是安装成功的 Tomcat就可以安装了 和以上操作一样,在网上下载安装包,…

【重磅好消息!】跨境电商源码来啦!支持多语言,扩展无压力,你想要的这里都有!

想要扩展多个语言?没问题!我们的跨境电商源码支持全球多种语言,让您轻松覆盖不同地区的消费者。无论您的客户是英语、法语、西班牙语还是日语,我们都能满足需求,让您的跨境电商业务无语言障碍! 想设置折扣产品?轻松实现!我们的源码为您提供…

springboot邮件分发

最近在项目中用到一个定时通知功能,通知就联想到一个邮件通知的方式,此外通过邮件我们还可以进行用户通过邮件注册、通过邮件找回密码等功能,这篇博客就简单介绍以下邮件的发送功能。 在Java中,我们可以使用JavaMail API向任何电子…

Go invalid memory address or nil pointer dereference错误 空指针问题

Go 指针声明后赋值,出现 panic: runtime error: invalid memory address or nil pointer dereference,这种是内存地址错误。 首先我们要了解指针,指针地址在 Go 中 * 代表取指针地址中存的值,& 代表取一个值的地址对于指针&am…

idea 将分支的代码合并到master

idea 将分支的代码合并到master 1. 首先签出到自己的分支 (自己的分支是自己写的代码,需要合并到master分支去) 2. 然后选中master分支,右键选择 签出并变基到“feature_SC” ,完成之后master分支中就已经是完整的代码了。 当…

Vue、fabricJS 画布实现自由绘制折线

作者GitHub:https://github.com/gitboyzcf 有兴趣可关注 Vue3代码,Vue2相似改吧改吧 前言 Fabric.js Fabric.js(英文官网)是一个强大而简单的 Javascript HTML5画布库(也就是针对canvas进行的封装操作,使…

【面试经典150 | 位运算】二进制求和

文章目录 Tag题目来源题目解读解题思路方法一:模拟 其他语言c 写在最后 Tag 【二进制】【位运算】 题目来源 67. 二进制求和 题目解读 以二进制字符串的形式返回两个二进制字符串的和。 解题思路 看到这个题目首先想到的方法可能是先把二进制字符转化成 int 型数…

wvp-gb28181-pro接入海康摄像头

网络-高级配置-平台接入 sip服务器信息默认参数如下,一键安装wvp完成之后默认就是这样的参数 设置项 设置值 平台接入方式 28181 本地sip端口 5060 传输协议 tcp、udp(外网的话我建议还是用tcp) 启用 勾选 协议版本 GB/T28181-201…

使用Matplotlib绘画3D图时运行不出结果,也不报错,图片是空白 !!

1.问题: 我使用如下代码运用matplotlib中的Axes3D绘画3D图,但是运行出来的结果是空白。 import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D #导入3D包 fig plt.figure() #窗口 #ax Axes3D(fig) # X, Y …

CSC公派遭美德拒签|计算机专业老师终赴意大利都灵理工大学访学

C老师拟申报CSC访学项目,希望先申请美国,并做好了一旦拒签再申请其它国家的心理准备。我们先用普渡大学的邀请函助其申报CSC,并顺利获批,但不出所料地被美国拒签了;很快又申请到德国奥芬堡应用技术大学,但不…

Mysql数据库 8.SQL语言 外键约束

一、外键约束 外键约束——将一个列添加外键约束与另一张表的主键(唯一列)进行关联之后,这个外键约束的列添加的数据必须要在关联的主键字段中存在 案例 创建原则:先创建不含外键的表也就是班级表 添加外键的方式 一般使用第一…