通过电商API接口分析电商平台客户消费行为

news2024/11/19 6:22:40

分析目的

通过电商API接口获取的数据分析销售数据来了解在线销售业务的消费情况,分析用户消费数据来分析用户的消费行为,为用户推荐相匹配的商品。

分析问题

店铺销售情况

每月成交额

每月销售金额

每月消费人数

每月订单数量

每月客单价

不同省份用户数量

不同省份订单数量

不同省份成交金额

订单数随星期分布

订单随小时分布

用户消费行为

用户消费次数

用户消费金额

消费次数与消费金额关系

用户购买周期

新用户、活跃用户、不活跃用户、回流用户、回流率

复购率和回流率

消费人群分层情况

按性别分析

按年龄段分析

按喜好品牌分析

03

结论先行

1、销售金额、订单量、消费人数、客单价在清明小长假、五一小长假、暑假、开学季、十一小长假,几个假期节点表现不错,尤其是开学季的情况最好,在几个关键的节点开始前,店铺一定要提前储备库存保证货源

2、北上广销售金额、订单量、消费人数、客单价都优于其他省份,湖南省消费人数少,但是客单价、订单量都表现优异,湖南省潜力巨大,因此要加大对湖南省的宣传力度,增加湖南省的消费人数。

3、75%的消费人群购买力不高,对30岁以下的人群主要推荐亲民价格的商品。

4、40-50岁的人群购买力高,而且男性对高价格的商品购买力强,因此给40-50岁的男性推荐高价格的商品,对女性推荐较高价格的商品。

5、多数用户至少消费了两次,且消费金额与购物次数有较强的正相关,用户消费次数越多销售额越大。可在8天、28天对用户进行召回,引导客户消费。

6、订单集中在早晨,8点到13点是消费高峰期,这段时间要注意维持好网站的稳定性

7、店铺可以在1-4月份减少营业人员5-11月增加营业人员,应对销售高峰期。

接下来给大家介绍一下分析的过程,包括数据嗅探、数据清洗等步骤。

04

数据分析过程

数据嗅探

#导入第三方库import osfrom datetime import datetimeimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline#设置中文编码和负号的正常显示#plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=False#导入数据df=pd.read_csv('./电子产品销售分析.csv')df.head()

输出结果:

图片

df.describe()

输出结果:

图片

数据清洗

#数据清洗和处理#数据类型转化df['event_time'] =pd.to_datetime(df['event_time'].str[:19],format="%Y-%m-%d %H:%M:%S")df['event_time'] = pd.to_datetime(df['event_time'])#计算时间变量df['Month']=df['event_time'].dt.monthdf['Day'] = df['event_time'].dt.daydf['Dayofweek']=df['event_time'].dt.dayofweekdf['hour']=df['event_time'].dt.hourdf.head()

输出结果:

图片

np.sum(df.isnull())

输出结果:

Unnamed: 0 0event_time 0order_id 0product_id 0category_id 0category_code 129370brand 27224price 0user_id 0age 0sex 0local 0Month 0Day 0Dayofweek 0hour 0dtype: int64

有两列中有数据缺失值,类别列缺失129370条,品牌列缺失27224条,这两列数值缺失对店铺销售情况的分析和用户消费行为的分析没主要影响,但是其他数据有重要影响,所以这两列缺失值由missing填充

df.fillna('missing').head()

输出结果:

图片

np.sum(df.isnull())

输出结果:

Unnamed: 0 0event_time 0order_id 0product_id 0category_id 0category_code 129370brand 27224price 0user_id 0age 0sex 0local 0Month 0Day 0Dayofweek 0hour 0dtype: int64

df['category_code'].fillna('missing',inplace=True)df['brand'].fillna('missing',inplace=True)np.sum(df.isnull())

输出结果:

Unnamed: 0 0event_time 0order_id 0product_id 0category_id 0category_code 0brand 0price 0user_id 0age 0sex 0local 0Month 0Day 0Dayofweek 0hour 0dtype: int64

缺失值已全部填充。

#重复值检查和处理df.duplicated()df.drop_duplicates()

输出结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1141879.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸡尾酒学习——环游世界

1、材料:白朗姆、龙舌兰、威士忌、金酒、伏特加、蓝橙力娇酒、柠檬汁、红石榴糖浆、橙汁、冰块; 2、口感:酸苦涩口味,下层感觉是在喝橙汁,上层在喝酒,适合喜欢喝橙汁以及酒的人,恰巧我不喜欢这两…

第五天:前端页面展示不出来

0.问题展示 但是我这个 展示不来 1.前端页面 渲染 不出来问题 首先想到的是,前端传值的问题然后排查到前端 传值是正确的传值的话,开始debugger 页面没有,然后找他的父页面,父页面是有值的然后找父 方法内部debugger发现第三步…

【疑问解决】在自动装箱中Integer赋予一个常量1,为什么会出现==判断true和flase的情况(JDK源码、内部缓冲)

问题来源自讲课时的Integer练习中 当时第一反应是false true true 因为第一段的输出为flase毋庸置疑了,因为已经new了两个新的堆空间,当然指向不同的空间了 但是第二段第三段就没有头绪了,自动装箱了难道不是执行同一个空间吗…

Go结构体接口反射

文章目录 Go结构体&接口&并发&反射一、结构体struct0、Type关键字1、struct定义及使用2、struct tag3、struct匿名成员3、struct继承4、struct方法 二、接口interface1、接口定义和使用2、空接口3、接口多态及嵌套 三、Go并发1、go协程2、chan管道3、单向管道4、Se…

oracle19c配置驱动

1.遇到的问题 下载jar包 https://www.oracle.com/database/technologies/appdev/jdbc-ucp-19c-downloads.html 执行命令 mvn install:install-file -DgroupIdcom.oracle -DartifactIdojdbc19 -Dversion19.3.0.0 -Dpackagingjar -Dfileojdbc8.jar2.配置驱动 # 数据源配置 data…

浅析体育馆智能信息化升级的四大痛点与解决方案

体育馆是举办重要体育赛事、文艺汇演、商业演出等活动的重要场所,除了日常锻炼的人们以外,一旦举行活动都是人满为患。随着人们日益提高的体育需求,传统体育馆的设施已经无法满足大众的要求,为此旭帆科技特根据传统体育馆存在的几…

适合小团队的任务管理软件有哪些?5款小团队使用最多的项目工具

众所周知,在团队管理中,通过使用适当的任务管理软件,团队可以更高效地组织、分配和跟踪任务,提高工作效率和团队协作。然而,在市场上有许多不同的任务管理工具可供选择,因此选择适合团队的最佳工具可能会成…

设计师必备的插画设计素材网站

趋势很快就会下降,而新浪潮很快就会席卷而来。 品牌和设计师都意识到,他们需要放松僵化的自信,成为开放的团队合作伙伴。如果你对创意工作或趋势保持好奇,这些创意网站会让你摆脱混合的网页搜索推荐,帮助你获得最专业…

ICLR 2024 再现抄袭风波!原作者发帖实锤:过半方法都抄了

添加图片注释,不超过 140 字(可选) 夕小瑶科技说 原创 作者 | 智商掉了一地、ZenMoore 就在上个月末,ICLR 2024 的提交告一段落,在 OpenReview 上已经能够看到目前提交的文章了。虽然评阅结果尚未被发布,…

生成式AI - 大模型(LLM)提示工程(Prompt)技巧

提示工程可以描述为一种艺术形式,为大型语言模型(LLMs)创建输入请求,以实现预期的输出。以下是创造单个或一系列提示的不同技巧。 由少到多的提示 推理过程是基于证据和推理得出结论。反过来,可以通过为LLM提供一些关于…

【数据结构】模拟实现栈和队列

文章目录 栈(Stack)栈的概念栈的常用方法模拟实现栈 队列(Queue)队列的概念队列的常用方法队列的模拟实现循环队列模拟实现 栈(Stack) 栈的概念 栈是一种特殊的线性表,只允许在固定的一端进行…

CSS背景background八种属性

想必大家对背景不陌生,让我为大家介绍一下吧! 属性名简述background-color背景颜色background-image背景图片background-position背景定位background-size背景大小background-repeat背景是否平铺background-attachment背景是否随滚动条固定background-c…

计算机网络【CN】介质访问控制

信道划分介质访问控制 FDMTDMWDMCDM【掌握eg即可】 随机介质访问控制 CSMA 1-坚持CSMA 非坚持CSMA p-坚持CSMA 空闲时 立即发送数据 立即发送数据 以概率P发送数据,以概率1-p推迟到下一个时隙 忙碌时 继续坚持侦听 放弃侦听,等待一个随机的时…

SAP数据元素描述增强修改

数据元素描述增强修改 一、需求 需要将业务伙伴伙伴中的手机字段的描述改为’税局备案电话’。 三、增强实现 使用事务码CMOD,点击转到-》文本增强-》关键字-》更改。 输入数据元素的的字段号码,更改激活即可

从瀑布模式到水母模式:ChatGPT如何赋能软件研发全流程【文末送书五本】

从瀑布模式到水母模式:ChatGPT如何赋能软件研发全流程 前言内容简介购买链接作者简介专家推荐读者对象参与方式往期赠书回 🏘️🏘️个人简介:以山河作礼。 🎖️🎖️:Python领域新星创作者,CSDN实…

Unity的碰撞检测(五)

温馨提示:本文基于前一篇“Unity的碰撞检测(四)​​​​​​​”继续探讨两个游戏对象具备刚体的BodyType均为Dynamic,但是Collision Detection属性不同的碰撞检测,阅读本文则默认已阅读前文。 (一)测试说明 在基于两…

《动手学深度学习 Pytorch版》 10.7 Transformer

自注意力同时具有并行计算和最短的最大路径长度这两个优势。Transformer 模型完全基于注意力机制,没有任何卷积层或循环神经网络层。尽管 Transformer 最初是应用于在文本数据上的序列到序列学习,但现在已经推广到各种现代的深度学习中,例如语…

QA新人入职任务

一、背景 分享记录一下入职新公司后,新人第一周接到的新手任务,回顾总结,方便自己成长和思考~ 二、新人任务说明 题目1:接口相关 题目2:UI相关 UI原型图 三、任务要求 1、根据题目2原型图,进行UI测试…

【继承顺序和方式,子类构造方法,protected 关键字,final 关键字】

文章目录 子类构造方法super和this继承关系上的执行顺序protected 关键字继承方式final 关键字总结 子类构造方法 子类继承父类的成员变量,那父类的成员变量怎么初始化呢? 要先初始化父类成员,子类的构造方法才能完成 class Animal{public…

解决:idea中代码文件背景变成特殊颜色(浅褐色),且代码智能提示完全消失,即使在新项目中创建同类型文件也会出现同样情况

解决:idea开发中代码文件背景变成浅褐色,且代码智能提示完全消失,不同项目新建同类型文件也会出现同样情况 一问题描述:1.idea开发中,使用idea的快捷提示组合键进行提示,但是手快点击确认了什么提示选项&am…