【知识专栏丨python数分实战】电商数据分析案例

news2024/9/24 21:22:35

01

电商数据来源

1.商品API:提供了搜索、详情、评价等与商品相关的接口,可以通过关键词搜索商品,获取商品详情、销量等信息。

2. 店铺API:提供了店铺信息、店铺内商品等接口,可以查询店铺的基本信息、主营类目、评分等,还可以获取店铺内的商品列表。

3. 交易API:提供了交易相关的接口,包括订单的创建、查询、修改、关闭等功能,开发者可以通过这些接口实现订单管理、物流跟踪等功能。

4. 物流API:提供了物流信息查询、物流轨迹等接口,开发者可以使用这些接口获取物流公司、物流轨迹等信息,方便进行物流管理和查询。

5. 用户API:提供了用户信息的查询、身份验证等接口,开发者可以通过这些接口获取用户的基本信息,实现用户身份验证等功能。

6. 评价API:提供了对商品、店铺等评价信息的查询接口,可以获取商品或店铺的评价信息、评价数量等。

7. 类目API:提供了商品类目相关的接口,开发者可以查询淘宝平台上的商品类目信息、属性等。

总体来说,淘宝API提供了丰富的功能和分类,方便开发者通过接口获取淘宝平台上的各种数据,为开发者在自己的应用或网站中集成淘宝相关功能提供了便捷的途

说明:数据量:564169 原始字段:12

字段介绍

Unnamed: 行号

event_time:下单时间

order_id:订单编号

product_id:产品标号

category_id :类别编号

category_code :类别

brand :品牌

price :价格

user_id :用户编号

age :年龄

sex :性别

local:省份

02

分析目的

通过分析销售数据来了解在线销售业务的消费情况,分析用户消费数据来分析用户的消费行为,为用户推荐相匹配的商品。

分析问题

店铺销售情况

每月成交额

每月销售金额

每月消费人数

每月订单数量

每月客单价

不同省份用户数量

不同省份订单数量

不同省份成交金额

订单数随星期分布

订单随小时分布

用户消费行为

用户消费次数

用户消费金额

消费次数与消费金额关系

用户购买周期

新用户、活跃用户、不活跃用户、回流用户、回流率

复购率和回流率

消费人群分层情况

按性别分析

按年龄段分析

按喜好品牌分析

03

结论先行

1、销售金额、订单量、消费人数、客单价在清明小长假、五一小长假、暑假、开学季、十一小长假,几个假期节点表现不错,尤其是开学季的情况最好,在几个关键的节点开始前,店铺一定要提前储备库存保证货源

2、北上广销售金额、订单量、消费人数、客单价都优于其他省份,湖南省消费人数少,但是客单价、订单量都表现优异,湖南省潜力巨大,因此要加大对湖南省的宣传力度,增加湖南省的消费人数。

3、75%的消费人群购买力不高,对30岁以下的人群主要推荐亲民价格的商品。

4、40-50岁的人群购买力高,而且男性对高价格的商品购买力强,因此给40-50岁的男性推荐高价格的商品,对女性推荐较高价格的商品。

5、多数用户至少消费了两次,且消费金额与购物次数有较强的正相关,用户消费次数越多销售额越大。可在8天、28天对用户进行召回,引导客户消费。

6、订单集中在早晨,8点到13点是消费高峰期,这段时间要注意维持好网站的稳定性

7、店铺可以在1-4月份减少营业人员5-11月增加营业人员,应对销售高峰期。

接下来给大家介绍一下分析的过程,包括数据嗅探、数据清洗等步骤。

04

数据分析过程

数据嗅探

#导入第三方库import osfrom datetime import datetimeimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline#设置中文编码和负号的正常显示#plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=False#导入数据df=pd.read_csv('./电子产品销售分析.csv')df.head()

输出结果:

图片

df.describe()

输出结果:

图片

数据清洗

#数据清洗和处理#数据类型转化df['event_time'] =pd.to_datetime(df['event_time'].str[:19],format="%Y-%m-%d %H:%M:%S")df['event_time'] = pd.to_datetime(df['event_time'])#计算时间变量df['Month']=df['event_time'].dt.monthdf['Day'] = df['event_time'].dt.daydf['Dayofweek']=df['event_time'].dt.dayofweekdf['hour']=df['event_time'].dt.hourdf.head()

输出结果:

图片

np.sum(df.isnull())

输出结果:

Unnamed: 0 0event_time 0order_id 0product_id 0category_id 0category_code 129370brand 27224price 0user_id 0age 0sex 0local 0Month 0Day 0Dayofweek 0hour 0dtype: int64

有两列中有数据缺失值,类别列缺失129370条,品牌列缺失27224条,这两列数值缺失对店铺销售情况的分析和用户消费行为的分析没主要影响,但是其他数据有重要影响,所以这两列缺失值由missing填充

df.fillna('missing').head()

输出结果:

图片

np.sum(df.isnull())

输出结果:

Unnamed: 0 0event_time 0order_id 0product_id 0category_id 0category_code 129370brand 27224price 0user_id 0age 0sex 0local 0Month 0Day 0Dayofweek 0hour 0dtype: int64

df['category_code'].fillna('missing',inplace=True)df['brand'].fillna('missing',inplace=True)np.sum(df.isnull())

输出结果:

Unnamed: 0 0event_time 0order_id 0product_id 0category_id 0category_code 0brand 0price 0user_id 0age 0sex 0local 0Month 0Day 0Dayofweek 0hour 0dtype: int64

缺失值已全部填充。

#重复值检查和处理df.duplicated()df.drop_duplicates()

输出结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1134100.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

app广告变现平台怎么选?聚合广告平台的优势有哪些?

app在接广告的时候,开发者考虑最多的就是怕影响用户体验,在广告收益和流量变现之间找一个平衡,这个是需要一定的仔细思考的。广告多了,用户体验被伤害了,那app的留存日活都会受到影响,但是不上广告的话&…

反向传播法(backpropagation)的基本原理

本文通过整理李宏毅老师的机器学习教程的内容,介绍神经网络中用于更新参数的反向传播法(backpropagation)的基本原理。 反向传播 backpropagation, 李宏毅 神经网络的结构: loss(损失)的计算&#xf…

淘宝、京东双11活动全自动脚本丨IOS+安卓

淘宝的活动 - 幻想岛总动员开始了! 又开始手忙脚乱地做任务了,逛逛蚂蚁森林、芭芭农场、答题、逛店铺...很多任务,纯手动当然很累,这个时候,我们就需要借助一些脚本软件,让他自动完成任务,薅点小…

基于android的 rk3399 同时支持多个USB摄像头

基于android的 rk3399 同时支持多个USB摄像头 一、前文二、CameraHal_Module.h三、CameraHal_Module.cpp四、编译&烧录Image五、App验证 一、前文 Android系统默认支持2个摄像头,一个前置摄像头,一个后置摄像头 需要支持数量更多的摄像头&#xff0…

博睿动态|GOPS全球运维大会2023上海站即将开启!

10月26日,博睿数据将应邀出席第二十一届 GOPS 全球运维大会,大会为期2天,侧重方向是 DevOps、BizDevOps、AIOps、DevSecOps、云原生、效能度量等技术领域。 博睿数据AIOps首席专家兼产品总监贺安辉受邀出席10月26日的AIOps最佳实践及解决方案…

8 路数字量输入兼容干接点、湿节点多功能RTU

污水处理厂是处理废水并确保其符合排放标准的重要设施。为了监控和管理污水处理厂的流量和流速数据,采集网关在其中起到关键作用。本文将介绍污水处理厂流量流速数据采集网关的功能、工作原理以及其在污水处理厂中的重要性。 实时监测流量和流速数据:网关…

Arduion-STM32

​ Arduion-STM32 stm32duino 让stm32 在arduino中使用 源代码:GitHub - stm32duino/Arduino_Core_STM32: STM32 core support for Arduino busybox文件位置 stm32duino 下有个stm32tool 项目,内含有busybox.exe 使用usb转TTL烧写 使用 PA9 PA10 …

Linux cd命令:切换目录

cd 命令,是 Change Directory 的缩写,用来切换工作目录。Linux 命令按照来源方式,可分为两种,分别是 Shell 内置命令和外部命令。 所谓 Shell 内置命令,就是 Shell 自带的命令,这些命令是没有执行文件的&a…

VulnHub Tre

一、信息收集 1.nmap扫描 发现开发端口:22、80、8082 访问80和8082端口,没有发现什么有价值的信息 2.扫描目录 dirsearch扫描目录 ┌──(root💀kali)-[~/routing/dirsearch-] └─# python3 dirsearch.py -u "http://192.168.103.1…

sudo apt update 后会出现的一堆问题的解决

于是,我选择卸载CUDA : 采用的方法是: cd /usr/local/cuda-11.4/bin/ sudo ./cuda-uninstaller sudo rm -rf /usr/local/cuda-11.4 然后重新下载CUDA: 下载的时候注意: 首先选择下载对应的版本,如果还…

C++基础语法——智能指针

目录 1.智能指针存在的意义 2.内存泄漏 ①什么是内存泄漏,内存泄漏的危害 ②内存泄漏分类 ③如何检测内存泄漏 ④如何避免内存泄漏 3.智能指针的使用及其模拟实现 ①RAII ②智能指针的原理 ③std::auto_ptr 模拟实现 ④std::unique_ptr 模拟实现 ⑤st…

【目标跟踪】ECO算法论文阅读:ECO: Efficient Convolution Operators for Tracking

文章目录 1. 论文概要2. 研究背景和动机3. 相关滤波用于目标跟踪的原理4. ECO算法流程5. ECO算法创新点5.1 特征降维:PCA5.2 训练集简化:GMM5.3 模型更新策略:间歇更新 1. 论文概要 论文下载地址:ECO: Efficient Convolution Oper…

UG\NX二次开发 设置对象的高亮状态 UF_DISP_set_highlight

文章作者:里海 来源网站:王牌飞行员_里海_里海NX二次开发3000例,里海BlockUI专栏,C\C++-CSDN博客 感谢粉丝订阅 感谢 2301_79203630 订阅本专栏,非常感谢。 简介 UG\NX二次开发 设置对象高亮状态 UF_DISP_set_highlight 效果 代码 #include "me.hpp"extern DllEx…

Redis数据库管理工具Redis Desktop Manager最新中文

Redis Desktop Manager是一款直观且易用的Redis数据库管理工具,支持Windows、macOS和Linux等多平台。它提供了丰富的功能和工具,使用户可以轻松地创建、编辑、删除和浏览Redis键值对,并执行各种Redis命令。通过SSH Tunnel连接,RDM…

信号浪涌保护器的行业应用和原理与分类解决方案

什么是信号浪涌保护器 信号浪涌保护器是一种电子设备,它可以保护信号线路上的仪器、设备或系统免受雷击或其他瞬态过电压的损害。 信号浪涌保护器的主要原理是将线路上产生的高压浪涌,泄放到大地,将其限制到被保护对象可以耐受的范围内&…

【博士每天一篇文献-算法】Overcoming catastrophic forgetting in neural networks

阅读时间:2023-10-24 1 介绍 年份:2016 作者:James Kirkpatrick, Razvan Pascanu, Neil Rabinowitz, Joel Veness, Guillaume Desjardins, Andrei A. Rusu, Kieran Milan, John Quan, Tiago Ramalho, Agnieszka Grabska-Barwinska, Demis H…

js实现在报表参数界面获取body中控件的值

要在报表参数界面获取body中控件的值,你可以使用JavaScript来实现。下面是一个详细的介绍: 1. DOM(文档对象模型): - DOM是用于操作HTML文档的API,它允许你通过JavaScript访问和操作文档中的元素。 - 在报…

python由0到1的基础第一篇(基础语法、变量类型、运算符)

文章目录 前言编程语言是什么?编译型语言和解释型语言的区别编译型语言解释型语言编译型语言和解释型语言的差异总结 一、Python是什么?Python简介1.1Python是什么?1.2Python简介1.2.1Python优点1.2.2Python的缺点 二、Python能干什么&#x…

iview form 动态表单

最开始用得网上得 <FormItemlabel"采购方开户行":rules"baseForm.receiptType 12? baseInfoRule.procureBank: [{ required: false }]"><Inputv-model"baseForm.procureBank"placeholder"请输入采购方开户行"style"w…

RISC-V架构——中断处理和中断控制器介绍

1、ARM架构中断机制介绍 本文不是从零开始讲解中断&#xff0c;对于中断的基本知识不再赘述&#xff0c;对中断不是很了解可以先学习ARM中断的文章。参考博客&#xff1a;《ARM架构的外部中断介绍(S5PV210芯片)》&#xff1b; 2、RIAC_V架构的中断控制器架构 &#xff08;1&…