数据可视化实战(三)

news2025/4/17 9:15:44

图书销量情况对比

import pandas as pd
import matplotlib.pyplot as plt 

# 读取Excel数据
df=pd.read_excel('mrbook.xlsx')
df

	序号	书号	序号.1	月份	销量	rate
0	B18	9.787569e+12	1	1月	1506	0.3
1	B19	9.787569e+12	2	2月	1200	-0.3
2	B25	9.787569e+12	3	3月	3305	0.6
3	B21	9.787569e+12	4	4月	6610	0.5
4	NaN	NaN	5	5月	8888	0.3
5	B15	9.787569e+12	6	6月	12354	0.3

#处理中文乱码
plt.rcParams['font.sans-serif']=['SimHei']
# 用来正常的显示负号
plt.rcParams['axes.unicode_minus']=False

plt.figure(figsize=(12,9))
fig,ax1 = plt.subplots()

# 绘制柱状图
ax1.bar(df['月份'], df['销量'])


# plt.barh(y = industry.index[::-1],
#          width=industry.values[::-1],
#          color = '#3c7f7f')

plt.title(label='      销量情况对比     ', 
          fontsize=32, weight='bold', color='white', 
          backgroundcolor='#cf778f',ha = 'center',pad = 30)
ax1.tick_params(labelsize=16)
ax1.grid(lw = 0.5,color = '#3c7f7f',ls = '--')
# 设置y轴标签
ax1.set_ylabel( '销售（册）', fontsize=18)

ax2 = ax1.twinx()
ax2.plot(df['月份'], df['rate'], color='#3c0f7f', linestyle='--', marker='o', linewidth=2)
# 设置y轴标签
ax2.set_ylabel('增长率', fontsize=18)

# 添加文本
for a,b in zip(df['月份'], df['rate']):
    plt.text(a, b+0.02, '%.2f'%b, ha='center', va='bottom', fontsize=10, color='r')
plt.show()

在这里插入图片描述

订单数据分析

# 读取Excel数据
mrtb=pd.read_excel('mrtb_data.xlsx')
mrtb.shape # (599, 21)
mrtb.head()

	买家会员名	买家实际支付金额	宝贝总数量	宝贝标题	类别	宝贝种类	总金额	收货人姓名	性别	收货地址	...	物流单号	确认收货时间	联系手机	联系电话	订单付款时间	订单关闭原因	订单创建时间	订单备注	订单状态	运送方式
0	mr000145	1100.0	1.0	【正版即插即用】ASP.NET编程词典珍藏版（含1TB移动硬盘）资源库	编程词典	1.0	1100.0	***	男	**********	...	No:21026	2018-03-19 16:23:07	****	'null	2018-03-09 14:55:49	订单未关闭	2018-03-09 10:00:36	'null	交易成功	快递
1	mr000492	1198.0	1.0	【正版即插即用】ASP.NET编程词典珍藏版（含1TB移动硬盘）资源库	编程词典	1.0	1198.0	***	男	**********	...	No:21373	2018-06-15 10:57:01	****	'null	2018-06-09 09:25:16	订单未关闭	2018-06-08 19:33:32	'null	交易成功	快递
2	mr000493	1198.0	1.0	【正版即插即用】ASP.NET编程词典珍藏版（含1TB移动硬盘）资源库	编程词典	1.0	1198.0	***	男	**********	...	No:21374	2018-06-15 10:57:01	****	'null	2018-06-09 09:25:16	订单未关闭	2018-06-08 19:33:32	'null	交易成功	快递
3	mr000247	1168.0	1.0	【正版-即插即用】C#编程词典珍藏版（含1TB移动硬盘）资源库	编程词典	1.0	1168.0	***	男	**********	...	No:21128	2018-12-02 10:46:44	****	'null	2018-11-20 19:21:58	订单未关闭	2018-11-20 19:21:33	'null	交易成功	快递
4	mr000271	1168.0	1.0	【正版-即插即用】C#编程词典珍藏版（含1TB移动硬盘）资源库	编程词典	1.0	1168.0	***	女	**********	...	No:21152	2018-11-01 18:41:44	****	'null	2018-10-29 02:31:39	订单未关闭	2018-10-29 02:30:37	'null	交易成功	快递

5 rows × 21 columns

不同性别在不同类别的消费分布


# 根据类别分组，计算每组中 买家实际支付金额 的总和
mrtb1=mrtb.groupby(['类别'])['买家实际支付金额'].sum()
mrtb1
"""
类别
V1会员        7425.00
V2会员       14651.00
图书         44650.33
明日高级VIP    15096.00
编程词典       28681.20
Name: 买家实际支付金额, dtype: float64
"""


# 根据类别和性别分组，统计不同买家的人数，并重置索引
mrtb2=mrtb.groupby(['类别','性别'])['买家会员名'].count().reset_index()
mrtb2

	类别	性别	买家会员名
0	V1会员	女	31
1	V1会员	男	44
2	V2会员	女	36
3	V2会员	男	13
4	图书	女	50
5	图书	男	381
6	明日高级VIP	女	3
7	明日高级VIP	男	14
8	编程词典	女	6
9	编程词典	男	21

# 绘制柱状图：不同类别的买家实际支付金额
plt.figure(figsize=(8, 6))
plt.bar(mrtb1.index, mrtb1.values, color='blue', alpha=0.5)
plt.xlabel('类别', fontsize=12)
plt.ylabel('买家实际支付金额', fontsize=12)
plt.title('不同类别的买家实际支付金额', fontsize=16)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

在这里插入图片描述

不同性别在不同类别的消费分布

mrtb1_df =  pd.DataFrame(mrtb1)
# 使用透视表计算不同性别在不同类别的消费总额
pivot_table = pd.pivot_table(mrtb1_df.merge(mrtb2, on='类别'), index='类别', columns='性别', values='买家实际支付金额', aggfunc='sum')
pivot_table

性别	女	男
类别
V1会员	7425.00	7425.00
V2会员	14651.00	14651.00
图书	44650.33	44650.33
明日高级VIP	15096.00	15096.00
编程词典	28681.20	28681.20

# 绘制堆叠柱状图
plt.figure(figsize=(8, 6))
categories = pivot_table.index
labels = pivot_table.columns
colors = ['pink', 'lightblue']

bottom = None
for label in labels:
    values = pivot_table[label]
    plt.bar(categories, values, bottom=bottom, label=label, color=colors.pop(0))
    if bottom is None:
        bottom = values
    else:
        bottom += values
    for i, value in enumerate(values):
        plt.annotate(f'￥{value:.2f}', (i, bottom[i]), ha='center', va='bottom')
        
plt.xlabel('类别', fontsize=12)
plt.ylabel('买家实际支付金额', fontsize=12)
plt.title('不同性别在不同类别的消费分布', fontsize=16, backgroundcolor='#cf778f')
plt.legend()
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

在这里插入图片描述

双色球中奖号码分析

win = pd.read_csv('data.csv',encoding='gb2312')
win.head()

	开奖日期	期号	中奖号码	销售额(元)	中奖注数一等奖	中奖注数二等奖
0	2020/1/16	2020007	05 12 17 20 25 31 10	358035962	38 (津冀吉沪..)	269
1	2020/1/14	2020006	03 04 05 10 16 32 09	361697316	20 (浙豫粤桂..)	363
2	2020/1/12	2020005	11 16 17 22 26 32 04	400642476	8 (冀皖赣鄂..)	224
3	2020/1/9	2020004	02 15 17 27 32 33 03	370826158	7 (晋浙鲁粤..)	189
4	2020/1/7	2020003	09 17 26 29 30 32 03	368960938	16 (苏浙鄂湘..)	134


# 提取中奖号码
winning_numbers = win['中奖号码'].str.split(' ', expand=True)

# 将"nan"替换为实际的NaN值
# df.replace("nan", np.nan, inplace=True)
# 填充NaN值为0
# winning_numbers.fillna(0, inplace=True).astype(int)

winning_numbers

	0	1	2	3	4	5	6	7	8	9	10	11	12
0	05		12		17		20		25		31		10
1	03		04		05		10		16		32		09
2	11		16		17		22		26		32		04
3	02		15		17		27		32		33		03
4	09		17		26		29		30		32		03
...	...	...	...	...	...	...	...	...	...	...	...	...	...
827	08		10		12		14		18		28		14
828	01		04		19		22		24		25		15
829	06		10		11		28		30		33		12
830	04		21		23		31		32		33		04
831	03		09		15		20		27		29		01

832 rows × 13 columns

# 统计每一列中不同数字出现的次数
number_counts  = winning_numbers.apply(pd.value_counts).fillna(0)
number_counts = number_counts[[0, 2, 4, 6, 8, 10, 12]]

# 重置列索引
number_counts.set_axis(range(1, len(number_counts.columns) + 1), axis=1, inplace=True)
number_counts.head()

	1	2	3	7
	0.0	0.0	0.0	0.0
01	163.0	0.0	0.0	60.0
02	128.0	22.0	0.0	49.0
03	85.0	38.0	3.0	47.0
04	80.0	39.0	10.0	56.0

# 绘制热力图
plt.figure(figsize=(10, 8))
sns.heatmap(number_counts, annot=True, fmt='g', cmap='YlGnBu')
plt.title('     双色球中奖号码次数热力图     ', fontsize=16, backgroundcolor='#cf778f')
plt.xlabel('中奖号码位置',  fontsize=12)
plt.ylabel('中奖号码',  fontsize=12)
plt.xticks(rotation=45)
plt.yticks(rotation=0)
plt.tight_layout()
plt.show()

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1535749.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

数据可视化实战(三)

图书销量情况对比

订单数据分析

不同性别在不同类别的消费分布

不同性别在不同类别的消费分布

双色球中奖号码分析

相关文章

docker 进入容器内部命令

虚拟机扩展：虚拟机快照

学习人工智能：Attention Is All You Need-1-介绍；Transformer模型架构；编码器，解码器

001_measuretime_in_Matlab运行时间测量与时间复杂度分析

微信投票小程序源码系统：礼物道具投票盈利能力超强带完整的安装代码包以及安装部署教程

【数据可视化】Echarts官方文档及常用组件

训练svm并部署树莓派

基于Spring Boot的研究生志愿填报辅助系统

代码随想录day28（1）二叉树：二叉搜索树中的插入操作（leetcode701）

win10 chm文件打开空白怎么办 win10 chm文件打开空白解决办法

verilog设计-CDC：单bit脉冲快时钟域到慢时钟域

MATLAB环境下基于振动信号的轴承状态监测和故障诊断

C++面试宝典第36题：骑士游历

新品发布 | Ftrans FIE文件安全导入导出系统

SinoDB系统数据库

Ubuntu Desktop - lock screen (锁屏)

飞跃前端瓶颈：技术进阶指南精华篇

WORD某一段格式调整，其他段落也调整

Google的MELON: 通过未定位图像重建精确3D模型的突破性算法

【图解物联网】第1章物联网的基础知识

	0	1	2	3	4	5	6	7	8	9	10	11	12
0	05		12		17		20		25		31		10
1	03		04		05		10		16		32		09
2	11		16		17		22		26		32		04
3	02		15		17		27		32		33		03
4	09		17		26		29		30		32		03
...	...	...	...	...	...	...	...	...	...	...	...	...	...
827	08		10		12		14		18		28		14
828	01		04		19		22		24		25		15
829	06		10		11		28		30		33		12
830	04		21		23		31		32		33		04
831	03		09		15		20		27		29		01

	0	1	2	3	4	5	6	7	8	9	10	11	12
0	05		12		17		20		25		31		10
1	03		04		05		10		16		32		09
2	11		16		17		22		26		32		04
3	02		15		17		27		32		33		03
4	09		17		26		29		30		32		03
...	...	...	...	...	...	...	...	...	...	...	...	...	...
827	08		10		12		14		18		28		14
828	01		04		19		22		24		25		15
829	06		10		11		28		30		33		12
830	04		21		23		31		32		33		04
831	03		09		15		20		27		29		01

	0	1	2	3	4	5	6	7	8	9	10	11	12
0	05		12		17		20		25		31		10
1	03		04		05		10		16		32		09
2	11		16		17		22		26		32		04
3	02		15		17		27		32		33		03
4	09		17		26		29		30		32		03
...	...	...	...	...	...	...	...	...	...	...	...	...	...
827	08		10		12		14		18		28		14
828	01		04		19		22		24		25		15
829	06		10		11		28		30		33		12
830	04		21		23		31		32		33		04
831	03		09		15		20		27		29		01