Python数据分析:数据可视化(Matplotlib、Seaborn)

news2024/11/24 8:32:55

数据可视化是数据分析中不可或缺的一部分,通过将数据以图形的方式展示出来,可以更直观地理解数据的分布和趋势。在Python中,Matplotlib和Seaborn是两个非常流行和强大的数据可视化库。本文将详细介绍这两个库的使用方法,并附上一个综合详细的例子。

一、Matplotlib

Matplotlib是Python中最基础也是最强大的数据可视化库之一。它提供了一整套绘图工具,可以创建各种类型的图表,如折线图、柱状图、散点图、饼图等。

1.1 Matplotlib基础

基本使用

Matplotlib的基本使用非常简单,只需要导入matplotlib.pyplot模块,然后使用其各种绘图函数即可。

import matplotlib.pyplot as plt

# 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# 绘制折线图
plt.plot(x, y)
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.title('简单折线图')
plt.show()

设置图形属性

我们可以通过设置各种属性来定制图形的外观。

# 设置线条属性
plt.plot(x, y, color='green', marker='o', linestyle='dashed', linewidth=2, markersize=12)
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.title('设置线条属性的折线图')
plt.show()

多图绘制

使用subplot函数可以在同一个窗口中绘制多个图形。

# 创建数据
x = [1, 2, 3, 4, 5]
y1 = [2, 3, 5, 7, 11]
y2 = [1, 4, 9, 16, 25]

# 创建子图
plt.subplot(2, 1, 1)
plt.plot(x, y1, 'r--')
plt.title('第一个子图')

plt.subplot(2, 1, 2)
plt.plot(x, y2, 'g*-')
plt.title('第二个子图')

plt.show()

1.2 Matplotlib高级

图例和标签

我们可以为图形添加图例和标签,以便更好地解释图表内容。

# 创建数据
x = [1, 2, 3, 4, 5]
y1 = [2, 3, 5, 7, 11]
y2 = [1, 4, 9, 16, 25]

# 绘制折线图
plt.plot(x, y1, label='质数')
plt.plot(x, y2, label='平方数')

# 添加图例和标签
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.title('添加图例和标签的折线图')
plt.legend()
plt.show()

注释和文本

可以在图表中添加注释和文本,以便更详细地解释图表中的数据点。

# 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# 绘制折线图
plt.plot(x, y)
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.title('添加注释的折线图')

# 添加注释
plt.annotate('最高点', xy=(5, 11), xytext=(4, 9),
             arrowprops=dict(facecolor='black', shrink=0.05))

plt.show()

图表样式

Matplotlib提供了许多内置的样式,可以轻松更改图表的整体外观。

# 使用内置样式
plt.style.use('ggplot')

# 创建数据
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# 绘制折线图
plt.plot(x, y)
plt.xlabel('X轴')
plt.ylabel('Y轴')
plt.title('使用ggplot样式的折线图')
plt.show()

二、Seaborn

Seaborn是基于Matplotlib构建的高级数据可视化库,提供了更简洁的API和更美观的默认样式,特别适合用于统计数据的可视化。

2.1 Seaborn基础

安装和导入

安装Seaborn非常简单,可以使用pip命令:

pip install seaborn

导入Seaborn也非常简单:

import seaborn as sns
import matplotlib.pyplot as plt

基本使用

Seaborn的基本使用方法与Matplotlib类似,但提供了更简洁的接口和更美观的默认样式。

# 导入数据集
tips = sns.load_dataset('tips')

# 绘制散点图
sns.scatterplot(x='total_bill', y='tip', data=tips)
plt.xlabel('总账单')
plt.ylabel('小费')
plt.title('总账单与小费的关系')
plt.show()

绘制不同类型的图表

Seaborn提供了许多用于绘制不同类型图表的函数,如箱线图、柱状图、热力图等。

# 箱线图
sns.boxplot(x='day', y='total_bill', data=tips)
plt.xlabel('星期几')
plt.ylabel('总账单')
plt.title('不同星期几的总账单分布')
plt.show()

# 热力图
flights = sns.load_dataset('flights')
flights_pivot = flights.pivot('month', 'year', 'passengers')
sns.heatmap(flights_pivot, annot=True, fmt='d', cmap='YlGnBu')
plt.xlabel('年份')
plt.ylabel('月份')
plt.title('不同年份和月份的乘客数量')
plt.show()

2.2 Seaborn高级

调整图表样式

Seaborn提供了一些函数可以调整图表的样式。

# 设置图表样式
sns.set_style('whitegrid')

# 绘制散点图
sns.scatterplot(x='total_bill', y='tip', data=tips)
plt.xlabel('总账单')
plt.ylabel('小费')
plt.title('总账单与小费的关系')
plt.show()

多图绘制

使用FacetGrid可以在同一个窗口中绘制多个图形,方便进行对比分析。

# 使用FacetGrid绘制多个图形
g = sns.FacetGrid(tips, col='time')
g.map(sns.scatterplot, 'total_bill', 'tip')
plt.show()

三、综合实例

下面是一个综合详细的例子,展示如何使用Matplotlib和Seaborn进行数据可视化。

3.1 示例数据集

我们将使用一个模拟的数据集,包含一些产品的销售数据。

import pandas as pd
import numpy as np

# 创建数据集
np.random.seed(0)
dates = pd.date_range('20230101', periods=100)
df = pd.DataFrame({
    'date': dates,
    'product': np.random.choice(['A', 'B', 'C', 'D'], size=100),
    'sales': np.random.randint(50, 200, size=100),
    'profit': np.random.randint(20, 100, size=100)
})

3.2 使用Matplotlib进行数据可视化

销售趋势折线图

我们首先使用Matplotlib绘制产品销售趋势的折线图。

import matplotlib.pyplot as plt

# 按日期汇总销售数据
sales_trend = df.groupby('date')['sales'].sum()

# 绘制折线图
plt.figure(figsize=(10, 6))
plt.plot(sales_trend.index, sales_trend.values)
plt.xlabel('日期')
plt.ylabel('销售额')
plt.title('销售趋势折线图')
plt.show()

各产品销售额柱状图

接下来,我们绘制各产品销售额的柱状图。

# 按产品汇总销售数据
product_sales = df.groupby('product')['sales'].sum()

# 绘制柱状图
plt.figure(figsize=(8, 6))
plt.bar(product_sales.index, product_sales.values, color=['red', 'blue', 'green', 'purple'])
plt.xlabel('产品')
plt.ylabel('销售额')
plt.title('各产品销售额柱状图')
plt.show()

3.3 使用Seaborn进行数据可视化

销售和利润的散点图

我们使用Seaborn绘制销售和利润的散点图。

import seaborn as sns

# 绘制散点图
plt.figure(figsize=(10, 6))
sns.scatterplot(x='sales', y='profit', hue='product', data=df)
plt.xlabel('销售额')
plt.ylabel('利润')
plt.title('销售额与利润的关系')
plt.show()

产品销售分布箱线图

我们使用Seaborn绘制各产品销售分布的箱线图。

# 绘制箱线图
plt.figure(figsize=(10, 6))
sns.boxplot(x='product', y='sales', data=df)
plt.xlabel('产品')
plt.ylabel('销售额')
plt.title('各产品销售分布箱线图')
plt.show()

3.4 综合实例的输出结果

通过运行上述代码,我们可以得到一系列图表,这些图表直观地展示了销售数据的分布和趋势。

  1. 销售趋势折线图:展示了整个时间段内的销售趋势,帮助我们识别出销售高峰和低谷。
  2. 各产品销售额柱状图:展示了不同产品的销售额对比,帮助我们确定哪些产品最受欢迎。
  3. 销售额与利润的散点图:展示了销售额和利润之间的关系,帮助我们分析销售和利润的相关性。
  4. 各产品销售分布箱线图:展示了不同产品的销售分布情况,帮助我们识别出销售额的集中区域和异常值。

通过这些图表,我们可以更好地理解和解释数据,从而做出更明智的决策。

四、总结

本文详细介绍了Python中两个主要的数据可视化库——Matplotlib和Seaborn的使用方法,并通过一个综合实例展示了如何使用这两个库进行数据可视化。Matplotlib提供了强大的绘图功能和高度的定制性,而Seaborn则提供了更简洁的接口和更美观的默认样式。根据不同的需求,我们可以选择合适的库进行数据可视化,从而更好地理解和解释数据。

作者:Rjdeng
链接:https://juejin.cn/post/7399985797540069386

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2046014.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SAP MIGO屏幕增强的具体实施步骤介绍(SE19:MB_MIGO_BADI) <转载>

原文链接:https://mp.weixin.qq.com/s/cDoKsc3nBPMa0GRTtQawHw 在SAP/ERP项目实施中经常会遇到MIGO屏幕增强的需求,就是要在MIGO标准屏幕的抬头或行项目中添加一个客制化页签,在增强页签下增加一些字段供用户录入一些额外信息,比…

C语言 | Leetcode C语言题解之第338题比特位计数

题目&#xff1a; 题解&#xff1a; int* countBits(int n, int* returnSize) {int* bits malloc(sizeof(int) * (n 1));*returnSize n 1;bits[0] 0;for (int i 1; i < n; i) {bits[i] bits[i & (i - 1)] 1;}return bits; }

公钥基础设施PKI

数字证书的生成方式&#xff1a; 第一步&#xff0c;密钥生成。有两种方法&#xff0c;一是主体可以用某个软件生成的公钥/私钥对&#xff0c;主体要使生成的私钥保密&#xff0c;然后把公钥和其他信息与身份证明发送给注册机构。二是注册机构也可以为主体生成密钥对&#xff…

前端工程师如何快速入门鸿蒙开发?

在当今科技飞速发展的时代&#xff0c;前端工程师们面临着不断拓展技能边界的挑战。随着鸿蒙操作系统的崛起&#xff0c;掌握鸿蒙开发成为了前端工程师们提升自身竞争力的重要途径。那么&#xff0c;前端工程师如何才能快速入门鸿蒙开发呢? 一、了解鸿蒙开发的基础知识 前端工…

mybatis xml 动态sql相关语法

<?xml version"1.0" encoding"UTF-8" ?> <!DOCTYPE mapperPUBLIC "-//mybatis.org//DTD Mapper 3.0//EN""http://mybatis.org/dtd/mybatis-3-mapper.dtd"><mapper namespace"com.xiaKangan.mapper.EmpMapper&qu…

定期修改密码竟然导致好几任运维小哥离职

某云服务商为政企客户提供私有云服务&#xff0c;每朵云里交换机、服务器、防火墙等网络/安全设备可多达数百台&#xff0c;而该企业仅有二、三十名运维人员&#xff0c;每人要负责2-3朵云的运维管理工作。当前&#xff0c;设备管理存在一些重大安全隐患&#xff0c;主要体现在…

微服务架构的未来发展趋势

文章目录 摘要引言当前发展趋势ServerlessService MeshAIOps 未来可能出现的挑战代码示例微服务架构示例 QA环节小结未来展望参考资料 摘要 微服务架构在软件开发中已经成为主流&#xff0c;但随着市场需求和技术环境的快速变化&#xff0c;微服务架构也在不断演进。本文将分析…

在线教育新突破:Codigger 视频会议的实战案例

在当今数字化时代&#xff0c;在线教育如同一颗璀璨的新星&#xff0c;迅速崛起并照亮了知识传播的新路径。然而&#xff0c;随着竞争的加剧&#xff0c;如何提升教学质量和增强互动性&#xff0c;成为了在线教育机构亟待解决的难题。这时候&#xff0c;视频会议的出现就如同一…

【python】Matplotlib+LaTeX绘图 字符加粗 || 代码合集

【start&#xff1a;240814】 文章目录 动机Matplotlib库调用报错 LaTeX 模式安装使用配置属性&#xff1a;text.latex.preamble属性简介amsmathtextcomp 非LaTeX 模式配置属性&#xff1a;mpl.rcParams[...] 字符加粗&#xff08;label&#xff09;非LaTeX模式&#xff08;关闭…

英飞凌高压侧智能电源开关:BSP762T中文资料书

描述&#xff1a; 集成垂直功率FET的高压侧电源开关&#xff0c;提供嵌入式保护和诊断功能。 特性 - 过载保护 - 电流限制 - 短路保护 - 带重启功能的热关断 - 过压保护&#xff08;包括负载转储&#xff09; - 电感负载快速消磁 - 电池反向保护&#xff0c;带外部电阻 - CMOS兼…

【手撕数据结构】Topk问题

目录 题目思路代码 题目 TOP-K问题&#xff1a;即求数据结合中前K个最⼤的元素或者最⼩的元素&#xff0c;⼀般情况下数据量都⽐较⼤。 ⽐如&#xff1a;专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。 对于Top-K问题&#xff0c;能想到的最简单直接的⽅式就是排序…

智联云采 SRM2.0 runtimeLog/download 任意文件读取漏洞复现

0x01 产品简介 智联云采是一款针对企业供应链管理难题及智能化转型升级需求而设计的解决方案&#xff0c;针对企业供应链管理难题&#xff0c;及智能化转型升级需求&#xff0c;智联云采依托人工智能、物联网、大数据、云等技术&#xff0c;通过软硬件系统化方案&#xff0c;帮…

Python 中的 SHAP 简介

本文中有多篇计划文章&#xff0c;后期会补充相关链接。鉴于公众号内无法后期修改文章&#xff0c;请关注原文链接。 如何创建和解释 SHAP 图&#xff1a;瀑布图、力图、平均 SHAP 图、蜂群图和依赖图 可直接在橱窗里购买&#xff0c;或者到文末领取优惠后购买&#xff1a; SHA…

iOS替代商店AltStore PAL获得EPIC的资助 即日起取消1.5欧元的年度订阅费

知名游戏开发商 EPIC 日前宣布通过 EPIC MegaGrant 计划向 iOS 替代商店 AltStore PAL 进行捐赠&#xff0c;该商店是在欧盟市场经过苹果批准的合规的第三方应用商店。 按苹果规定第三方替代商店需要缴纳核心技术费并且没有豁免条款&#xff0c;因此该商店每被一名用户安装&am…

RIP学习笔记

1.RIP简介 Rip&#xff1a;routing information protocol&#xff0c;路由信息协议。属于动态路由协议的一种。 RIP是应用较早、使用较普遍的内部网关协议(InteriorGatewayProtocol,简称IGP)&#xff0c;适用于小型同类网络&#xff0c;是典型的距离向量(distance-vector)协议…

OKR 与 KPI 的区别

OKR出现后&#xff0c;大家经常会拿KPI与之一起比较&#xff0c;结果两级分化&#xff1a;爱KPI的一如既往KPI&#xff0c;把OKR说的一无是处。爱OKR的&#xff0c;搞起了“去KPI”化。Tita作为OKR应用软件的服务商&#xff0c;我们也必须对OKR和KPI有充分的理解。对此我认真做…

Ubuntu离线安装docker

查看操作系统版本&#xff1a; rootzyh-VMware-Virtual-Platform:~/install# lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 24.04 LTS Release: 24.04 Codename: noble rootzyh-VMware-Virtual-Platform:~/install#…

微服务架构设计中的常见的10种设计模式

微服务架构设计的概念 微服务架构&#xff08;Microservices Architecture&#xff09;是一种用于构建分布式系统的软件设计模式。它将大型应用程序拆分成一组小型、自治的服务&#xff0c;每个服务都运行在其独立的进程中&#xff0c;服务之间通过轻量级的通信机制&#xff08…

重塑商业生态:技术驱动下的批发供应系统开发与革新

在当今这个快速变化的商业环境中&#xff0c;批发供应系统作为连接生产商、分销商与零售商的关键纽带&#xff0c;其效率与智能化水平直接影响着整个供应链的运作效率与市场竞争力。随着信息技术的飞速发展&#xff0c;特别是大数据、云计算、人工智能&#xff08;AI&#xff0…

D. 二进制

1.题意&#xff1a;给出2中操作 1)&#xff1a;将段排序 2)&#xff1a;将段输出为十进制数 思路&#xff1a; 1.考虑第一种操作。只需要查询l-r中1的个数即可。如果递增&#xff0c;则中为1&#xff0c;否则中为1&#xff0c;需要一个覆盖tag 2.考虑如何维护十进制的值。…