【四 (3)数据可视化之 Seaborn 常用图表及代码实现 】

news2025/1/11 16:51:59

目录

    • 文章导航
    • 一、介绍
    • 二、安装Seaborn
    • 三、导入Seaborn
    • 四、设置可以中文显示
    • 五、占比类图表
      • 1、饼图
      • 2、环形图
    • 六、比较排序类
      • 1、条形图
      • 2、箱线图
      • 3、小提琴图
    • 七、趋势类图表
      • 1、折线图
    • 八、频率分布类
      • 1、直方图
    • 九、关系类图表
      • 1、散点图
      • 2、成对关系图
      • 3、热力图

文章导航

【一 简明数据分析进阶路径介绍(文章导航)】

一、介绍

Seaborn同Matplotlib一样,也是Python进行数据可视化分析的重要第三方包。但Seaborn在Matplotlib的基础上进行了更高级的API封装,使得作图更加容易,图形更加漂亮。Seaborn是基于Matplotlib产生的一个模块,专攻统计可视化,可以和Pandas进行无缝链接,使初学者更容易上手。相对于Matplotlib,Seaborn语法更简洁,两者的关系类似于NumPy和Pandas之间的关系。

但是应该强调的是,应该把Seaborn视为Matplotlib的补充,而不是替代物。

二、安装Seaborn

pip install seaborn

三、导入Seaborn

import seaborn as sns

四、设置可以中文显示

import matplotlib.pyplot as plt  
  
# 设置matplotlib支持中文显示  
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑体  
plt.rcParams['axes.unicode_minus'] = False  # 解决负号'-'显示为方块的问题
from matplotlib import font_manager  
  
# 设置Matplotlib配置参数  
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑体  
plt.rcParams['axes.unicode_minus'] = False  # 正确显示负号

五、占比类图表

1、饼图

import matplotlib.pyplot as plt  
  
# 假设我们有以下数据  
labels = ['类别A', '类别B', '类别C', '类别D']  
sizes = [15, 30, 45, 10]  # 百分比或数量  
  
# 绘制占饼图  
fig1, ax1 = plt.subplots()  
ax1.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)  
ax1.axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.  
  
plt.title('占饼图示例')  
plt.show()

在这里插入图片描述

2、环形图

import matplotlib.pyplot as plt  
import numpy as np  
  
# 假设我们有以下数据  
labels = ['类别A', '类别B', '类别C', '类别D']  
sizes = [15, 30, 45, 10]  # 外环数据  
sizes_inner = [10, 15, 30, 5]  # 内环数据  
  
# 确保内环数据不超过外环数据  
sizes_inner = [min(s, si) for s, si in zip(sizes, sizes_inner)]  
  
# 计算百分比  
sizes_pct = [s / sum(sizes) * 100 for s in sizes]  
sizes_inner_pct = [si / sum(sizes_inner) * 100 for si in sizes_inner]  
  
# 绘制环形图  
fig, ax = plt.subplots()  
  
# 外环  
ax.pie(sizes, labels=labels, colors=['blue'], wedgeprops=dict(width=0.3, edgecolor='w'), startangle=90)  
  
# 内环  
ax.pie(sizes_inner,  colors=['red'], wedgeprops=dict(width=0.1, edgecolor='w'), startangle=90)  
  
# 绘制中心圆  
ax.add_artist(plt.Circle((0.5, 0.5), 0.05, fc='white', ec='white'))  
  
# 添加百分比标签  
def func(pct, allvals):  
    absolute = int(round(pct/100.*np.sum(allvals)))  
    return "{:.1f}% ({})".format(pct, absolute)  
  
# 外环百分比标签  
wedges, texts, autotexts = ax.pie(sizes, labels=labels, autopct=lambda pct: func(pct, sizes),  
                                   wedgeprops=dict(width=0.3, edgecolor='w'), startangle=90)  
  
# 设置标题和等比例显示  
ax.set_title('环形图示例')  
ax.axis('equal')  
  
plt.show()

在这里插入图片描述

六、比较排序类

1、条形图

import seaborn as sns  
import matplotlib.pyplot as plt  
import pandas as pd  
  
# 假设有一个包含分类变量和连续变量的DataFrame  
data = pd.DataFrame({  
    'Category': ['A', 'B', 'C', 'D', 'E'],  
    'Value': [23, 17, 35, 29, 12]  
})  
  
# 绘制条形图  
sns.barplot(x='Category', y='Value', data=data)  
  
# 设置图表标题和轴标签  
plt.title('条形图示例:不同类别的值')  
plt.xlabel('类别')  
plt.ylabel('值')  
  
# 显示图表  
plt.show()

在这里插入图片描述

2、箱线图

import seaborn as sns  
import matplotlib.pyplot as plt  
import pandas as pd  
import numpy as np  
  
# 假设有一个包含分类变量和连续变量的DataFrame  
np.random.seed(0)  # 设置随机种子以获得可复现的结果  
data = pd.DataFrame({  
    'Category': ['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C'],  
    'Value': np.random.randn(9) * 100  # 生成正态分布的数据  
})  
  
# 绘制箱线图  
sns.boxplot(x='Category', y='Value', data=data)  
  
# 设置图表标题和轴标签  
plt.title('箱线图示例:不同类别的值分布')  
plt.xlabel('类别')  
plt.ylabel('值')  
  
# 显示图表  
plt.show()

在这里插入图片描述

3、小提琴图

import seaborn as sns  
import matplotlib.pyplot as plt  
import pandas as pd  
import numpy as np  
  
# 假设有一个包含分类变量和连续变量的DataFrame  
np.random.seed(0)  # 设置随机种子以获得可复现的结果  
data = pd.DataFrame({  
    'Category': ['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C'],  
    'Value': np.random.randn(9) * 100  # 生成正态分布的数据  
})  
  
# 绘制小提琴图  
sns.violinplot(x='Category', y='Value', data=data)  
  
# 设置图表标题和轴标签  
plt.title('小提琴图示例:不同类别的值分布')  
plt.xlabel('类别')  
plt.ylabel('值')  
  
# 显示图表  
plt.show()

在这里插入图片描述

七、趋势类图表

1、折线图

import seaborn as sns  
import matplotlib.pyplot as plt  
import pandas as pd  
import numpy as np  
  
# 假设我们有一个包含时间序列和数值的数据集  
np.random.seed(0)  
data = pd.DataFrame({  
    'date': pd.date_range(start='2023-01-01', periods=12),  
    'value': np.random.randn(12).cumsum()  
})  
  
# 绘制线图  
sns.lineplot(data=data, x='date', y='value')  
  
# 设置图表标题和轴标签  
plt.title('折线图示例:随时间变化的数值')  
plt.xlabel('日期')  
plt.ylabel('值')  
  
# 显示网格  
plt.grid(True)  
  
# 显示图表  
plt.show()

在这里插入图片描述

八、频率分布类

1、直方图

import seaborn as sns  
import matplotlib.pyplot as plt  
import numpy as np  
  
# 生成随机数据  
np.random.seed(0)  
data = np.random.randn(1000)  
  
# 绘制直方图  
sns.histplot(data, kde=True)  
  
# 设置图表标题和轴标签  
plt.title('直方图示例:数据分布')  
plt.xlabel('值')  
plt.ylabel('频数')  
  
# 显示网格  
plt.grid(True)  
  
# 显示图表  
plt.show()

在这里插入图片描述

九、关系类图表

1、散点图

import seaborn as sns  
import matplotlib.pyplot as plt  
import pandas as pd  
  
# 创建一个模拟的数据集  
data = pd.DataFrame({  
    'Math': [85, 92, 78, 95, 88, 76, 91, 82, 79, 85],  
    'English': [88, 90, 82, 93, 87, 79, 92, 83, 80, 86]  
})  
  
# 绘制散点图  
sns.scatterplot(data=data, x='Math', y='English', hue='Math')  
  
# 添加图例标题  
plt.legend(title='数学成绩')  
  
# 设置图表标题和轴标签  
plt.title('学生数学和英语成绩散点图')  
plt.xlabel('数学成绩')  
plt.ylabel('英语成绩')  
  
# 显示网格  
plt.grid(True)  
  
# 调整图表大小  
plt.figure(figsize=(8, 6))  
  
# 显示图表  
plt.show()

在这里插入图片描述

2、成对关系图

import seaborn as sns  
import pandas as pd  
import numpy as np  
  
# 假设我们有一个包含多个连续变量的数据集  
np.random.seed(0)  
data = pd.DataFrame(np.random.randn(200, 4), columns=['A', 'B', 'C', 'D'])  
  
# 绘制成对关系图  
sns.pairplot(data, kind='reg')  # 添加线性回归线  
  
# 设置图表标题  
plt.suptitle('成对关系图示例:多个连续变量之间的关系', y=1.05)  
  
# 显示图表  
plt.show()

##

3、热力图

import seaborn as sns  
import matplotlib.pyplot as plt  
import numpy as np  
  
# 创建一个随机的相关系数矩阵  
np.random.seed(0)  
corr_matrix = np.random.rand(6, 6)  
corr_matrix = (corr_matrix + corr_matrix.T) / 2  # 保证矩阵是对称的  
np.fill_diagonal(corr_matrix, 1)  # 对角线元素设为1  
  
# 绘制热力图  
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')  
  
# 设置图表标题  
plt.title('热力图示例:相关系数矩阵')

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1519871.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

手机备忘录怎么导出到电脑,如何将手机备忘录导出到电脑

备忘录是我们日常生活和工作中常用的工具之一,我们可以在手机上轻松地记录重要的事务、想法和灵感。然而,在某些情况下,我们可能需要将手机备忘录导出到电脑进行更详细的整理和管理。那么,手机备忘录怎么导出到电脑,如…

ASP.NET-Server.HtmlEncode

目录 背景: 1.转义特殊字符: 2.防止跨站脚本攻击(XSS): 3.确保输出安全性: 4.保留原始文本形式: 5.与用户输入交互安全: 实例说明: 不用Server.HtmlEncode 效果展示: 用Server.HtmlEnc…

【Numpy】练习题100道(26-50题)

#学习笔记# 在学习神经网络的过程中发现对numpy的操作不是非常熟悉,遂找到了Numpy 100题。 Git-hub链接 1.题目列表 26. 下面的脚本输出什么?(★☆☆) print(sum(range(5),-1)) from numpy import * print(sum(range(5),-1)) 27. 考虑一个整数向量…

TCP的三次握手和4次挥手

一、首先讲一下TCP的由来 最开始,人们考虑到将网络信息的呼唤与回应进行规范,达成一种公认的协议,就好像没有交通规则的路口设定交通规则。 人们设计出完美的OSI协议,这个协议包含七个层次由下到上分别是: 物理层&…

【Unity】进度条和血条的三种做法

前言 在使用Unity开发的时候,进度条和血条是必不可少的,本篇文章将简单介绍一下几种血条的制作方法。 1.使用Slider Slider组件由两部分组成:滑动区域和滑块。滑动区域用于显示滑动条的背景,而滑块则表示当前的数值位置。用户可…

因聚而生 数智有为丨软通动力携子公司鸿湖万联亮相华为中国合作伙伴大会2024

3月14日,以“因聚而生 数智有为”为主题的“华为中国合作伙伴大会2024”在深圳隆重开幕。作为华为的重要合作伙伴和本次大会钻石级(最高级)合作伙伴,软通动力深度参与本次盛会,携前沿数智化技术成果和与华为的联合解决…

Python之Web开发中级教程----创建Django子应用

Python之Web开发中级教程----创建Django子应用 基于上一个教程的Django项目(可以先看上一集,链接如下:) https://mp.csdn.net/mp_blog/creation/editor/136724897 2.创建子应用 python manager.py startapp book admin.py&…

蓝桥杯 EDA 组 2021-2022 省赛真题+模拟题原理图解析

本文解析了标题内的原理图蓝桥杯EDA组真题,为方便阅读2023年真题/模拟和国赛部分放到其他章节解析。下文中重复或者是简单的电路节约篇幅不在赘述。 其中需要补充和计算原理图的题目解析都放在最下面 一、2021第十二届真题第一场 1.1 AMS1117 线性稳压器 最常见的1…

工具类实现导出复杂excel、word

1、加入准备的工具类 package com.ly.cloud.utils.exportUtil;import java.util.Map;public interface TemplateRenderer {Writable render(Map<String, Object> dataSource) throws Throwable;}package com.ly.cloud.utils.exportUtil;import java.util.Map;public int…

AI学习笔记之六:无监督学习如何帮助人类挖掘数据金矿和防范网络欺诈

在这个大数据时代&#xff0c;企业和组织在过去几十上百年的经营过程中积累了大量的原始数据&#xff0c;其中蕴含着宝贵的商业价值和见解。然而&#xff0c;要从这些海量的、未经标记和处理的数据中发现隐藏的规律和知识&#xff0c;并不是一件容易的事情。这就好比要从一座巨…

测试用例的设计(1)

目录 1. 测试用例的基本要素 2.测试用例的设计方法 2.1.基于需求设计 2.2根据功能需求测试 2.3非功能测试 3. 具体的设计方法 3.1等价类法 3.2边界值法 3.3判定表 1. 测试用例的基本要素 测试用例是为了实施测试而面向测试的系统提供的一组集合,这组集合包含:测试环境,…

使用FFmpeg源码配置程序configure查看所有支持的编码器/解码器/封装/解封装及网络协议

查看支持编码器: configure --list-encoders 查看支持编码器: configure --list-decoders 查看所有支持的封装: configure --list-muxers 查看所有支持的解封装: configure --list-demuxers 查看所有支持的网络通信协议: configure --list-protocols

数据预处理|数据清洗|使用Pandas进行异常值清洗

数据预处理|数据清洗|使用Pandas进行异常值清洗 使用Pandas进行异常值清洗1. 异常值检测1.1 简单统计分析1.2 散点图方法1.3 3σ原则1.4 箱线图 2. 异常值处理2.1 直接删除2.2 视为缺失值2.3 平均值修正2.4 盖帽法2.5 分箱平滑法2.6 回归插补2.7 多重插补2.8 不处理 使用Pandas…

通过Rothko罗斯科绘画学习CSS盒子

本文章属于学习笔记&#xff0c;在https://www.freecodecamp.org/chinese/learn/2022/responsive-web-design/中练习 1、使用 padding 简写属性来增加两个元素之间的空间到。 .canvas {} .frame { padding:50px; }2、overflow 设置为 hidden - 将画布更改回其原始尺寸。overfl…

193基于matlab的基于两轮驱动机器人的自适应轨迹跟踪算法

基于matlab的基于两轮驱动机器人的自适应轨迹跟踪算法&#xff0c;将被跟踪轨迹分段作为跟踪直线处理&#xff0c;相邻离散点之间为一段新的被跟踪轨迹。程序已调通&#xff0c;可直接运行。 193 自适应轨迹跟踪算法 两轮驱动机器人 - 小红书 (xiaohongshu.com)

matplotlib如何设置中文为宋体,英文为新罗马Times New Roman

问题描述 论文附图通常需要将中文设置为宋体&#xff0c;英文设置为新罗马字体&#xff08;Times New Roman&#xff09;。matplotlib中可以这样设置字体&#xff1a; plt.rcParams[font.sans-serif] [SimSun] plt.rcParams[font.sans-serif] [Times New Roman]但是这样设置…

<DFS剪枝>数字王国之军训排队

其实就是将搜索过程一些不必要的部分直接剔除掉。 剪枝是回溯法的一种重要优化手段&#xff0c;往往需要先写一个暴力搜索&#xff0c;然后找到某些特殊的数学关系&#xff0c;或者逻辑关系&#xff0c;通过它们的约>束让搜索树尽可能浅而小&#xff0c;从而达到降低时间复杂…

绪论——算法设计原则【数据科学与工程算法基础】

一、题记 最近情绪不太稳定&#xff0c;些许烦躁&#xff0c;也就一直没践行前边说的“学习记录”的想法。现在开始做了&#xff0c;春华易逝&#xff0c;正当时&#xff0c;有想法就去做&#xff0c;踌躇懊悔是这个年纪最不该做的事。 二、前言 之前说了分块做这个系列&#x…

动态规划:4种遍历方向图解+Python实现

前言 动态规划类题型在遍历过程中&#xff0c;根据状态转移函数的不同&#xff0c;代码实现时遍历的方向也会有所差异。总的来说&#xff0c;一共可以总结为下图四种模式&#xff1a; 红色五角星表示当前要计算的状态值&#xff1b;白底箭头代表哪些状态要提前算出来&#xf…

VSCode ARM CortexM 开发

VSCode ARM CortexM 开发: http://coffeelatte.vip.cpolar.top/post/software/applications/vscode/vscode_arm_cortexm_开发/ 文章目录 VSCode ARM CortexM 开发: <http://coffeelatte.vip.cpolar.top/post/software/applications/vscode/vscode_arm_cortexm_%E5%BC%80%E5%…