51个图表,完美展示数据分布关系!

news2024/11/24 17:02:36

本节介绍seaborn展示数据分布关系的图表(Distribution plots)的实现,该类图表用于展示数据集的分布规律,帮助快速获取数据多方面信息,例如,观测值的范围、中心趋势、是否存在某个方向上严重偏斜、是否存在双峰性、是否存在显著的异常值等等。

分布关系的图表包含:直方图、核密度估计(KDE)图、累积曲线图和轴须图(rug plot)。


直方图

直方图旨在通过分箱和计数观测值来近似生成数据的概率密度函数。

例如,堆积叠加直方图,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='hist',
    hue="企鹅的种类",  #hue指定分组
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    multiple="stack")  #堆叠叠加

例如,百分比堆积,每个箱子中各组百分比累加为1,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='hist',
    hue="企鹅的种类",  #hue指定分组
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    multiple="fill")  #百分比堆积


核密度估计图

核密度估计(KDE)图功能类似上文8.1 章节的直方图,区别于直方图使用离散箱,KDE图使用高斯核(Gaussian kernel)对观测值进行平滑处理,生成连续的密度估计,KDE图更清晰且更易解释。

例如,图层叠加,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='kde',
    hue="岛屿",  #按照变量"岛屿"分组
    fill=True,
    multiple="layer",  #指定按照'layer'叠加
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
)

例如,堆积叠加,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='kde',
    hue="岛屿",
    fill=True,
    multiple="stack",  #"stack"设置堆积叠加
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
)

例如,百分比叠加,

sns.displot(
    penguins,
    x="鳍长 (毫米)",
    kind='kde',
    hue="岛屿",
    fill=True,
    multiple="fill",  #"fill"设置百分比叠加
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
)


累积曲线图

累积曲线图,全称“经验累积分布函数”(ecdf,empirical cumulative distribution functions),反映数据集中小于某值的观测比例,提供直观的分布图。

 例如,分组累积曲线图,

sns.displot(data=penguins,
            x="鳍长 (毫米)",
            hue="企鹅的种类", # hue设置分组
            kind="ecdf",
            palette=["#006a8e", "#b1283a", "#a8a6a7"])

例如,补集累积分布函数,

sns.displot(
    data=penguins,
    x="鳍长 (毫米)",
    hue="企鹅的种类",
    complementary=True,  #complementary开启补集累积分布函数complementary CDF (1 - CDF)
    kind="ecdf",
    palette=["#006a8e", "#b1283a", "#a8a6a7"])


轴须图

轴须图(rug plot)通过在x轴和y轴上绘制刻度以显示变量的位置,以补充其他图表。

例如,散点图和轴须图一起用,

sns.scatterplot(#使用axes-level方法:如上文的scatterplot()、lineplot()等
    data=penguins,  
    x="鳍长 (毫米)",
    y="喙长 (毫米)",
    hue="企鹅的种类",
    style="企鹅的种类",
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    s=200)
sns.rugplot(
    data=penguins,
    x="鳍长 (毫米)",  #x轴轴须图
    y="喙长 (毫米)",  #y轴轴须图
    hue="企鹅的种类",
    palette=["#006a8e", "#b1283a", "#a8a6a7"],
    legend=False  #关闭轴轴须图图例
)

再例如,kde图和轴须图一起使用,

sns.kdeplot(#使用axes-level方法:kdeplot()
    data=penguins,  
    x="鳍长 (毫米)",  #x轴轴须图
    hue="企鹅的种类",
    fill=True,
    multiple="layer",
    palette=["#006a8e", "#b1283a", "#a8a6a7"])
sns.rugplot(data=penguins,
            x="鳍长 (毫米)",
            hue="企鹅的种类",
            palette=["#006a8e", "#b1283a", "#a8a6a7"],
            legend=False)  #关闭轴轴须图图例


直方图、核密度估计(KDE)图、累积曲线图和轴须图(rug plot)更多变种,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1879598.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

每日一题(6.22-6.28)

(。・∀・)ノ゙嗨,中途考电路分析去了,空了几天的题没有练,为什么三相电路他都没讲过的都要考啊?我服了,什么在Y型三相电路,线电压和相电压的比值都考&…

Hadoop3:Yarn容量调度器配置多队列案例

一、情景描述 需求1: default队列占总内存的40%,最大资源容量占总资源60%,hive队列占总内存的60%,最大资源容量占总资源80%。 二、多队列优点 (1)因为担心员工不小心,写递归死循环代码&#…

扛鼎中国AI搜索,天工凭什么?

人类的创作不会没有瓶颈,但AI的热度可不会消停。 大模型之战依旧精彩,OpenAI选择在Google前一天举行发布会,两家AI企业之间的拉扯赚足了热度。 反观国内,百模大战激发了大家对于科技变革的热切期盼,而如今行业已逐渐…

20240628每日前端---------解决vue项目滥用watch

主题 滥用watch。 名字解释 watch 例子 先看一个代码例子&#xff1a; <template>{{ dataList }} </template><script setup lang"ts"> import { ref, watch } from "vue";const dataList ref([]); const props defineProps([&q…

MySQL高级-SQL优化-insert优化-批量插入-手动提交事务-主键顺序插入

文章目录 1、批量插入1.1、大批量插入数据1.2、启动Linux中的mysql服务1.3、客户端连接到mysql数据库&#xff0c;加上参数 --local-infile1.4、查询当前会话中 local_infile 系统变量的值。1.5、开启从本地文件加载数据到服务器的功能1.6、创建表 tb_user 结构1.7、上传文件到…

笔记本电脑安装CentOS

正文共&#xff1a;1234 字 24 图&#xff0c;预估阅读时间&#xff1a;2 分钟 前面我们对VPP进行了多次介绍&#xff08;羡慕&#xff01;大佬的VPP能达到180G性能&#xff0c;而我的却只有13.5G&#xff09;&#xff0c;可以发现他的很多优点&#xff0c;但是我们也可以发现它…

从源码分析Springboot自动配置原理

一、什么是Springboot的自动配置 Spring Boot自动配置&#xff08;Auto-configuration&#xff09;是Spring Boot框架的核心特性之一&#xff0c;它使得开发者可以更容易地创建基于Spring的应用程序&#xff0c;而无需进行大量的手动配置。自动配置基于开发者添加的jar依赖项来…

Nuxt3 的生命周期和钩子函数(六)

title: Nuxt3 的生命周期和钩子函数&#xff08;六&#xff09; date: 2024/6/30 updated: 2024/6/30 author: cmdragon excerpt: 摘要&#xff1a;本文深入解析了Nuxt3框架中的多个核心生命周期钩子和组件注册功能&#xff0c;包括imports:sources、imports:extend、import…

【Qt】之【Bug】大量出现“未定义的标识符”问题

背景 构建时出现大量错误 原因 中文注释问题 解决 方法1. 报错代码附近的中文注释全部删掉。。。 方法2. 报错的文件添加 // Chinese word comment solution #pragma execution_character_set("utf-8")

2024年【安全生产监管人员】考试资料及安全生产监管人员考试总结

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 安全生产监管人员考试资料是安全生产模拟考试一点通生成的&#xff0c;安全生产监管人员证模拟考试题库是根据安全生产监管人员最新版教材汇编出安全生产监管人员仿真模拟考试。2024年【安全生产监管人员】考试资料及…

算法力扣刷题 二十六【459.重复的子字符串】

前言 字符串篇&#xff0c;继续。 记录 二十六【459.重复的子字符串】 一、题目阅读 给定一个非空的字符串 s &#xff0c;检查是否可以通过由它的一个子串重复多次构成。 示例 1: 输入: s "abab" 输出: true 解释: 可由子串 "ab" 重复两次构成。示例…

录取查询怎么公布?

这篇文章对于教育工作者来说非常有用&#xff0c;提供了关于如何公布学生录取情况的多种方法和注意事项。以下是对您文章的一些补充和建议&#xff1a; 1.易查分的使用&#xff1a;易查分系统是一个很好的工具&#xff0c;特别是对于那些不擅长技术开发的老师。它简化了查询过程…

40 - 餐馆营业额变化增长(高频 SQL 50 题基础版)

40 - 餐馆营业额变化增长 -- 方法一 SELECT t.visited_on,sum(c.amount) amount,ROUND(sum(c.amount) / 7, 2) average_amount FROM customer c,-- 查出足够7天的数据日期(SELECT DISTINCT visited_onFROM customerWHERE visited_on >(SELECT ADDDATE(MIN(visited_on), 6) F…

Nginx-2

一、高级配置 1.1网页状态页 基于nginx 模块 ngx_http_stub_status_module 实现&#xff0c;在编译安装nginx的时候需要添加编译参数 --with-http_stub_status_module&#xff0c;否则配置完成之后监测会是提示语法错误注意: 状态页显示的是整个服务器的状态,而非虚拟主机的状…

半个月从几十升粉到500(发红包喽)

目录 1. 背景2. 涨粉秘籍2.1 持续创作高质量内容2.1.1 保持频率2.1.2 技术文章为主2.1.3 图文并茂 2.2 积极参与社区活动2.2.1 社区分享2.2.2 发文活动 2.3 互动与建立信任2.3.1 与读者互动2.3.2 红包互动2.3.3 动态分享 2.4 标题与内容的优化2.4.1 标题吸引2.4.2 内容实用 2.5…

高效办公秘诀:使用Excel超级处理器提高工作效率,提升职场竞争力

在现今快节奏的工作环境中&#xff0c;如何高效地完成工作任务&#xff0c;减少加班时间&#xff0c;成为了许多职场人士关注的焦点。其中&#xff0c;Excel作为一款功能强大的电子表格软件&#xff0c;被广泛应用于数据处理、分析以及报表制作等领域。然而&#xff0c;仅仅依赖…

C++ sizeof的各种

C sizeof的各种 1. 含有虚函数的类对象的空间大小2. 虚拟继承的类对象的空间大小3. 普通变量所占空间大小4. 复合数据类型&#xff08;结构体和类&#xff09;5. 数组6. 类型别名7. 动态分配内存8. 指针9. 静态变量10. 联合体11. 结构体使用#program pack 1. 含有虚函数的类对象…

Linux多进程和多线程(三)进程间通讯-信号处理方式和自定义处理函数

进程间通信之信号 信号信号的种类 信号在操作系统中的定义如下: 信号的处理流程在 Linux 中对信号的处理⽅式 自定义信号处理函数 信号的发送 kill() 函数:raise() 函数: 示例 : 创建⼀个⼦进程&#xff0c;⼦进程通过信号暂停&#xff0c;⽗进程发送 终⽌信号等待信号 pause()…

mysql解压版本安装5.7

1. 官网下载好解压版本 我这边5.7版本 https://dev.mysql.com/downloads/file/?id523570 mysql官网 创建 my.ini文件 内容如下 [client] #客户端设置&#xff0c;即客户端默认的连接参数# socket /data/mysqldata/3306/mysql.sock #用于本地连接的socket套接字 # 默…

Nginx和CDN运用

一.Web缓存代理 1.工作机制 代替客户机向网站请求数据&#xff0c;从而可以隐藏用户的真实IP地址。将获得的网页数据&#xff08;静态Web元素&#xff09;保存到缓存中并发送给客户机&#xff0c;以便下次请求相同的数据时快速响应。 2.代理服务器的概念 代理服务器是一个位…