seaborn库图形进行数据分析(基于tips数据集)

news2024/9/22 9:38:40

Seaborn 是一个基于 matplotlib 的数据可视化库,可以用来绘制各种统计图表,包括散点图、条形图、折线图、箱线图等。Seaborn 提供了一些用于美化图表的默认样式和颜色主题,使得生成的图表更具有吸引力。下面是一些 Seaborn 库的常用功能和用法。

import seaborn as sns#seaborn图形进行数据分析
df=sns.load_dataset('tips')
df.head()#显示前五行
'''结果:
 	total_bill 	tip 	sex 	smoker 	day 	time 	size
0 	16.99 	  1.01  	Female 	   No 	Sun 	Dinner 	 2
1 	10.34 	  1.66 	    Male 	   No 	Sun 	Dinner 	 3
2 	21.01 	  3.50  	Male 	   No 	Sun 	Dinner 	 3
3 	23.68 	  3.31  	Male 	   No 	Sun 	Dinner 	 2
4 	24.59 	  3.61 	    Female 	   No 	Sun 	Dinner 	 4
'''

df
'''结果:
 	total_bill 	tip 	sex 	smoker 	day 	time 	size
0 	   16.99 	1.01  	Female 	No  	Sun 	Dinner 	 2
1 	   10.34 	1.66 	Male 	No  	Sun 	Dinner 	 3
2 	   21.01 	3.50  	Male 	No  	Sun 	Dinner 	 3
3 	   23.68 	3.31  	Male 	No 	    Sun 	Dinner 	 2
4 	   24.59 	3.61 	Female 	No 	    Sun 	Dinner 	 4
... 	... 	... 	... 	... 	... 	... 	...
239 	29.03 	5.92 	Male 	No 	    Sat 	Dinner 	 3
240 	27.18 	2.00 	Female 	Yes 	Sat 	Dinner 	 2
241 	22.67 	2.00 	Male 	Yes 	Sat 	Dinner 	 2
242 	17.82 	1.75 	Male 	No 	    Sat 	Dinner 	 2
243 	18.78 	3.00 	Female 	No 	    Thur 	Dinner 	 2

244 rows × 7 columns
'''

df.dtypes
'''结果:
total_bill     float64
tip            float64
sex           category
smoker        category
day           category
time          category
size             int64
dtype: object'''

 1、相关性

df.corr()#三个字段的相关性
'''结果:
 	        total_bill 	tip 	     size
total_bill 	1.000000 	0.675734 	0.598315
tip 	    0.675734 	1.000000 	0.489299
size 	    0.598315 	0.489299 	1.000000'''
sns.heatmap(df.corr())#用热区图来表示相关性

 

2、变量分析

sns.jointplot(x='tip',y='total_bill',data=df,kind='hex')#单变量分析,kind用什么表示,该图是蜂窝表示

sns.jointplot(x='tip',y='total_bill',data=df,kind='reg')#单变量分析,该图是用回归表示

 

sns.pairplot(df)#匹配图,在同一数据行中,一个变量与另一个变量的值相匹配,最后显示所有变量与所有其它变量的匹配

 

sns.pairplot(df,hue='sex')#多加一个变量

 

 

sns.pairplot(df,hue='smoker')#多加一个变量

三、统计数 

df['smoker'].value_counts()
'''结果:
No     151
Yes     93
Name: smoker, dtype: int64
'''

df['sex'].value_counts()
'''结果:
Male      157
Female     87
Name: sex, dtype: int64
'''
sns.countplot(x='sex',data=df)

 

sns.countplot(y='sex',data=df)

 

四、 特征值分布

sns.distplot(df['tip'])#帮助我们检查单特征分布,比例

 

sns.distplot(df['tip'],kde=False,bins=20)#帮助我们检查单特征分布,数量

五、多变量

sns.barplot(x='sex',y='total_bill',data=df)#两变量做x,y轴,柱状图

 

sns.boxplot(x='day',y='total_bill',data=df,palette='rainbow')#盒图,palette调色板

sns.boxplot(data=df,orient='v')#垂直

sns.boxplot(x='day',y='total_bill',hue='smoker',data=df)#盒图,三变量

sns.violinplot(x="total_bill",y="day",data=df,palette="rainbow")#小提琴图,帮助我们从核密度估计和箱型图两方面看到数据发布

sns.violinplot(y="total_bill",x="day",data=df,palette="rainbow")#小提琴图,帮助我们从核密度估计和箱型图两方面看到数据发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1316263.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

性能测试基础知识总结

1、CPU 使用率 除了空闲时间外的其他时间占总 CPU 时间的百分比,就是CPU 使用率,即 1- 空闲时间/CPU 总时间。 当计算 CPU 使用率时,我们通常使用 /proc/stat 文件中的数据。该文件提供了有关 CPU 的计数器信息,包括各种状态下的…

HPM6750系列--第九篇 GPIO详解(基本操作)

一、目的 在之前的博文中我们主要介绍了不同系统不同开发编译调试环境的配置和操作(命令行方式、Visual Studio Code、Segger Embedded Studio for RISC-V),以帮助大家准备好学习环境为目的,但是未涉及到芯片本身以及外设的讲解。…

CCF编程能力等级认证GESP—C++2级—20230318

CCF编程能力等级认证GESP—C2级—20230318 单选题(每题 2 分,共 30 分)判断题(每题 2 分,共 20 分)编程题 (每题 25 分,共 50 分)画三角形百鸡问题 答案及解析单选题判断题编程题1编程题2 单选题…

【MySQL学习之基础篇】概述

文章目录 1. mysql的启动和停止命令2. 客户端连接3. 数据模型 1. mysql的启动和停止命令 通过指令启动或停止,以管理员身份运行cmd,进入命令行执行如下指令: (1)启动myaql net start mysql(2)…

解决App Store上架提示您必须上传 12.9 英寸 iPad Pro(第 2 代)显示屏的截屏

出错场景 在App Store Connect中,上架App时,出现以下错误提示. 要开始审核流程,必须提供以下项目:您必须上传 12.9 英寸 iPad Pro(第 2 代)显示屏的截屏。(2048,2732)您…

netty-daxin-2(netty常用事件讲解)

文章目录 netty常用事件讲解ChannelHandler接口ChannelHandler适配器类ChannelInboundHandler 子接口Channel 的状态调用时机ChannelHandler 生命周期示例NettServer&CustomizeInboundHandlerNettyClient测试分析 ChannelInboundHandlerAdapter适配器类SimpleChannelInboun…

【MySQL学习之基础篇】多表查询

文章目录 1. 多表关系1.1. 一对多1.2. 多对多1.3. 一对一 2. 多表查询概述2.1. 数据准备2.2. 概述 3. 查询的分类3.1. 内连接查询3.2. 外连接查询3.3. 自连接3.3.1. 自连接查询3.3.2. 联合查询 3.4. 子查询3.4.1. 概述3.4.2. 标量子查询3.4.3. 列子查询3.4.4. 行子查询3.4.5. 表…

等等Domino 14.0FP1

大家好,才是真的好。 节奏确实太快了,有时候我深感我也追不上。 以前Notes Domino是三年磨一剑,也就说每三年才发一个大版本,从2019年开始,进行了高频提速,居然一年一个大版本! 周末&#xf…

vue-json-excel 在导出一行a-table明细后再去导出另一行明细但导出结果还是和第一次一样

通过接口等拿到数据后要使用setTimeout稍微延时下再去触发导出,不然数还未更新就导出了

分库分表以后,如何实现扩容?

在实际开发中,数据库的扩容和不同的分库分表规则直接相关,今天我们从系统设计的角度,抽象了一个项目开发中出现的业务场景,从数据库设计、路由规则,以及数据迁移方案的角度进行讨论。 从业务场景出发进行讨论 假设这…

LeetCode(60)K 个一组翻转链表【链表】【困难】

目录 1.题目2.答案3.提交结果截图 链接: K 个一组翻转链表 1.题目 给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。 k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍&#xf…

1231. 航班时间(整行字符串输入:getline(cin,line))

题目: 1231. 航班时间 - AcWing题库 输入样例: 3 17:48:19 21:57:24 11:05:18 15:14:23 17:21:07 00:31:46 (1) 23:02:41 16:13:20 (1) 10:19:19 20:41:24 22:19:04 16:41:09 (1)输出样例: 04:09:05 12:10:39 14:22:05 思路: …

Jmeter分布式性能测试,80%资深测试都会遇到这个坑!

📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!📢交流讨论:欢迎加入我们一起学习!📢资源分享:耗时200小时精选的「软件测试」资…

鸿蒙HarmonyOS4.0 入门与实战

一、开发准备: 熟悉鸿蒙官网安装DevEco Studio熟悉鸿蒙官网 HarmonyOS应用开发官网 - 华为HarmonyOS打造全场景新服务 应用设计相关资源: 开发相关资源: 例如开发工具 DevEco Studio 的下载 应用发布: 开发文档:

PMP项目管理 - 质量管理

系列文章目录 现在的一切都是为将来的梦想编织翅膀,让梦想在现实中展翅高飞。 Now everything is for the future of dream weaving wings, let the dream fly in reality. PMP项目管理 - 质量管理 系列文章目录一、规划质量管理 - 关注工作需要达到的质量二、管理…

爆火的“数字人”,你还不知道吗?

数字人是一种基于人工智能技术创建的虚拟实体,具有高度智能化和交互性。他们可以像真正的人类一样思考、学习和表达情感,与人类进行对话和互动。数字人的出现在电影中已经有了一些令人难忘的片段。 首先,值得一提的是电影《阿凡达》中的数字…

maui中实现加载更多 RefreshView跟ListView(1)

效果如图: MainPage.xaml.cs: using System; using System.Collections.ObjectModel; using System.Threading.Tasks; using Microsoft.Maui.Controls; using Microsoft.Maui.Controls.Xaml; using System.ComponentModel; using System.Runtime.CompilerServices…

基于Java SSM框架实现智能停车场系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现智能停车场系统演示 摘要 本论文主要论述了如何使用JAVA语言开发一个智能停车场管理系统,本系统将严格按照软件开发流程进行各个阶段的工作,采用B/S架构,面向对象编程思想进行项目开发。在引言中,作者将论述…

【KMP】【判断是否是重复子字符串】Leetcode 459 重复的子字符串

【KMP】【判断是否是重复子字符串】Leetcode 459 重复的子字符串 解法1 拼接字符串-掐头去尾后判断是否含有原字符串解法2 KMP——重复子串的最小单位是这个字符串里的最长相等前后缀所不包含的子串解法3 暴力解法KMP ---------------🎈🎈题目链接&…

编译 pywinhook v1.6.2 的环境设置和步骤

准备做一个鼠标事件响应程序。 查了一下相关python的第三方类库,发现有 pyhook。 一、起源 pyhook 1、pyhook是最早的版本 pyhook支持的python版本比较低,代码在 https://sourceforge.net/projects/pyhook/ 2、之后产生了两个并行版本 pyHook3 和 p…