Python数据可视化之条形图和热力图

news2024/9/26 5:22:25

Python数据可视化之条形图和热力图

提示:介绍
简单介绍Pthon可视化的图表使用


提示:热力图和条形图

文章目录

  • Python数据可视化之条形图和热力图
  • 前言
  • 一、导入数据包
  • 二、选择数据集
    • 2.加载数据
    • 2.读入数据
  • 总结


前言

提示:这里可以添加本文要记录的大概内容:

与往常一样,我们首先设置编码环境。


提示:以下是本篇文章正文内容,下面案例可供参考

一、导入数据包

import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")

设置完成

二、选择数据集

在本教程中,我们将使用美国交通部跟踪航班延误的数据集。

在 Excel 中打开此 CSV 文件会显示每个月的行(其中 1 = 一月,2 = 二月等)和每个航空公司代码的一列。
在这里插入图片描述
每个条目显示不同航空公司和月份(均为 2015 年)的平均到达延迟(以分钟为单位)。 负条目表示(平均)倾向于提前到达的航班。 例如,美国航空公司 1 月份的平均航班(航空公司代码:AA)大约晚点 7 分钟,而阿拉斯加航空公司 4 月份的平均航班(航空公司代码:AS)大约提前 3 分钟到达。

2.加载数据

和以前一样,我们使用 pd.read_csv 命令加载数据集。

# Path of the file to read
flight_filepath = "../input/flight_delays.csv"

# Read the file into a variable flight_data
flight_data = pd.read_csv(flight_filepath, index_col="Month")

您可能会注意到代码比我们在上一个教程中使用的代码略短。 在这种情况下,由于行标签(来自“月份”列)与日期不对应,所以我们不在括号中添加 parse_dates=True。 但是,我们像以前一样保留前两段文本,以提供两者:

数据集的文件路径(在本例中为 flight_filepath),以及
将用于索引行的列的名称(在本例中,index_col=“Month”)。

2.读入数据

代码如下(示例):

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

检查数据¶
由于数据集很小,我们可以很容易地打印出它的所有内容。 这是通过编写仅包含数据集名称的一行代码来完成的

# Print the data
flight_data

在这里插入图片描述
条形图
假设我们要创建一个条形图,按月显示 Spirit Airlines(航空公司代码:NK)航班的平均到达延误时间。

# Set the width and height of the figure
plt.figure(figsize=(10,6))

# Add title
plt.title("Average Arrival Delay for Spirit Airlines Flights, by Month")

# Bar chart showing average arrival delay for Spirit Airlines flights by month
sns.barplot(x=flight_data.index, y=flight_data['NK'])

# Add label for vertical axis
plt.ylabel("Arrival delay (in minutes)")

在这里插入图片描述

用于自定义文本(标题和垂直轴标签)和图形大小的命令与之前的教程相似。 创建条形图的代码是新的:

# Bar chart showing average arrival delay for Spirit Airlines flights by month
sns.barplot(x=flight_data.index, y=flight_data['NK'])

它包含三个主要组件:

sns.barplot - 这告诉笔记本我们要创建一个条形图。
请记住,sns 指的是 seaborn 包,您在本课程中用于创建图表的所有命令都将以此前缀开头。
x=flight_data.index - 这决定了在水平轴上使用什么。 在这种情况下,我们选择了索引行的列(在这种情况下,包含月份的列)。
y=flight_data[‘NK’] - 这会设置数据中用于确定每个条形高度的列。 在这种情况下,我们选择“NK”列。
重要说明:您必须使用 flight_data.index 选择索引列,并且不能使用 flight_data[‘Month’](这将返回错误)。 这是因为当我们加载数据集时,“月份”列用于索引行。 我们总是必须使用这种特殊的符号来选择索引列。

热图
我们还有另一种绘图类型需要了解:热图!

在下面的代码单元中,我们创建了一个热图来快速可视化 flight_data 中的模式。 每个单元格都根据其对应的值进行颜色编码。

# Set the width and height of the figure
plt.figure(figsize=(14,7))

# Add title
plt.title("Average Arrival Delay for Each Airline, by Month")

# Heatmap showing average arrival delay for each airline by month
sns.heatmap(data=flight_data, annot=True)

# Add label for horizontal axis
plt.xlabel("Airline")

在这里插入图片描述

#创建热图的相关代码如下
# Heatmap showing average arrival delay for each airline by month
sns.heatmap(data=flight_data, annot=True)

此代码包含三个主要组件:

sns.heatmap - 这告诉笔记本我们想要创建一个热图。
data=flight_data - 这告诉笔记本使用 flight_data 中的所有条目来创建热图。
annot=True - 这确保每个单元格的值都出现在图表上。 (忽略它会删除每个单元格中的数字!)
您可以在表中检测到哪些模式? 例如,如果你仔细观察,年底前的月份(尤其是 9-11 月份)对所有航空公司来说都显得相对黑暗。 这表明航空公司在这几个月里(平均而言)更善于保持航班时刻表!

总结

提示:总结:

以上就是今天要讲的内容,本文仅仅简单介绍了条形图个热力图的使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/175596.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Acwing 1010. 拦截导弹

Acwing 1010. 拦截导弹一、问题描述二、算法分析三、代码实现一、问题描述 二、算法分析 这道题共分为两问,我们先看第一问。 该问的背后是一个很经典的最长单调子序列模型。 在这个模型中,我们的状态f[i]f[i]f[i]的定义是,以第iii个元素为结…

Cert Manager 申请SSL证书流程及相关概念-三

中英文对照表 英文英文 - K8S CRD中文备注certificatesCertificate证书certificates.cert-manager.io/v1certificate issuersIssuer证书颁发者issuers.cert-manager.ioClusterIssuer集群证书颁发者clusterissuers.cert-manager.iocertificate requestCertificateRequest证书申…

50个你离不开的 CLI 工具

作为开发人员,我们在终端上花费了大量时间。有很多有用的 CLI 工具,它们可以让您在命令行中的生活更轻松、更快速,而且通常更有趣。这篇文章概述了我最依赖的 50 个必备 CLI 工具。如果我遗漏了什么 - 请在评论中告诉我 :)在本文的结尾&#…

二叉树专题汇总

二叉树的前中后序遍历day11|144.二叉树的前序遍历、145.二叉树的后序遍历、94.二叉树的中序遍历_奈川直子的博客-CSDN博客二叉树的层序遍历、翻转二叉树、对称二叉树day12|层序遍历合集、226.翻转二叉树、101.对称二叉树_奈川直子的博客-CSDN博客N叉树最大深度、完全二叉树节点…

LCHub:2023年无代码、低代码8大技术趋势

在数字化转型、新冠疫情、全球经济环境动荡等多因素驱动下,使得组织改变了对低代码、无代码的看法,市场规模和场景化落地实现快速增长。根据Gartner预测,到2025年,70%的应用程序将由低代码和无代码开发平台构建,其中 80%的应用程序由非IT工作者开发而成。 没有编程背景的…

青山不语,碧海无痕,数字山河间的中国脊梁

刚刚过去的2022,对于新农人来说,是不寻常的一年。福建宁德的渔民祖祖辈辈都以外出打鱼为生,渔排生活条件艰苦,娱乐匮乏,销路也不稳定,这种苦闷正随着AI、直播等数字新技术的到来而被消解。青海列卜加村的孙…

Arduino的nodemcu 8266开发板使用MicroPython开发的整体流程

程序安装准备 安装开发板驱动,官网:(https://cn.silabs.com/developers/usb-to-uart-bridge-vcp-drivers?tabdownloads)这里不是CH340驱动,而是CP210x USB to USART 驱动,最终也是在“设备管理器查看COM口…

【LeetCode:33. 搜索旋转排序数组~~~二分】

题目描述 整数数组 nums 按升序排列&#xff0c;数组中的值 互不相同 。 在传递给函数之前&#xff0c;nums 在预先未知的某个下标 k&#xff08;0 < k < nums.length&#xff09;上进行了 旋转&#xff0c;使数组变为 [nums[k], nums[k1], …, nums[n-1], nums[0], nu…

操作系统真相还原_第5章第1节:利用BIOS中断0x15 获取内存信息

文章目录功能号返回信息功能号详解子功能号&#xff1a;0xE820子功能号&#xff1a;0xE801子功能号&#xff1a;0x88内存检测示例当前内存分布说明程序boot.incmbr.sloader.s编译并写入硬盘启动bochs运行功能号 EAX0xE820&#xff1a;遍历主机上全部内存 AX0xE801&#xff1a;…

分享121个ASP源码,总有一款适合您

ASP源码 分享121个ASP源码&#xff0c;总有一款适合您 下面是文件的名字&#xff0c;我放了一些图片&#xff0c;文章里不是所有的图主要是放不下...&#xff0c; 121个ASP源码下载链接&#xff1a;https://pan.baidu.com/s/1wwsIoZidHihm5WHPKjlvMg?pwdew3b 提取码&#x…

如何在linux服务器部署sonar服务?

文章目录前言一、上传sonar插件二、设置sonar插件的权限三、启动插件四、配置环境变量前言 sonar服务是代码质量扫描的工具,我们如何利用sonar进行代码质量扫描还有在linux服务器上部署呢?下面这篇文章详细的记录了我在sonar的使用过程中所遇到的各种坑。 一、上传sonar插件…

十大经典排序算法【算法思想+图解+代码】【数据结构与算法笔记】

前言&#xff1a;文中大部分为本人收集整理&#xff0c;综合学习资料&#xff0c;个人理解……。希望能帮助你少掉写头发&#xff0c;早日走出理解的深渊。因为写作较为仓促文中内容难免会有纰漏&#xff0c;发现可评论区回复&#xff08;无奖&#xff09;。排序(Sort)分析排序…

StudioOne6旗舰版DAW2023跨版本升级新功能介绍

PreSonus2023发布了Studio One 6旗舰级DAW的跨版本升级。他们获奖的DAW软件的这一最新版本引入了大量的新功能和增强功能&#xff0c;包括用户界面的定制选项&#xff0c;PreSonus说这使第6版成为他们迄今为止最个性化的升级。PreSonus发布了旗舰级DAW的跨版本升级&#xff0c;…

Leetcode:131. 分割回文串(C++)

目录 问题描述&#xff1a; 实现代码与解析&#xff1a; 回溯&#xff1a; 原理思路&#xff1a; 问题描述&#xff1a; 给你一个字符串 s&#xff0c;请你将 s 分割成一些子串&#xff0c;使每个子串都是 回文串 。返回 s 所有可能的分割方案。 回文串 是正着读和反着读都…

客快物流大数据项目(一百零六):实时ETL处理

文章目录 实时ETL处理 一、业务流程 二、​​

Kettle简介

一、Kettle基本介绍 Kettle(现更名为Pentaho Data Integration-Pentaho)是一款国外开源的ETL工具&#xff0c;纯java编写&#xff0c;可以在Window、Linux、Unix上运行&#xff0c;绿色无需安装。它允许你管理来自不同数据库的数据&#xff0c;通过提供一个图形化的用户环境来…

盒模型应用 改变宽高范围 改变背景覆盖范围 溢出处理 断词规则 空白处理

目录盒模型应用改变宽高范围改变背景覆盖范围溢出处理断词规则 word-break空白处理 溢出的空白处理盒模型应用 改变宽高范围 默认情况下&#xff0c;width 和 height 设置的是内容盒宽高。 页面重构师&#xff1a;将psd文件&#xff08;设计稿&#xff09;制作为静态页面 衡量…

【竞赛题】6297. 根据第 K 场考试的分数排序

题目 班里有 m 位学生&#xff0c;共计划组织 n 场考试。给你一个下标从 0 开始、大小为 m x n 的整数矩阵 score &#xff0c;其中每一行对应一位学生&#xff0c;而 score[i][j] 表示第 i 位学生在第 j 场考试取得的分数。矩阵 score 包含的整数 互不相同 。 另给你一个整数…

【机器学习】多标签分类

目录&#xff1a;多标签分类一、算法1.1 One-vs-Rest1.2 AdaBoost-MH1.3 ML-KNN一、算法 多标签分类的适用场景较为常见&#xff0c;比如&#xff0c;一份歌单可能既属于标签旅行也属于标签驾车。有别于多分类分类&#xff0c;多标签分类中每个标签不是互斥的。多标签分类算法…

Python使用K-means聚类分析

Python使用K-means聚类分析 文章目录Python使用K-means聚类分析介绍1.集群标签作为特征一、k-均值聚类二、示例 - 加州住房2.KMeans总结介绍 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 本文将使用所谓的无监督学习算法。 无监督算法不使用目标&#xff…