数据分析三剑客之Matplotlib

news2025/1/20 15:54:41

0.Matplotlib绘图和可视化

1.简介

我的前面两篇文章介绍了 Nimpy ,Pandas 。今天来介绍一下Matplotlib。

简单来说,Matplotlib 是 Python 的一个绘图库。它包含了大量的工具,你可以使用这些工具创建各种图形,包括简单的散点图,正弦曲线,甚至是三维图形。Python 科学计算社区经常使用它完成数据可视化的工作。

你可以在他们的网站上了解到更多 Matplotlib 背后的设计思想,但是我强烈建议你先浏览一下他们的图库,体会一下这个库的各种神奇功能。

2.画一个简单的图形

In [1]: import matplotlib.pyplot as plt

In [2]: import numpy as np

In [3]: x = np.linspace(0, 2 * np.pi, 50)

In [6]: plt.plot(x, np.sin(x))
Out[6]: [<matplotlib.lines.Line2D at 0x1dcdc98a748>]

In [7]: plt.show()

上面的代码将画出一个简单的正弦曲线。np.linspace(0, 2 * np.pi, 50)这段代码将会生成一个包含 50 个元素的数组,这 50 个元素均匀的分布在 [0, 2pi] 的区间上。

plot命令以一种简洁优雅的方式创建了图形。提醒一下,如果没有第一个参数 x,图形的 x 轴坐标将不再是 0 到 2pi,而应该是数组的索引范围。

最后一行代码 plt.show()将图形显示出来,如果没有这行代码图像就不会显示。

运行代码后应该会类似得到下面的图形:

3.在一张图上绘制两个数据集

大多数时候读者可能更想在一张图上绘制多个数据集。用 Matplotlib 也可以轻松实现这一点。

In [15]: x = np.linspace(0, 2 * np.pi, 50)

In [16]: plt.plot(x, np.sin(x), x, np.sin(2*x))
Out[16]:
[<matplotlib.lines.Line2D at 0x1dcdb38a080>,
 <matplotlib.lines.Line2D at 0x1dcdb38a1d0>]

In [17]: plt.show()

上面的代码同时绘制了表示函数 sin(x) 和 sin(2x) 的图形。这段代码和前面绘制一个数据集的代码几乎完全相同,只有一点例外,这段代码在调用plt.plot()的时候多传入了一个数据集,并用逗号与第一个数据集分隔开。

最后你会得到类似于下面包含两条曲线的图形:

4.自定义图形的外观

当在同一个图形上展示多个数据集时,通过改变线条的外观来区分不同的数据集变得非常必要。

In [18]: x = np.linspace(0, 2*np.pi, 50)

In [19]: plt.plot(x, np.sin(x), 'r-o', x, np.cos(x), 'g--')
Out[19]:
[<matplotlib.lines.Line2D at 0x1dcdb695898>,
 <matplotlib.lines.Line2D at 0x1dcdb695a20>]

In [20]: plt.show()

上述代码展示了两种不同的曲线样式:'r-o' 和 'g--'。字母 'r' 和 'g' 代表线条的颜色,后面的符号代表线和点标记的类型。例如 '-o' 代表包含实心点标记的实线,'--' 代表虚线。其他的参数需要读者自己去尝试,这也是学习 Matplotlib 最好的方式。

颜色: 蓝色 - 'b' 绿色 - 'g' 红色 - 'r' 青色 - 'c' 品红 - 'm' 黄色 - 'y' 黑色 - 'k'('b'代表蓝色,所以这里用黑色的最后一个字母) 白色 - 'w' 线: 直线 - '-' 虚线 - '--' 点线 - ':' 点划线 - '-.' 常用点标记 点 - '.' 像素 - ',' 圆 - 'o' 方形 - 's' 三角形 - '^' 

更多点标记样式点击这里

最后你会得到类似下面的图形:

5.使用子图

使用子图可以在一个窗口绘制多张图。

In [21]: x = np.linspace(0, 2*np.pi, 50)

In [22]: plt.subplot(2, 1, 1)   # (行,列,活跃区)
Out[22]: <matplotlib.axes._subplots.AxesSubplot at 0x1dcdb6ba978>

In [23]: plt.plot(x, np.sin(x), 'r')
Out[23]: [<matplotlib.lines.Line2D at 0x1dcdb7316d8>]

In [24]: plt.subplot(2, 1, 2)
Out[24]: <matplotlib.axes._subplots.AxesSubplot at 0x1dcdb731ba8>

In [25]: plt.plot(x, np.cos(x), 'g')
Out[25]: [<matplotlib.lines.Line2D at 0x1dcdb77bfd0>]

In [26]: plt.show()

使用子图只需要一个额外的步骤,就可以像前面的例子一样绘制数据集。即在调用 plot() 函数之前需要先调用 subplot() 函数。该函数的第一个参数代表子图的总行数,第二个参数代表子图的总列数,第三个参数代表活跃区域。

活跃区域代表当前子图所在绘图区域,绘图区域是按从左至右,从上至下的顺序编号。例如在 4×4 的方格上,活跃区域 6 在方格上的坐标为 (2, 2)。

最终你会得到类似下面的图形:

散点图是一堆离散点的集合。用 Matplotlib 画散点图也同样非常简单。

In [27]: x = np.linspace(0, 2*np.pi, 50)

In [28]: y = np.sin(x)

In [29]: plt.scatter(x, y)
Out[29]: <matplotlib.collections.PathCollection at 0x1dcddb706a0>

In [30]: plt.show()

正如上面代码所示,你只需要调用 scatter() 函数并传入两个分别代表 x 坐标和 y 坐标的数组。注意,我们通过 plot 命令并将线的样式设置为 'bo' 也可以实现同样的效果。

最后你会得到类似下面的无线图形:

7.彩色映射散点图

另一种你可能用到的图形是彩色映射散点图。这里我们会根据数据的大小给每个点赋予不同的颜色和大小,并在图中添加一个颜色栏。

In [31]: x = np.random.rand(1000)

In [32]: y = np.random.rand(1000)

In [33]: size = np.random.rand(1000) * 50

In [34]: colour = np.random.rand(1000)

In [35]: plt.scatter(x, y, size, colour)
Out[35]: <matplotlib.collections.PathCollection at 0x1dcdde984e0>

In [36]: plt.colorbar()
Out[36]: <matplotlib.colorbar.Colorbar at 0x1dcddece0b8>

In [37]: plt.show()

上面的代码大量的用到了 np.random.rand(1000),原因是我们绘图的数据都是随机产生的。

同前面一样我们用到了 scatter() 函数,但是这次我们传入了另外的两个参数,分别为所绘点的大小和颜色。通过这种方式使得图上点的大小和颜色根据数据的大小产生变化。

然后我们用 colorbar() 函数添加了一个颜色栏。

最后你会得到类似于下面的彩色散点图:

8.直方图

直方图是另一种常见的图形,也可以通过几行代码创建出来。

In [38]: x = np.random.randn(1000)

In [39]: plt.hist(x, 50)
Out[39]:
(array([ 2.,  0.,  0.,  1.,  2.,  2.,  1.,  0.,  1.,  1.,  9.,  6., 11.,
        16., 20., 18., 23., 26., 34., 25., 42., 31., 52., 40., 38., 56.,
        35., 49., 49., 41., 44., 46., 46., 31., 30., 32., 26., 24., 24.,
        16.,  8.,  5., 12.,  4.,  4.,  5.,  2.,  7.,  2.,  1.]),
 array([-3.32384545, -3.20164134, -3.07943724, -2.95723314, -2.83502904,
        -2.71282494, -2.59062084, -2.46841674, -2.34621264, -2.22400854,
        -2.10180443, -1.97960033, -1.85739623, -1.73519213, -1.61298803,
        -1.49078393, -1.36857983, -1.24637573, -1.12417163, -1.00196752,
        -0.87976342, -0.75755932, -0.63535522, -0.51315112, -0.39094702,
        -0.26874292, -0.14653882, -0.02433471,  0.09786939,  0.22007349,
         0.34227759,  0.46448169,  0.58668579,  0.70888989,  0.83109399,
         0.95329809,  1.0755022 ,  1.1977063 ,  1.3199104 ,  1.4421145 ,
         1.5643186 ,  1.6865227 ,  1.8087268 ,  1.9309309 ,  2.05313501,
         2.17533911,  2.29754321,  2.41974731,  2.54195141,  2.66415551,
         2.78635961]),
 <a list of 50 Patch objects>)

In [40]: plt.show()

直方图是 Matplotlib 中最简单的图形之一。你只需要给 hist() 函数传入一个包含数据的数组。第二个参数代表数据容器的个数。数据容器代表不同的值的间隔,并用来包含我们的数据。数据容器越多,图形上的数据条就越多。

最终你会得到类似下面的直方图:

9.标题,标签和图例

当需要快速创建图形时,你可能不需要为图形添加标签。但是当构建需要展示的图形时,你就需要添加标题,标签和图例。

In [41]: x = np.linspace(0, 2*np.pi, 50)

In [42]: plt.plot(x, np.sin(x), 'r-x', label='Sin(x)')
Out[42]: [<matplotlib.lines.Line2D at 0x1dcde55db00>]

In [43]: plt.plot(x, np.cos(x), 'g-^', label='Cos(x)')
Out[43]: [<matplotlib.lines.Line2D at 0x1dcde282ac8>]

In [44]: plt.legend()  # 展示图例
Out[44]: <matplotlib.legend.Legend at 0x1dcde282dd8>

In [45]: plt.xlabel('Rads')  # 给x轴添加标签
Out[45]: Text(0.5,0,'Rads')

In [46]: plt.ylabel('Amplitude')  # 给y轴添加标签
Out[46]: Text(0,0.5,'Amplitude')

In [47]: plt.title('Sin and Cos Waves')  # 添加图形标题
Out[47]: Text(0.5,1,'Sin and Cos Waves')

In [48]: plt.show()

为了给图形添加图例,我们需要在 plot() 函数中添加命名参数 'label' 并赋予该参数相应的标签。然后调用 legend() 函数就会在我们的图形中添加图例。

接下来我们只需要调用函数 title()xlabel() 和 ylabel() 就可以为图形添加标题和标签。

你会得到类似于下面这张拥有标题、标签和图例的图形:

10.饼图

饼图阴影、分裂等属性设置:

# labels参数设置每一块的标签;

# labeldistance参数设置标签距离圆心的距离(比例值)

# autopct参数设置比例值小数保留位(%.3f%%);

# pctdistance参数设置比例值文字距离圆心的距离

# explode参数设置每一块顶点距圆心的长度(比例值,列表);

# colors参数设置每一块的颜色(列表);

# shadow参数为布尔值,设置是否绘制阴影

# startangle参数设置饼图起始角度

饼图适合展示各部分占总体的比例,条形图适合比较各部分的大小

In [51]: x = [11, 22, 33, 44]

In [52]: plt.pie(x, labels=['a', 'b', 'c', 'd'])
Out[52]:
([<matplotlib.patches.Wedge at 0x1dcde8894a8>,
  <matplotlib.patches.Wedge at 0x1dcde8899b0>,
  <matplotlib.patches.Wedge at 0x1dcde889e80>,
  <matplotlib.patches.Wedge at 0x1dcde891390>],
 [Text(1.04616,0.339919,'a'),
  Text(0.339919,1.04616,'b'),
  Text(-1.04616,0.339919,'c'),
  Text(0.339919,-1.04616,'d')])

In [53]: plt.show()

最终你会得到类似下面的饼图:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1007501.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java多线程并发面试题

文章目录 Java并发基础并行和并发有什么区别&#xff1f;说说什么是进程和线程&#xff1f;Java线程创建方式&#xff1f;Runnable和Callable接口的区别&#xff1f;为什么调用start()方法时会执行run()方法&#xff0c;不直接调用run()方法&#xff1f;sleep()和wait()的区别&…

预约陪诊就诊小程序源码多城市开发版

陪诊小程序多城市版开发 小程序支持多城市开通&#xff0c;支持创建陪诊团队以及提成奖励设置&#xff0c;可以定义多种服务类型&#xff0c;订单流程简单明了&#xff0c;支持陪诊师手机端订单处理&#xff0c;家政类目可以轻松过审。 小程序市场前景&#xff1a; 人口老龄化…

强大:dynamsoft-barcode-reader-dotnet-9.6.30 Crack

dynamsoft-barcode-reader-dotnet 具有灵活 API 的强大条码扫描器 SDK 无论它是扭曲的、黑暗的、遥远的、模糊的、批量的还是移动的&#xff0c;我们都可以扫描它。速度快 条码扫描速度每分钟500 业界最快的扫描解码&#xff0c;可应用于不同场景&#xff1a; 多个条形码/二维…

【VS2022】调试

F9 创建或取消断点 ctrlF9 禁用断点 F5 开始调试&#xff08;到断点处停下来&#xff09; F10 逐过程&#xff08;不进入函数&#xff09; F11 逐语句 F5、F10、F11都可以直接进入调试 【调试】->【窗口】->【监视】&#xff0c;输入变量就可以观察到变量的值。 …

C语言数组和指针笔试题(二)(一定要看)

目录 字符数组二例题1例题2例题3例题4例题5例题6例题7总结 字符数组三例题1例题2例题3例题4例题5例题6例题7 字符数组二 char arr[] {a,b,c,d,e,f} 1:printf("%d\n", strlen(arr)); 2:printf("%d\n", strlen(arr0)); 3:printf("%d\n", strlen(…

Python小项目之Tkinter应用】随机点名/抽奖工具大优化:新增查看历史记录窗口!语音播报功能!修复预览文件按钮等之前版本的bug!

文章目录 前言一、实现思路二、关键代码查看历史记录按钮语音播报按钮三、完整代码总结前言 老生常谈,先看效果:(订阅专栏可获取完整代码) 初始状态下,我们为除了【设置】外的按钮添加弹窗,提示用户在使用工具之前要先【设置】。在设置界面,我们主要修改了【预览文件】…

每日一题 2596. 检查骑士巡视方案

难度&#xff1a;中等 很简单&#xff0c;从第 0 步开始模拟即可&#xff0c;唯一sb的就是测试用例中如果&#xff08;0&#xff0c;0&#xff09;处不为0的话就直接false&#xff0c;而不是去找0在哪 我的代码&#xff1a; class Solution:def checkValidGrid(self, grid: L…

2000-2021年上市公司全要素生产率数据OP法(含原始数据+计算代码+结果)

2000-2021年上市公司全要素生产率数据OP法&#xff08;含原始数据计算代码结果&#xff09; 1、时间&#xff1a;2000-2021年 2、指标&#xff1a;股票代码、年份、证券代码、固定资产净额、营业总收入、营业收入、营业成本、销售费用、管理费用、财务费用、支付给职工以及为…

防火墙 (五十四)

目录 前言 一、防火墙作用 二、防火墙分类 三、防火墙性能 四、硬件防火墙 五、软件防火墙 5.1 iptables 六、iptables应用 前言 本文就简单的介绍了防火墙的基础内容和一些简单案例的操作。 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、防火墙…

jmeter线程组 bzm - Concurrency Thread Group 阶梯式压测

简介 bzm - Concurrency Thread Group 不是JMeter的官方插件&#xff0c;而是一种由Blazemeter提供的高级线程组插件&#xff0c;它提供了更灵活的并发性能测试设置。它可以在不同的时间内并发执行不同数量的线程&#xff0c;模拟不同的负载场景。 插件下载地址&#xff08;jme…

信创办公–基于WPS的EXCEL最佳实践系列 (通过函数实现灵活限制)

信创办公–基于WPS的EXCEL最佳实践系列 &#xff08;通过函数实现灵活限制&#xff09; 目录 应用背景操作步骤1、sum函数的应用2、and函数的应用3、日期相关函数的应用4、eomonth函数的应用 应用背景 在Excel表格中&#xff0c;我们经常遇到需要大量计算或需要特殊处理的数据…

安达发|家具制造业APS高级计划与排程解决方案

在当今竞争激烈的市场环境下&#xff0c;家具制造业面临着诸多挑战&#xff0c;如原材料价格波动、人工成本上升、市场需求不确定性等。为了降低成本、提高生产效率和满足客户需求&#xff0c;家具制造企业需要寻求有效的计划与排程解决方案。本文将介绍一种基于先进生产计划系…

基于SSM的彩妆小样售卖商城

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

Cpp/Qtday060913cpp基础

目录 将栈类实现成模板类 代码 效果 将队列类实现成模板类 代码 效果 思维导图 将栈类实现成模板类 代码 #include <iostream>using namespace std;template<typename T> class Stack { private:T data[128];int top; public:Stack();//Stack(T unit);~St…

比亚迪海洋家族再添新成员,合资车企又该绷不住了

燃油搅局者比亚迪最近又又又上新车啦&#xff0c;这次带来的是海洋家族中大型插电混动轿车—海豹 DM-i。 啥叫插电混动&#xff1f;简单来说同时搭载了汽油发动机、可外接电源充电的电池和电机&#xff1b; 有电时用电驱动电机做工&#xff0c;没电时用油驱动发动机做工&#…

pycharm虚拟环境安装指定python版本/ python3.8 / 从python3.9降级到3.8

我在网上找了一圈发现各种命令,尤其是说: virtualenv -p python3 py38 可以指定版本,我真的酸Q ! 这个命令是意思是创建一个 py38 目录,实际上用的版本还是环境变量所指向的版本. 1.下载 python 版本 要想指定版本,肯定是需要本机已经有一个版本,然后指定这个版本作为虚拟环…

⑥ 在vue中引入路由

什么是路由&#xff1a;管理页面的跳转&#xff08;vue-router&#xff09; 官方文档 https://router.vuejs.org/zh/introduction.html第一步&#xff1a;安装路由后启动项目 npm install --save vue-router配置独立的路由文件 在src目录文件下新建一个文件夹router&#xf…

C++--day6

将之前定义的栈类和队列类都实现成模板类 栈&#xff1a; #include <iostream>using namespace std; template<typename T> class zn { private:T *num;int top;int size; public: //有参构造函数 zn(int a):top(-1),size(a){numnew T[size]; } //析构函数 ~zn()…

通过 DevOps、CI/CD 和容器增强您的软件开发之旅...

软件行业已经在 DevOps、CI/CD 和容器中找到了针对开发导向问题的有效解决方案。尽管并不强制要求将这三者一起使用&#xff0c;但它们通常是相互补充和依赖的。 DevOps 促进开发和 IT 团队之间的协作&#xff0c;而 CI/CD 简化软件交付流程以更快地获得结果。容器化将应用程序…

智安新闻|智安网络亮相2023网安周!

一年一度的国家网络安全“顶级盛事”——2023年国家网络安全宣传周9月拉开帷幕&#xff0c;本次展览会以“网络安全为人民&#xff0c;网络安全靠人民”为主题&#xff0c;旨在通过展览及现场互动广泛宣传网络安全知识与技能&#xff0c;提升全民网络安全意识&#xff0c;共同构…