Python 数据可视化

news2024/9/24 21:23:05

Python 数据可视化

Python提供了多个用于数据可视化的工具和库。其中最常用的包括:

1. Matplotlib:Matplotlib 是一个用于绘制二维图形的 Python 库。它提供了广泛的绘图选项,可以帮助您创建线图、散点图、柱状图、饼图、等高线图、3D 图形等。

2. Seaborn:Seaborn 是基于 Matplotlib 的图形可视化库,它主要用于绘制统计分析结果的图表和数据集。相比于 matplotlib 包,seaborn 包提供了更为美观、更为精美的可视化效果。

3. Plotly:Plotly 是一个交互式数据可视化库,在数据科学领域十分受欢迎。它支持大量的 2D/3D 图表类型,并且具备强大的交互元素如缩放、平移、悬停等等。

4. Bokeh:Bokeh 是一个面向现代网页的交互式可视化工具。它支持多种语言(Python、R 和 Julia)并非常适用于大规模数据集的可视化展示。

5. Pandas data visualization:Pandas 数据可视化是 Pandas 库内置的一种数据可视化工具,它可以促使你通过 DataFrames 和 Series 数据结构,快速生成多样性的图表。 

这些库和工具都有不同的功能和应用场景,可以根据具体需求选择合适的工具进行数据可视化。

下面是一些使用不同库进行数据可视化的示例:

1. Matplotlib:用 Matplotlib 绘制折线图、散点图和柱状图。
```python
import matplotlib.pyplot as plt
import numpy as np

# 折线图
x = np.arange(0, 10, 0.1)
y = np.sin(x)
plt.plot(x, y)
plt.show()

# 散点图
x = np.random.rand(50)
y = np.random.rand(50)
colors = np.random.rand(50)
plt.scatter(x, y, c=colors)
plt.show()

# 柱状图 
x = ['A', 'B', 'C', 'D']
y = [3, 8, 1, 10]
plt.bar(x, y)
plt.show()
```

2. Seaborn:在 Seaborn 中绘制散点图和直方图。
```python
import seaborn as sns
import numpy as np

# 散点图
x = np.random.normal(size=100)
y = np.random.normal(size=100)
sns.scatterplot(x=x, y=y)
plt.show()

# 直方图
data = np.random.normal(size=100)
sns.histplot(data=data, kde=True)
plt.show()
```

3. Plotly:用 Plotly 绘制交互式热力图和二维散点图。
```python
import plotly.express as px
import numpy as np

# 热力图
z = np.random.rand(10, 10)
fig = px.imshow(z, color_continuous_scale='OrRd')
fig.show()

# 二维散点图
x = np.random.rand(50)
y = np.random.rand(50)
colors = np.random.rand(50)
fig = px.scatter(x=x, y=y, color=colors)
fig.show()
```

4. Bokeh:用 Bokeh 绘制交互式时序数据图。
```python
from bokeh.plotting import figure, output_file, show
import pandas as pd

# 读取数据
data = pd.read_csv('temperature_data.csv')
x = pd.to_datetime(data['datetime'])
y = data['temperature']

# 绘制曲线
output_file('temp_plot.html')
p = figure(title="Temperature Data", x_axis_label='Time', y_axis_label='Temperature')
p.line(x, y)
show(p)
```

5. Pandas 数据可视化:对 Pandas 的 Series 和 DataFrame 对象直接调用 `plot()` 函数即可绘制不同类型的图表,如折线图、散点图、柱状图、饼图等。下面以折线图为例:
```python
import pandas as pd
import numpy as np

# 创建 Series 对象
dates = pd.date_range(start='20210101', end='20210110', periods=10)
ts = pd.Series(np.random.randn(10), index=dates)

# 绘制折线图
ts.plot()
```

Example 1 :散点图、密度图(Python)

import numpy as np
import matplotlib.pyplot as plt
# 创建随机数
n = 100000
x = np.random.randn(n)
y = (1.5 * x) + np.random.randn(n)
fig1 = plt.figure()
plt.plot(x,y,'.r')
plt.xlabel('x')
plt.ylabel('y')
plt.savefig('2D_1V1.png',dpi=600)
nbins = 200
H, xedges, yedges = np.histogram2d(x,y,bins=nbins)
# H needs to be rotated and flipped
H = np.rot90(H)
H = np.flipud(H)
# 将 zeros mask
Hmasked = np.ma.masked_where(H==0,H)
# Plot 2D histogram using pcolor
fig2 = plt.figure()
plt.pcolormesh(xedges,yedges,Hmasked)
plt.xlabel('x')
plt.ylabel('y')
cbar = plt.colorbar()
cbar.ax.set_ylabel('Counts')
plt.savefig('2D_2V1.png',dpi=600)
plt.show()

这段代码的主要作用是生成 2D 直方图,帮助我们可视化数据集中的情况。

首先,使用 `numpy.random.randn()` 函数生成一个包含100,000个元素的随机数数组 x,并由 y = (1.5 * x) + np.random.randn(n) 计算出相应的 y 值,在 plt.plot(x,y,'.r') 中绘制二维散点图。

接着,使用 `numpy.histogram2d()` 函数将数据划分到网格中,并且根据各网格内数据的计数绘制颜色不同的矩形。该函数返回三个值,分别是 H(计数)、xedges(每一列的边界)和 yedges(每一行的边界)。

再之后,在 H 非 0 的区域打上背景遮罩,并通过 `pcolormesh()` 函数把这些区域的计数对应于不同颜色的矩形来展示直方图。

最后,增加了一些标签、轴、颜色线条等细节,并使用 `plt.savefig()` 函数将图片保存为文件。

该代码可以用于描述任何包含两个变量的数据集,以适合于在图像上显示数据的形式呈现它们。

 

Example 2 :双 Y 轴(Python)

import csv
import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime
data=pd.read_csv('LOBO0010-2020112014010.tsv',sep='\t')
time=data['date [AST]']
sal=data['salinity']
tem=data['temperature [C]']print(sal)
DAT = []
for row in time:
DAT.append(datetime.strptime(row,"%Y-%m-%d %H:%M:%S"))
#create figure
fig, ax =plt.subplots(1)
# Plot y1 vs x in blue on the left vertical axis.
plt.xlabel("Date [AST]")
plt.ylabel("Temperature [C]", color="b")
plt.tick_params(axis="y", labelcolor="b")
plt.plot(DAT, tem, "b-", linewidth=1)
plt.title("Temperature and Salinity from LOBO (Halifax, Canada)")
fig.autofmt_xdate(rotation=50)
# Plot y2 vs x in red on the right vertical axis.
plt.twinx()
plt.ylabel("Salinity", color="r")
plt.tick_params(axis="y", labelcolor="r")
plt.plot(DAT, sal, "r-", linewidth=1)
#To save your graph
plt.savefig('saltandtemp_V1.png' ,bbox_inches='tight')
plt.show()
Example 3:拟合曲线(
Python)
import csv
import numpy as np
import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt
import scipy.signal as signal
data=pd.read_csv('LOBO0010-20201122130720.tsv',sep='\t')
time=data['date [AST]']
temp=data['temperature [C]']
datestart = datetime.strptime(time[1],"%Y-%m-%d %H:%M:%S")
DATE,decday = [],[]
for row in time:
daterow = datetime.strptime(row,"%Y-%m-%d %H:%M:%S")
DATE.append(daterow)
decday.append((daterow-datestart).total_seconds()/(3600*24))
# First, design the Buterworth filter
N
= 2
# Filter orderWn = 0.01 # Cutoff frequency
B, A = signal.butter(N, Wn, output='ba')
# Second, apply the filter
tempf = signal.filtfilt(B,A, temp)
# Make plots
fig = plt.figure()
ax1 = fig.add_subplot(211)
plt.plot(decday,temp, 'b-')
plt.plot(decday,tempf, 'r-',linewidth=2)
plt.ylabel("Temperature (oC)")
plt.legend(['Original','Filtered'])
plt.title("Temperature from LOBO (Halifax, Canada)")
ax1.axes.get_xaxis().set_visible(False)
ax1 = fig.add_subplot(212)
plt.plot(decday,temp-tempf, 'b-')
plt.ylabel("Temperature (oC)")
plt.xlabel("Date")
plt.legend(['Residuals'])
plt.savefig('tem_signal_filtering_plot.png', bbox_inches='tight')
plt.show()

代码块主要是使用 Python 实现了一个数字信号处理的过程,是针对来自 LOBO0010-20201122130720.tsv 数据集的处理。

该代码块的任务是进行高斯滤波(Butterworth Filter)处理并拟合曲线,并通过可视化的方式呈现出原始数据和经过滤波处理后的信号及其差异。具体来说,使用 scipy.signal.butter() 函数设计滤波器、应用高斯滤波,然后使用 matplotlib.pyplot.plot() 函数画出图像。此外,还使用 matplotlib.pyplot.legend() 等函数为图形添加标签和文字说明。

最后,使用 matplotlib.pyplot.savefig() 函数将生成的图像保存到本地磁盘,并使用 matplotlib.pyplot.show() 函数展示可视化结果。

Example 3:拟合曲线(Python)

import csv
import numpy as np
import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt
import scipy.signal as signal
data=pd.read_csv('LOBO0010-20201122130720.tsv',sep='\t')
time=data['date [AST]']
temp=data['temperature [C]']
datestart = datetime.strptime(time[1],"%Y-%m-%d %H:%M:%S")
DATE,decday = [],[]
for row in time:
daterow = datetime.strptime(row,"%Y-%m-%d %H:%M:%S")
DATE.append(daterow)
decday.append((daterow-datestart).total_seconds()/(3600*24))
# First, design the Buterworth filter
N
= 2
# Filter order
Wn = 0.01 # Cutoff frequency
B, A = signal.butter(N, Wn, output='ba')
# Second, apply the filtertempf = signal.filtfilt(B,A, temp)
# Make plots
fig = plt.figure()
ax1 = fig.add_subplot(211)
plt.plot(decday,temp, 'b-')
plt.plot(decday,tempf, 'r-',linewidth=2)
plt.ylabel("Temperature (oC)")
plt.legend(['Original','Filtered'])
plt.title("Temperature from LOBO (Halifax, Canada)")
ax1.axes.get_xaxis().set_visible(False)
ax1 = fig.add_subplot(212)
plt.plot(decday,temp-tempf, 'b-')
plt.ylabel("Temperature (oC)")
plt.xlabel("Date")
plt.legend(['Residuals'])
plt.savefig('tem_signal_filtering_plot.png', bbox_inches='tight')
plt.show()

这段代码主要是针对来自 LOBO0010-20201122130720.tsv 数据集的处理。它的主要任务是使用 Butterworth 滤波器进行数字信号处理,即对温度数据进行滤波处理,并通过可视化的方式呈现出原始数据和经过滤波处理后的信号及其差异。

首先,根据所给的 tsv 文件,我们使用 `pandas.read_csv()` 函数读取 csv 文件并将其加载到 data 存储库中。然后,使用 `datetime.strptime()` 函数来从 data 中获取时间戳。接着,创建一个时间序列,用于绘制 X 轴(每个时刻距离第一个时刻的秒数)。

然后,定义了 Buterworth 滤波器的阶数 N 和截止频率 Wn,并使用 `scipy.signal.butter()` 函数来设计(设计)滤波器。在设计完毕后,使用 `scipy.signal.filtfilt()` 函数应用该滤波器对原始数据 temp 进行滤波,得到滤波后的结果 tempf。

最后,使用 `plt.plot()` 绘制两个子图,分别表示原始温度数据、滤波后的温度数据和它们之间的差异(残差)。使用 `plt.savefig()` 函数将生成的图像保存到本地磁盘,并使用 `matplotlib.pyplot.show()` 函数展示可视化结果。

 

Example 4:三维地形(Python)

# This import registers the 3D projection
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cbook
from matplotlib import cm
from matplotlib.colors import LightSource
import matplotlib.pyplot as plt
import numpy as np
filename
=
cbook.get_sample_data('jacksboro_fault_dem.npz',
asfileobj=False)
with np.load(filename) as dem:
z = dem['elevation']
nrows, ncols = z.shape
x = np.linspace(dem['xmin'], dem['xmax'], ncols)
y = np.linspace(dem['ymin'], dem['ymax'], nrows)
x, y = np.meshgrid(x, y)
region = np.s_[5:50, 5:50]
x, y, z = x[region], y[region], z[region]
fig, ax = plt.subplots(subplot_kw=dict(projection='3d'))
ls = LightSource(270, 45)
rgb = ls.shade(z, cmap=cm.gist_earth, vert_exag=0.1, blend_mode='soft')
surf = ax.plot_surface(x, y, z, rstride=1, cstride=1, facecolors=rgb,linewidth=0, antialiased=False, shade=False)
plt.savefig('example4.png',dpi=600, bbox_inches='tight')
plt.show()

这段代码主要使用 Matplotlib 库中的模块 `Axes3D` 来创建和处理 3D 图形。其任务是将样本数据集 jacksboro_fault_dem.npz 中的地理高度(即该点距离海平面的高度)制成 3D 表面图。

首先,导入所需模块和库并读取数据。然后,选择特定区域进行绘制,即选区 region 为左上角为(5,5),右下角为(50,50) 的区域。接下来,使用 LightSource 函数实现 3D 图形的渲染,其中的参数 elevation 是数据集的高程信息,cmap 参数表示图像的颜色映射,vert_exag 参数表示图像的垂直高度系数。最后,使用 `plot_surface()` 函数画出 3D 表面图,并使用 `savefig()` 函数将生成的图像保存到本地磁盘,并使用 `show()` 函数展示可视化结果。

需要注意的是,在此过程中,也需要对 x、y 和 z 坐标进行网格化和重采样以制作 3D 表面图。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/610946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linuxOPS基础_linux网络配置

ifconfig查看网络信息 命令:ifconfig 作用:获取网卡的相关信息 语法:# ifconfig 示例1 查看网络信息 案例1使用ifconfig查看linux网络配置 ifconfig注意,我们发现当前ens33看不到IP地址信息,那是因为网卡默认不启…

如何为您的企业培养社交媒体粉丝(16种方式)

增加社交媒体关注度似乎很困难,但这对各种规模的企业来说都是一项重要任务。通过正确的方法,可以吸引忠实的追随者并在社交媒体上建立强大的影响力。在本文中,我们将探讨 16 种有效的方法来增加您的社交媒体粉丝并与您的受众互动。 目录 为…

Java实现LL1语法分析器【编译原理】

java通过预测分析法实现语法分析程序【编译原理】 前言推荐实验要求需知LL1工作原理 Java实现LL1语法分析器0实验步骤LL1.javaGrammar.javaLeftRecursion.javaFirstAndFollow.javaAnalyzeTable.javaLL1Stack.java实验结果 Java实现LL1语法分析器1Grammar.javaProduction.javaFi…

Three.js——九、纹理贴图、纹理对象阵列、地面网格辅助观察、UV坐标以及动画

创建纹理贴图 const geometry new THREE.PlaneGeometry(100, 100); //纹理贴图加载器TextureLoader const texLoader new THREE.TextureLoader(); // .load()方法加载图像,返回一个纹理对象Texture const texture texLoader.load(new URL(../assets/img/zhizhen…

IRIS75 DM蓝牙5.2双模热插拔PCB

键盘使用说明索引(均为出厂默认值) 软件支持(驱动的详细使用帮助)一些常见问题解答(FAQ)首次使用步骤蓝牙配对规则(重要)蓝牙和USB切换键盘默认层默认触发层0的FN键配置的功能默认功…

B站恰饭视频汇总,如何查找不同行业的品牌商单和恰饭视频?

随着“短视频时代”来临,广告主都在重点布局短视频平台,尝试用长短视频平台协同投放的方式来提高广告点击率。B站作为短视频产出的高质量平台,也是许多年轻人活跃的聚焦地,拥有很强的用户粘性和无限的商业潜力,是广告主…

港联证券|如何抓住牛股?股票为什么能够连续涨停?

牛股是指在股票市场中表现出色、股价涨幅较大的个股,对于投资者来说,抓住牛股是实现投资目标的关键之一。那么如何抓住牛股?股票为什么能够连续涨停?港联证券也为大家准备了相关内容,以供参考。 如何抓住牛股&#xff…

迅为RK3568开发板Buildroot 系统设置屏幕旋转

迅为支持的触摸屏幕有四种: MIPI 7 寸屏幕(默认物理屏幕为竖屏) LVDS 7 寸屏幕(默认物理屏幕为竖屏) LVDS 10.1 寸 1024*600 屏幕(默认物理屏幕为横屏) LVDS 10.1 寸 1280*800 屏幕&#xf…

代码随想录二刷 day13 | 栈与队列 之 239. 滑动窗口最大值 347.前 K 个高频元素

day13 239. 滑动窗口最大值347.前 K 个高频元素 239. 滑动窗口最大值 题目链接 解题思路: 设计单调队列的时候,pop和push操作要保持如下规则: pop(value):如果窗口移除的元素value等于单调队列的出口元素,那么队列弹…

拜登签字了

* * * 原创:刘教链 * * * 号外:今天在“刘教链Pro”发表了一篇《对PoS的链重建攻击》,总结了一下最近关于PoW和PoS安全性的碰撞,抛砖引玉,欢迎关注“刘教链Pro”并阅读。 * * * 隔夜比特币仍在27k上方盘旋。盘旋之中微…

数据万象 | AIGC 存储内容安全解决方案

AIGC(人工智能生产内容) 已经成为与PGC(专业生产内容)、UGC(用户生产内容)并驾齐驱的内容生产方式。由于 AI 的特性,AIGC在创意、个性化、生产效率等方面具有独特的优势,这些优势可以…

Hadoop中MapReduce概述

MapReduce概述 MapReduce定义MapReduce优缺点MapReduce核心思想MapReduce进程MapReduce编程规范MapTask并行度决定机制ReduceTask并行度决定机制mapreduce中job的提交流程MapReduce工作流程shuffle机制分区partition数据清洗(ETL)进一步分析MapTask和Red…

项目经理如何制定工作计划?做到这3点就够了

工作计划的重要性在于明确目标和实现具体步骤,协调大家一致行动,增强工作的主动性,减少工作的盲目性,让工作有条不紊地进行。同时,制定计划也可以对工作进度和质量有个保证和标准,对大家的工作有约束和督促…

Android Native crash问题分析

1、准备材料 android-ndk-r21b工具:addr2line和objdump工具。 .so库:crash对应的带符号表的共享库 源代码code:crash对应的源码文件 tombstone:Android系统产生的墓碑文件 2、 tombstone墓碑文件分析 关键信息: c…

前端div水平居中的几种实现方式

借助display布局 父元素开启display:flex布局,并设置justify-content:center主轴的空隙分布 因为是单行,所以使用align-items:center设置侧轴上的对其方式 <body><style>.a{width: 200px;height: 200px;background-color: red;display: flex;justify-content: c…

JS新标签页打开,让你的网站访问更加便捷

前言 大家在浏览网页时&#xff0c;常常需要在新的标签页中打开链接&#xff0c;以便在不离开当前页面的情况下查看其他内容。其中&#xff0c;JS 打开新标签页作为一种常用的功能之一&#xff0c;既可以方便用户快速访问相关链接&#xff0c;又能有效提升网站的用户体验。在本…

【Python 二进制和十六进制】零基础也能轻松掌握的学习路线与参考资料

1.了解二进制和十六进制的基本概念和用途 在计算机中&#xff0c;二进制和十六进制是两种常用的表示数据的方式。二进制只有两个数字0和1&#xff0c;表示一个比特&#xff08;bit&#xff09;&#xff0c;在实际的计算机程序中&#xff0c;常用八个比特表示一个字节&#xff…

如何在 JavaScript 中创建自定义警告框

本文将介绍如何使用 jQuery UI、SweetAlert2 和自定义警报功能在 JavaScript 中创建自定义警报框。 使用 jQuery UI 创建自定义警告框 我们可以使用 jQuery UI 来模仿 JavaScript 本机 alert() 函数的功能。 尽管 jQuery UI 有很多 API&#xff0c;您可以使用它的 dialog() AP…

Python--注释

Python--注释 <font size4, colorblue> 一、Python中注释的形式<font size4, colorblue> 1、单行注释&#xff1a;使用“#”符号注释<font size4, colorblue> 2、多行注释&#xff1a;使用一对三个英文单引号注释<font size4, colorblue> 3、多行注释&…

W3电力线载波通信技术

CK_Label_W3 CK_Label_W3&#xff08;外接供电版&#xff09; 产品型号 CK_Label_W3 尺寸 114.5*44.5*19mm 屏幕尺寸 2.9 inch 分辨率 296*128 像素密度 112dpi 显示技术 电子墨水屏显示 显示颜色 黑/白 外观颜色 白色 按键 4 指示灯 4 RGB灯 灯光颜色…