imgaug库指南(13):从入门到精通的【图像增强】之旅

news2025/1/16 0:11:18

引言

在深度学习和计算机视觉的世界里,数据是模型训练的基石,其质量与数量直接影响着模型的性能。然而,获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此,数据增强技术应运而生,成为了解决这一问题的关键所在。而imgaug,作为一个功能强大的图像增强库,为我们提供了简便且高效的方法来扩充数据集。本系列博客将带您深入了解如何运用imgaug进行图像增强,助您在深度学习的道路上更进一步。我们将从基础概念讲起,逐步引导您掌握各种变换方法,以及如何根据实际需求定制变换序列。让我们一起深入了解这个强大的工具,探索更多可能性,共同推动深度学习的发展。


前期回顾

链接主要内容
imgaug库指南(三):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 高斯模糊
imgaug库指南(四):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 均值模糊
imgaug库指南(五):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 中值模糊/滤波,并介绍了如何利用【中值滤波】过滤椒盐噪声
imgaug库指南(六):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 双边模糊/滤波
imgaug库指南(七):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 运动模糊
imgaug库指南(八):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 均值迁移模糊
imgaug库指南(九):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性噪声(Add方法)
imgaug库指南(十):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性噪声(AddElementwise方法)
imgaug库指南(11):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性高斯噪声(AdditiveGaussianNoise方法)
imgaug库指南(12):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性拉普拉斯噪声(AdditiveLaplaceNoise方法)

在本博客中,我们将向您详细介绍imgaug库的数据增强方法 —— 加性泊松噪声(AdditivePoissonNoise方法)


加性泊松噪声(AdditivePoissonNoise方法)

功能介绍

AdditivePoissonNoiseimgaug库中的核心方法之一,专为给图像添加泊松分布的噪声而设计。泊松分布,作为自然现象随机性的数学模型,尤其适用于模拟光斑或颗粒分布等效果。此方法不仅有助于增强图像的真实感,更可模拟现实世界中的随机噪声,为图像处理领域带来更多自然与真实的视觉体验。

语法

import imgaug.augmenters as iaa
aug = iaa.AdditivePoissonNoise(lam=(0.0, 15.0), per_channel=False)
  • lam: 泊松分布的λ参数,λ>=0, 推荐λ的选择范围是[0, 10]。
    • lam为整数,则泊松分布的λ参数即为value
    • lam为元组(a, b),则泊松分布的λ参数为从区间[a, b]中采样的随机数;
    • lam为列表,则泊松分布的λ参数为从列表中随机采样的数;
  • per_channel:
    • per_channelTrue,则为每幅图像的每个像素点对应的通道上加上随机整数 ==> RGB图像指定像素位置上的三个通道分别对应三个随机整数,且每个像素点都对应不同的三个随机整数;
    • per_channelFalse,则为每幅图像的每个像素点对应的通道上加上随机采样的相同整数 ==> RGB图像指定像素位置上的三个通道都是同一个随机整数,但每个像素点都对应不同的随机整数;
    • per_channel为区间[0,1]的浮点数,假设per_channel=0.6,那么对于60%的图像,per_channelTrue;对于剩余的40%的图像,per_channelFalse

示例代码

  1. 使用不同的lam
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt

# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 创建数据增强器
aug1 = iaa.AdditivePoissonNoise(lam=3, per_channel=False)
aug2 = iaa.AdditivePoissonNoise(lam=9, per_channel=False)
aug3 = iaa.AdditivePoissonNoise(lam=15, per_channel=False)



# 对图像进行数据增强
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)

# 展示原始图像和数据增强后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Augmented Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Augmented Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Augmented Image3")
plt.show()

运行结果如下:

图1 原图及数据增强结果可视化

可以看到,三幅数据增强后的图像,都出现不同程度的噪声。当lam参数越大时,噪声越明显。

  1. per_channelTrue
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt

# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 创建增强器
aug1 = iaa.AdditivePoissonNoise(lam=3, per_channel=True)
aug2 = iaa.AdditivePoissonNoise(lam=9, per_channel=True)
aug3 = iaa.AdditivePoissonNoise(lam=15, per_channel=True)

# 对图像进行数据增强
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)

# 展示原始图像和数据增强后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Augmented Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Augmented Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Augmented Image3")
plt.show()

运行结果如下:

图2 原图及数据增强结果可视化

可以从图2看出(放大图片非常明显),当per_channel为True时 ⇒ 增强器为RGB图像的每个像素位置上对应的三个通道都分别添加了三个随机整数 ⇒ 数据增强后,新图像出现了彩色失真(加性噪声)。

注意事项

  1. λ参数的选择λ参数可以控制噪声的强度。较大的值会产生更明显的噪声效果。根据需要调整该参数,以在图像的真实性和噪声程度之间找到平衡。
  2. 通道独立性:如果设置了per_channel=True,则每个通道将使用独立的噪声强度。这在处理多通道图像(如RGB图像)时特别有用,可以独立调整每个通道的噪声水平。
  3. 与其他增强器的结合:可以与其他图像增强方法结合使用,以产生更复杂的效果。例如,可以先应用模糊,然后再添加泊松噪声,模拟更接近真实世界的噪声分布。

总结

在处理图像时,我们运用AdditivePoissonNoise方法,能够有效地增加图像的真实感,或模拟自然现象中的随机性。当与其他图像增强器结合使用时,其效果更为突出,能够创造出丰富多样的图像效果。然而,在使用过程中,我们需要注意几个关键点。首先,噪声强度的选择至关重要,它决定了图像增强的程度。其次,通道独立性的考虑使得我们能够独立调整每个通道的噪声水平,这在处理多通道图像时尤为重要。此外,合理地与其他增强器结合使用,能够进一步提升图像增强的效果。最后,我们还需要关注计算效率,特别是在处理大规模图像时。通过精心调整参数和巧妙地结合其他方法,我们能够获得高质量的图像增强效果,更好地满足各种应用需求。


小结

imgaug是一个强大的图像增强库,它可以帮助你创建出丰富多样的训练数据,从而改进你的深度学习模型的性能。通过定制变换序列和参数,你可以轻松地适应各种应用场景,从计算机视觉到医学影像分析。随着深度学习的发展,imgaug在未来将继续发挥重要作用。因此,将imgaug纳入你的数据增强工具箱是一个明智的选择。

参考链接


结尾

亲爱的读者,首先感谢抽出宝贵的时间来阅读我们的博客。我们真诚地欢迎您留下评论和意见,因为这对我们来说意义非凡。
俗话说,当局者迷,旁观者清。的客观视角对于我们发现博文的不足、提升内容质量起着不可替代的作用。
如果您觉得我们的博文给您带来了启发,那么,希望能为我们点个免费的赞/关注您的支持和鼓励是我们持续创作的动力
请放心,我们会持续努力创作,并不断优化博文质量,只为给带来更佳的阅读体验。
再次感谢的阅读,愿我们共同成长,共享智慧的果实!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1371047.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【SPDK】【NoF】使用SPDK实现NVMe over Fabrics Target

本文使用两台PC,一台做NVMe over Fabrics Target(服务端),一台做NVMe over Fabrics initiator(客户端)。首先使用SoftRoCE来实现底层的rdma传输,然后使用SPDK来实现NVMe over Fabrics Target。 …

首家通过中国信通院数据库迁移工具专项测试,亚信安慧AntDB受到认可!

亚信安慧数据库数据同步平台经过中国信通院第17批“可信数据库”数据库迁移工具专项测试,成功成为首家符合《数据库迁移工具能力要求》的产品。该平台广泛适用于多种数据迁移场景,具备高性能实时数据处理、断点续作、一键迁移、可视化运维等核心优势。此…

Linux第22步_安装CH340驱动和串口终端软件MobaXterm

开发板输出信息通常是采用串口,而计算机通常是USB接口,为了让他们之间能够交换数据,我们通常采用USB转串口的转换器来实现。目前市场上的串口转换器大多是采用CH340芯片来实现的,因此我们需要在计算中安装一个CH340驱动程序&#…

echarts——折线图实现不同区间不同颜色+下钻/回钻功能——技能提升

echarts——折线图实现不同区间不同颜色下钻/回钻功能——技能提升 需求场景解决步骤1:安装echarts插件解决步骤2:html代码解决步骤3:封装option配置和initChart渲染方法解决步骤4:回钻功能 需求场景 最近在写后台管理系统时&…

conda环境下Torch not compiled with CUDA enabled解决方法

1 问题描述 在运行wav2lip模型训练时&#xff0c;报如下错误&#xff1a; Traceback (most recent call last):File "D:\ml\Wav2Lip\preprocess.py", line 32, in <module>fa [face_detection.FaceAlignment(face_detection.LandmarksType._2D, flip_inputF…

线性代数——(期末突击)矩阵(下)-习题篇(初等变换求逆矩阵、矩阵乘法、求矩阵方程、求线性方程组、解齐次线性方程组)

目录 初等变换求逆矩阵 矩阵乘法 求矩阵方程 求线性方程组 解齐次线性方程组 带有未知数的方程组 初等变换求逆矩阵 如果,则A可逆&#xff0c;且 例题&#xff1a; &#xff0c;求A的逆矩阵。 矩阵乘法 求AB&#xff0c;BA. 矩阵之间的乘法是行乘以列&#xff0c;以这…

基于ssm的教材管理系统论文

基于SSM的教材管理系统的设计与实现 摘 要 当下&#xff0c;正处于信息化的时代&#xff0c;许多行业顺应时代的变化&#xff0c;结合使用计算机技术向数字化、信息化建设迈进。以前学校对于教材信息的管理和控制&#xff0c;采用人工登记的方式保存相关数据&#xff0c;这种以…

沈阳数字孪生赋能工业智能制造,助力制造业企业数字化转型

沈阳数字孪生赋能工业智能制造&#xff0c;助力制造业企业数字化转型。在数字经济时代&#xff0c;数字孪生作为实现各行各业智能化、数字化的重要手段之一&#xff0c;受到了各方的广泛重视。随着各项关键使能技术的不断发展&#xff0c;数字孪生的应用价值有望得到进一步释放…

MFC 多文档视图架构

目录 多文档视图架构 模仿多文档视图架构 执行流程 多文档视图架构 一个多文档视图架构运行后会是下面的样子&#xff1a; 内部的子框架窗口就相当于一个单文档视图架构&#xff0c;多文档视图架构就相当于在外面套一层框架窗口。 特点&#xff1a;可以管理多个文档(可以有…

【hcie-cloud】【21】容器详解【容器网络说明、容器存储说明、容器镜像说明、dockerfile详述、缩略词】【下】

文章目录 容器介绍&#xff0c;容器工作机制、容器常用命令说明容器网络容器网络简介容器常用网络类型 - Bridge容器常用网络类型 - Host容器常用网络类型 - None其他容器网络类型【Macvlan、Overlay、IPvlan】容器网络相关配置 容器存储容器中应用数据的存储容器持久化存储配置…

猫粮的选择:买主食冻干猫粮要注意什么

由于猫咪是肉食动物&#xff0c;对蛋白质的需求很高&#xff0c;如果摄入的蛋白质不足&#xff0c;就会影响猫咪的成长。而冻干猫粮本身因为制作工艺的原因&#xff0c;能保留原有的营养成分和营养元素&#xff0c;所以冻干猫粮蛋白含量比较高&#xff0c;营养又高&#xff0c;…

控制障碍函数(Control Barrier Function,CBF) 三、代码

三、代码实现 3.1、模型 这是一个QP问题&#xff0c;所以我们直接建模 这其实还是之前的那张图&#xff0c;我们把这个大的框架带入到之前的那个小车追击的问题中去&#xff0c;得到以下的一些具体的约束条件 CLF约束 L g V ( x ) u − δ ≤ − L f V ( x ) − λ V ( x ) …

速学python·输入输出

和用户交互 程序与用户交互工程中 用户把信息传送给程序的过程是 输入 程序把结果展示给用户的过程是 输出 输入输出的最简单的方法是利用控制台 例如 和 都是控制台,进行输入和输出的作用 但是: 我们常见的交互界面,例如QQ,浏览器,Wegame等,都不需要输入命令,大大简化了操…

热度不减!一周61篇,二区以上近一半!| 孟德尔随机化周报(12.27-01.02)

欢迎报名2024年孟德尔随机化方法高级班课程&#xff01; 郑老师团队开设的孟德尔随机化高级班2024年1月20-21日开课&#xff0c;欢迎报名 孟德尔随机化,Mendilian Randomization&#xff0c;简写为MR&#xff0c;是一种在流行病学领域应用广泛的一种实验设计方法&#xff0c;利…

selenium爬取多个网站及通过GUI界面点击爬取

selenium爬取代码 webcrawl.py import re import time import json from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.chrome.options import Options from selenium.common.exceptions import TimeoutException, Stale…

Java:手工触发FullGC及堆占用过高常用分析方法

目录 一、手工触发FullGC方式 1、通过代码 2、通过工具 二、堆占用过高常用分析方法 1、查看堆占用情况 2、手工触发FullGC 3、查看对象占用堆的情况 4、分析可疑对象 使用如下命令查看java进程中内存的使用情况 jstat -gcutil <pid> 5000 发现运行中的java进程堆…

07、Kafka ------ 消息生产者(演示 发送消息) 和 消息消费者(演示 监听消息)

目录 Kafka --- 消息生产者★ 消息★ 消息的分发机制★ 分发到哪个分区★ 轮询策略&#xff08;round-robin&#xff09;★ 使用命令行工具发送消息演示添加消息 Kafka --- 消息消费者★ 消息消费者命令▲ 监听 【指定主题】 的所有消息:▲ 监听 【指定主题、指定分区】的所有消…

AI与低代码解锁无限可能

前言 近年来&#xff0c;人工智能&#xff08;AI&#xff09;和低代码开发技术逐渐成为数字化转型的重要推动力。AI作为一项具有革命性潜力的技术&#xff0c;正在改变我们生活的方方面面。而低代码开发则提供了一种快速构建应用程序的方法&#xff0c;使得开发者无需深入编写…

【刷题日记】青少年CTF-A2 Crypto(全)

Caesar 题目难度&#xff1a;★ 题目描述&#xff1a;凯撒大帝在很早的时候发明了这个&#xff0c;你能解密出来吗&#xff1f;flag格式为&#xff1a;qsnctf{xxx}。 下载附件&#xff0c;题目提示告诉我们是凯撒了&#xff0c;一个简单的移位操作。 使用在线解码网站&#…

C语言基础语法跟练

题源&#xff1a;牛客网 1、输出"Hello Nowcoder!"。开始你的编程之旅吧。 #include <stdio.h>int main() {printf("Hello Nowcoder!");return 0; } 2、KiKi学会了printf在屏幕输出信息&#xff0c;他想输出一架小飞机。请帮他编写程序输出这架小…