imgaug库指南(18):从入门到精通的【图像增强】之旅

news2024/11/18 17:40:55

引言

在深度学习和计算机视觉的世界里,数据是模型训练的基石,其质量与数量直接影响着模型的性能。然而,获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此,数据增强技术应运而生,成为了解决这一问题的关键所在。而imgaug,作为一个功能强大的图像增强库,为我们提供了简便且高效的方法来扩充数据集。本系列博客将带您深入了解如何运用imgaug进行图像增强,助您在深度学习的道路上更进一步。我们将从基础概念讲起,逐步引导您掌握各种变换方法,以及如何根据实际需求定制变换序列。让我们一起深入了解这个强大的工具,探索更多可能性,共同推动深度学习的发展。


前期回顾

链接主要内容
imgaug库指南(十):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性噪声(AddElementwise方法)
imgaug库指南(11):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性高斯噪声(AdditiveGaussianNoise方法)
imgaug库指南(12):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性拉普拉斯噪声(AdditiveLaplaceNoise方法)
imgaug库指南(13):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性泊松噪声(AdditivePoissonNoise方法)
imgaug库指南(14):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 乘法运算(Multiply方法)
imgaug库指南(15):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 乘法运算(MultiplyElementwise方法)
imgaug库指南(16):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— Cutout方法
imgaug库指南(17):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— Dropout方法

在本博客中,我们将向您详细介绍imgaug库的数据增强方法 —— CoarseDropout方法


CoarseDropout方法

功能介绍

iaa.CoarseDropoutimgaug库中一个数据增强方法,可用于神经网络的训练。它通过粗略地随机丢弃图像区域,模拟了经典的【Dropout】技术,有力地缓解了模型的过拟合问题。此方法通过将图像的特定区域巧妙地设为黑色,促使模型在训练过程中更加注重图像的其他关键部分,从而提升模型的泛化能力。

语法


import imgaug.augmenters as iaa
# 将2%到10%的像素用原图大小2%到5%的黑色方块覆盖
aug = iaa.CoarseDropout(p=(0.02, 0.1), size_percent=(0.02, 0.05))
  • p: 定义为图像中有多少比例的像素被黑色方块覆盖。

    • p为浮点数,则图像中被黑色方块覆盖的区域占整个图像的比例为p
    • p为元组(a, b),则图像中被黑色方块覆盖的区域占整个图像的比例为从区间[a, b]中采样的随机数;
    • p为列表,则图像中被黑色方块覆盖的区域占整个图像的比例为从列表中随机采样的数;
  • size_percent: 定义每个黑色方块的大小。

    • size_percent为浮点数0.02,则每个黑色方块大小为(1/size_percent, 1/size_percent), 即(50, 50);
    • size_percent为元组(a, b),则每个黑色方块大小为(1/size, 1/size), size为从区间[a, b]中采样的随机数;
    • size_percent为列表,则每个黑色方块大小为(1/size, 1/size), size为从列表中随机采样的数;

示例代码

  1. 使用不同的p
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt

# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 创建数据增强器
# 将20%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug1 = iaa.CoarseDropout(p=0.2, size_percent=0.02)
# 将40%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug2 = iaa.CoarseDropout(p=0.4, size_percent=0.02)
# 将60%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug3 = iaa.CoarseDropout(p=0.6, size_percent=0.02)



# 对图像进行数据增强
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)

# 展示原始图像和数据增强后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Augmented Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Augmented Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Augmented Image3")
plt.show()

运行结果如下:

图1 原图及数据增强结果可视化

可以从图1看到:

  • p越大时, 数据增强后的新图像会出现更多个大小为(50, 50)的黑色方块。
  1. 使用不同的 size_percent
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt

# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)


# 创建数据增强器
# 将20%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug1 = iaa.CoarseDropout(p=0.2, size_percent=0.02)
# 将20%的像素用大小为(25, 25)的黑色方块覆盖(1/0.04=25)
aug2 = iaa.CoarseDropout(p=0.2, size_percent=0.04)
# 将20%的像素用大小为(10, 10)的黑色方块覆盖(1/0.1=10)
aug3 = iaa.CoarseDropout(p=0.2, size_percent=0.1)



# 对图像进行数据增强
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)

# 展示原始图像和数据增强后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Augmented Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Augmented Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Augmented Image3")
plt.show()

运行结果如下:

图2 原图及数据增强结果可视化

可以从图2看到:

  • size_percent=0.02时,黑色方块大小为(50, 50)。
  • size_percent=0.04时,黑色方块大小为(25, 25)。
  • size_percent=0.1时,黑色方块大小为(10, 10)。

注意事项

  1. 丢弃概率和区域大小psize_percent参数共同决定了黑色方块(丢弃区域)的数量和大小。较大的p可能导致更多的区域被丢弃。这些参数需要根据你的应用进行适当调整。
  2. 与其他增强器的结合使用:可以与其他图像增强方法结合使用,以获得更丰富的效果。例如,可以先应用模糊,然后再应用粗略丢弃。
  3. 结果的可重复性:每次应用增强器可能会产生稍微不同的结果,因为它是随机的操作。为了确保结果的可重复性,可以使用aug.to_deterministic()方法将增强器转换为确定性状态。

总结

iaa.CoarseDropout作为一项图像增强技术,凭借其独特功能,为模型泛化能力的提升开辟了新途径。在神经网络训练过程中,它发挥关键作用,有效避免模型对训练数据中的噪声或特定模式的过度依赖。为了实现最佳效果,用户需审慎调整相关参数,如丢弃概率和区域大小。与其他图像增强方法协同运用,其效用更显卓越。请注意,由于此方法涉及随机过程,每次应用可能产生不同的结果。因此,在测试和评估模型时,务必确保使用一致的增强流程,以维持结果的稳定性。


小结

imgaug是一个强大的图像增强库,它可以帮助你创建出丰富多样的训练数据,从而改进你的深度学习模型的性能。通过定制变换序列和参数,你可以轻松地适应各种应用场景,从计算机视觉到医学影像分析。随着深度学习的发展,imgaug在未来将继续发挥重要作用。因此,将imgaug纳入你的数据增强工具箱是一个明智的选择。

参考链接


结尾

亲爱的读者,首先感谢抽出宝贵的时间来阅读我们的博客。我们真诚地欢迎您留下评论和意见,因为这对我们来说意义非凡。
俗话说,当局者迷,旁观者清。的客观视角对于我们发现博文的不足、提升内容质量起着不可替代的作用。
如果您觉得我们的博文给您带来了启发,那么,希望能为我们点个免费的赞/关注您的支持和鼓励是我们持续创作的动力
请放心,我们会持续努力创作,并不断优化博文质量,只为给带来更佳的阅读体验。
再次感谢的阅读,愿我们共同成长,共享智慧的果实!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1375948.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CodeQL基本使用

0x01 安装codeql 去github下载一个对应版本的codeql捆绑包。 https://github.com/github/codeql-action/releases 然后解压,这里我是解压到桌面 然后用添加到环境变量中 然后在任意位置输入codeql命令,如果能有以下提示就表示安装成功 然后下载vscode…

戴尔服务器有8条内存条,开机有一条内存条自检提示出错,可以不用管他吗,有影响吗?

环境 戴尔R730 问题描述 戴尔服务器有8条内存条,开机有一条内存条自检提示出错,可以不用管他吗,有影响吗? 提示B1内存有问题 解决方案 不能,有影响,安装系统时卡住在启动节目无法正常安装,…

mysql原理--redo日志1

1.redo日志是个啥 我们知道 InnoDB 存储引擎是以页为单位来管理存储空间的,我们进行的增删改查操作其实本质上都是在访问页面(包括读页面、写页面、创建新页面等操作)。我们前边唠叨 Buffer Pool 的时候说过,在真正访问页面之前&a…

神州数码集团荣获“TiDB 社区最佳贡献企业”

日前,神州数码在 TiDB 开源社区中获得了“TiDB 社区最佳贡献企业”奖。PingCAP 颁发该奖项以认可生态企业在社区中的卓越贡献和积极参与。 神州数码与 PingCAP 最早于 2020 年 12 月 28 日进行战略合作,基于全球领先的开源分布式关系型数据库 TiDB&…

详细分析Java中的@JsonFormat注解和@DateTimeFormat注解

目录 前言1. JsonFormat注解2. DateTimeFormat注解3. Demo3.1 无注解3.2 有注解 4. 拓展 前言 下文中涉及MybatisPlus的逻辑删除的知识,可看我之前这篇文章:详细讲解MybatisPlus实现逻辑删除 对应的Navicat设置数据库最新时间可看我这篇文章&#xff1…

修改SSH默认端口,使SSH连接更安全

以CentOS7.9为例: 1、修改配置文件 vi /etc/ssh/sshd_config 2、远程电脑可连接,暂时将SELinux关闭 # 查询状态 getenforce # 关闭 setenforce 0 # 开启 setenforce 1 3、SELinux设置(如果启用),semanage管理工具安…

雷达信号处理——恒虚警检测(CFAR)

雷达信号处理的流程 雷达信号处理的一般流程:ADC数据——1D-FFT——2D-FFT——CFAR检测——测距、测速、测角。 雷达目标检测 首先要搞清楚什么是检测,检测就是判断有无。雷达在探测的时候,会出现很多峰值,这些峰值有可能是目标…

GPT function calling v2

原文:GPT function calling v2 - 知乎 OpenAI在2023年11月10号举行了第一次开发者大会(OpenAI DevDays),其中介绍了很多新奇有趣的新功能和新应用,而且更新了一波GPT的API,在1.0版本后的API调用与之前的0.…

品牌出海新风尚:联名营销战略全面解析

随着全球化的推进,品牌出海已经成为许多企业拓展市场的重要战略之一。然而,要想在海外市场中获得成功,品牌需要面对一系列的挑战,包括文化差异、市场竞争、消费者需求等等。在这样的背景下,联名营销作为一种有效的品牌…

【ChatGPT-Share,国内可用】GPTS商店大更新:一探前沿科技的魅力!

使用地址:https://hello.zhangsan.cloud/list GPTS商店预览,王炸更新 精选应用: 系统内置应用: 绘画应用: 写作应用: 高效工具应用: 学术搜索和分析应用: 编程应用: 教育应…

6.3、SDN在云计算中的应用

目录 一、SDN概念 1.1、传统网络机制 1.2、SDN网络机制 1.3、二者区别 1.4、SDN架构 二、云数据中心 2.1、公有云环境特点 2.2、两大挑战 2.3、云数据中心引入SDN技术解决两大挑战 三、SDN云计算解决方案 3.1、SDN云计算解决方案之控制平面openflow协议 3.1.…

vue前端开发自学,父子组件传递数据,借助于Props实现子传父

vue前端开发自学,父子组件传递数据,借助于Props实现子传父! 之前我们说过,Props这个是用在父传子的情况下,今天为大家介绍的代码,就是在父组件里,自定义事件,绑定一个函数,让子组件可以接受到这…

架构01 - 知识体系详解

架构,又称为知识体系,是指在特定领域或系统中的组织结构和设计原则。它涵盖了该领域或系统的核心概念、基础理论、方法技术以及实践经验等。架构的主要作用是提供一个全面且系统化的视角,帮助人们理解和应用相关知识,并指导系统的…

PHP短链接url还原成长链接

在开发过程中,碰到了需要校验用户回填的短链接是不是系统所需要的,于是就需要还原找出短链接所对应的长链接。 长链接转短链接 在百度上搜索程序员,跳转页面后的url就是一个长链接。当然你可以从任何地方复制一个长链接过来。 长链接 http…

MySQL 按日期流水号 条码 分布式流水号

有这样一个场景,有多台终端,要获取唯一的流水号,流水号格式是 日期0001形式,使用MySQL的存储过程全局锁实现这个需求。 以下是代码示例。 注:所有的终端连接到MySQL服务器获取流水号,如果获取到的是 “-1”…

2022 年全国职业院校技能大赛高职组云计算赛项试卷

【赛程名称】云计算赛项第一场-私有云 某企业拟使用OpenStack 搭建一个企业云平台,以实现资源池化弹性管理、企业应用集中管理、统一安全认证和授权等管理。 系统架构如图 1 所示,IP 地址规划如表 1 所示。 图 1 系统架构图 表 1 IP 地址规划 设备…

【Oracle】数据库对象

一、视图 1、视图概述 视图是一种数据库对象 视图 > 封装sql语句 > 虚拟表 2、视图的优点 简化操作:视图可以简化用户处理数据的方式。着重于特定数据:不必要的数据或敏感数据可以不出现在视图中。视图提供了一个简单而有效的安全机制&#x…

使用 gitee+sphinx+readthedocs 搭建个人博客

给大家安利如何快速搭建个人博客网站! 前言 这是我本地运行的一个使用sphinx构建的博客服务,这些文章,都是用markdown写的。 一直有个想法,就是把自己写的这些文件,搞成一个博客网站,放到网上&#xff0c…

正面PK智驾,华为与博世「硬扛」

12月20日,随着奇瑞星纪元ES的亮相上市,华为与博世,分别作为新旧时代的供应商角色,首次在高阶智驾赛道进行正面PK。 11月28日,奇瑞和华为合作的首款车型智界S7上市,作为星纪元ES的兄弟车型,搭载华…

Jenkins基础篇--凭据(Credential)管理

什么是凭据 Jenkins的Credentials直译为证书、文凭,我们可以理解为它是钥匙,用来做某些事情的认证。 如Jenkins 和 GitLab交互时,需要添加GitLab的API令牌和登录凭证。 如Jenkins 添加从节点时,需要添加从节点的登录凭证或者Je…