图像数据增强方法概述

news2024/9/21 20:40:30

图像数据增强方法概述

  • 1. 什么是图像数据增强技术?
  • 2. 图像数据增强技术分类
    • 2.1 几何变换
          • Python 示例代码
    • 2.2 颜色变换
    • 2.3 噪声添加
  • 3. 参考文献

1. 什么是图像数据增强技术?

  • 基础概念:图像增强技术是计算机视觉和图像处理领域中的一个关键技术,主要用于改善图像的质量或者使其更适合后续的图像分析任务。通过对原始图像进行一系列变换,生成新的图像样本,从而增加训练数据集的多样性和丰富性,最终提升机器学习模型的性能和鲁棒性。
  • 相关应用:帮助模型学习到更广泛的数据特征,有效避免过拟合问题,使模型在面对未见过的数据时表现得更加稳健。在深度学习领域,特别是在卷积神经网络(CNN)的应用中,图像增强已经成为了一个标准的预处理步骤,极大地促进了模型的泛化能力和准确性。

对于图片数据集数量和种类较少的应用场景更加有效

2. 图像数据增强技术分类

2.1 几何变换

定义:几何变换是图像数据增强中最基本且常用的方法。其主要目的是通过修改图像的空间结构,来生成新的样本。这类方法可以使模型更加鲁棒,适应不同的物体位置和方向。

  • 旋转:旋转是指将图像围绕其中心点进行旋转,可以模拟不同角度的视图,从而使模型对物体在不同方向上的表现更加稳定。

  • 平移:平移是将图像在水平方向或垂直方向上移动一定的像素。平移操作可以帮助模型学习到物体在不同位置的特征。

  • 缩放:缩放是指改变图像的大小。缩放可以使模型适应不同尺寸的物体,增强其对比例变化的鲁棒性。

  • 翻转:翻转是将图像进行水平或垂直翻转。翻转操作可以帮助模型学习到镜像对称的特征。

在这里插入图片描述

Python 示例代码
import cv2
import numpy as np
import matplotlib.pyplot as plt

# 读取图像
image = cv2.imread('img.png')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)


# 定义几何变换
def augment_geometric(image):
    # 旋转
    rows, cols, _ = image.shape
    angle = 30  # 旋转角度
    M_rotate = cv2.getRotationMatrix2D((cols / 2, rows / 2), angle, 1)
    rotated = cv2.warpAffine(image, M_rotate, (cols, rows))

    # 平移
    M_translate = np.float32([[1, 0, 50], [0, 1, 50]])  # 水平和垂直平移50像素
    translated = cv2.warpAffine(image, M_translate, (cols, rows))

    # 翻转
    flipped = cv2.flip(image, 1)  # 水平翻转

    return rotated, translated, flipped


# 进行增强
rotated_image, translated_image, flipped_image = augment_geometric(image)

# 可视化
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.title('Original Image')
plt.imshow(image)
plt.axis('off')

plt.subplot(2, 2, 2)
plt.title('Rotated Image (30 degrees)')
plt.imshow(rotated_image)
plt.axis('off')

plt.subplot(2, 2, 3)
plt.title('Translated Image')
plt.imshow(translated_image)
plt.axis('off')

plt.subplot(2, 2, 4)
plt.title('Flipped Image')
plt.imshow(flipped_image)
plt.axis('off')

plt.tight_layout()
plt.show()

2.2 颜色变换

定义:颜色变换是通过改变图像的颜色特性来增强图像数据。这类方法主要包括亮度调整、对比度调整、饱和度调整和色相调整等。颜色变换能够帮助模型适应不同光照条件和色彩变化。

  • 亮度调整:亮度调整是通过增加或减少图像的亮度值来改变图像的整体亮度。此方法可以模拟不同的光照条件。

  • 对比度调整:对比度调整是通过改变图像中亮度值的分布来增强图像的对比度。提高对比度可以使得图像中的细节更加清晰。

  • 饱和度调整:饱和度调整是通过改变颜色的饱和程度来影响图像的色彩表现。增加饱和度可以使颜色更加鲜艳,而降低饱和度则会使颜色趋向灰色。

  • 色相调整:色相调整是通过改变颜色的色相值来改变图像的整体色调。此方法可以用来生成不同色彩风格的图像。
    在这里插入图片描述

Python 示例代码

import cv2
import numpy as np
import matplotlib.pyplot as plt

# 读取图像
image = cv2.imread('image.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

# 定义颜色变换
def augment_color(image):
    # 亮度调整
    bright = cv2.convertScaleAbs(image, alpha=1, beta=50)  # alpha=1保持亮度,beta增加亮度

    # 对比度调整
    contrast = cv2.convertScaleAbs(image, alpha=2, beta=0)  # alpha>1增加对比度

    # 饱和度调整
    hsv = cv2.cvtColor(image, cv2.COLOR_RGB2HSV)  # 转换到HSV颜色空间
    hsv[..., 1] = hsv[..., 1] * 1.5  # 增加饱和度
    saturated = cv2.cvtColor(hsv, cv2.COLOR_HSV2RGB)  # 转回RGB颜色空间
    
    return bright, contrast, saturated

# 进行增强
bright_image, contrast_image, saturated_image = augment_color(image)

# 可视化
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.title('Original Image')
plt.imshow(image)
plt.axis('off')

plt.subplot(2, 2, 2)
plt.title('Brightness Adjusted')
plt.imshow(bright_image)
plt.axis('off')

plt.subplot(2, 2, 3)
plt.title('Contrast Adjusted')
plt.imshow(contrast_image)
plt.axis('off')

plt.subplot(2, 2, 4)
plt.title('Saturation Adjusted')
plt.imshow(saturated_image)
plt.axis('off')

plt.tight_layout()
plt.show()

2.3 噪声添加

噪声添加是通过在图像中引入随机噪声来增强数据。这种方法可以帮助模型提高对噪声干扰的鲁棒性,模拟真实场景中可能出现的干扰。

  • 高斯噪声:高斯噪声是常见的噪声类型,其分布服从高斯分布。添加高斯噪声可以模拟传感器噪声。

  • 椒盐噪声:椒盐噪声是指图像中随机出现的亮点(盐)和暗点(胡椒),这种噪声可以模拟图像传输中的干扰。

  • 泊松噪声:泊松噪声通常用于模拟光子计数过程中的噪声,特别是在低光照条件下。

还可以是图像压缩噪声等等,这里不再一一介绍
在这里插入图片描述

Python 示例代码

def augment_noise(image):
    # 添加高斯噪声
    gauss = np.random.normal(0, 25, image.shape).astype(np.uint8)
    noisy_gauss = cv2.add(image, gauss)

    # 添加盐和胡椒噪声
    s_vs_p = 0.5
    amount = 0.04
    out = np.copy(image)
    # Salt noise
    num_salt = np.ceil(amount * image.size * s_vs_p)
    coords = [np.random.randint(0, i - 1, int(num_salt))
              for i in image.shape]
    out[coords] = 1

    # Pepper noise
    num_pepper = np.ceil(amount* image.size * (1. - s_vs_p))
    coords = [np.random.randint(0, i - 1, int(num_pepper))
              for i in image.shape]
    out[coords] = 0

    return noisy_gauss, out

# 进行增强
noisy_gauss, noisy_sp = augment_noise(image)

# 可视化
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.title('Gaussian Noise Added')
plt.imshow(noisy_gauss)
plt.axis('off')

plt.subplot(1, 2, 2)
plt.title('Salt and Pepper Noise Added')
plt.imshow(noisy_sp)
plt.axis('off')

plt.show()

3. 参考文献

[1] J. Liu, et al. "Image Data Augmentation for Deep Learning: A Review." IEEE Access, 2020.

[2] S. Perez and W. Wang. "The Effectiveness of Data Augmentation in Image Classification using Deep Learning." 2017.

[3] A. Shorten and T. Khoshgoftaar. "A survey on Image Data Augmentation for Deep Learning." Journal of Big Data, 2019.

[4] A. Ge, et al. "Data augmentation for deep learning: A review." Computer Science Review, 2021.

[5] F. Zhang, et al. "Noise Robust Image Classification using Deep Learning." IEEE Transactions on Image Processing, 2018.

[6] Y. Liu, et al. "Image Classification with Noise Robustness via Data Augmentation." International Journal of Computer Vision, 2020.

创作不易,烦请各位观众老爷给个三连,小编在这里跪谢了!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1951083.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据库安全综合治理方案(可编辑54页PPT)

引言:数据库安全综合治理方案是一个系统性的工作,需要从多个方面入手,综合运用各种技术和管理手段,确保数据库系统的安全稳定运行。 方案介绍: 数据库安全综合治理方案是一个综合性的策略,旨在确保数据库系…

C++文件系统操作6 - 跨平台实现查找指定文件夹下的特定文件

1. 关键词 C 文件系统操作 查找指定文件夹下的特定文件 跨平台 2. fileutil.h #pragma once#include <string> #include <cstdio> #include <cstdint> #include "filetype.h" #include "filepath.h"namespace cutl {/*** brief The fi…

前端练习<HtmlCSS>——照片墙(附完整代码及实现效果)

这个小练习也来源于b站up小K师兄&#xff0c;大家可以通过下面的链接学习哦~up讲的非常详细。 纯CSS写一个简单酷炫的照片墙效果&#xff5e; 先看一下这个照片墙的效果&#xff1a; 1.鼠标没有放到图片上时&#xff0c;照片同比例&#xff0c;每张照片都有倒影的效果。 2.然…

linux怎么创建python

第一步&#xff0c;创建一个test文件夹。 第二步&#xff0c;打开终端进入该文件。 第三步&#xff0c;vim test.py。 第四步&#xff0c;编写代码。 第五步&#xff0c;编辑好之后&#xff0c;按Esc键切换到命令模式&#xff0c;然后输入:wq&#xff0c;再按回车键即可自动保存…

聊一聊知识图谱结合RAG

因为最近在做一些关于提高公司内部使用的聊天机器人的回答准确率&#xff0c;并且最近微软官方也是开源了一下graphrag的源码&#xff0c;所以想聊一聊这个知识图谱结合rag。 rag在利用私有数据增强大模型回答的领域是一种比较典型的技术&#xff0c;也就是我们提出问题的时候&…

MATLAB基础:数组及其数学运算

今天我们继续学习MATLAB中的数组 我们在学习MATLAB时了解到&#xff0c;MATLAB作者秉持着“万物皆可矩阵”的思想企图将数学甚至世间万物使用矩阵表示出来&#xff0c;而矩阵的处理&#xff0c;自然成了这门语言的重中之重。 数组基础 在MATLAB中&#xff0c;数组是一个基本…

LCD 横屏切换为竖屏-I.MX6U嵌入式Linux C应用编程学习笔记基于正点原子阿尔法开发板

LCD 横屏切换为竖屏 横屏显示如何切换为竖屏显示 LCD 屏默认横屏显示 开发板配套的 LCD 屏默认都是横屏显示&#xff0c;如 4.3 寸、7 寸和 10.1 寸的不同分辨率的 RGB LCD 屏 固定坐标体系 &#xff08;以 800*480 分辨率为例&#xff09;横屏模式下的固定坐标&#xff1a;…

【JavaScript】深入理解 `let`、`var` 和 `const`

文章目录 一、var 的声明与特点二、let 的声明与特点三、const 的声明与特点四、let、var 和 const 的对比五、实战示例六、最佳实践 在 JavaScript 中&#xff0c;变量声明是编程的基础&#xff0c;而 let、var 和 const 是三种常用的变量声明方式。本文将详细介绍这三种变量声…

Blackbox AI-跨时代AI产物,你的私人编程助手

1. 引言 随着人工智能技术的飞速发展&#xff0c;我们的生活方式正在经历前所未有的变革。从智能家居到自动驾驶&#xff0c;AI已经渗透到我们生活的方方面面。而在这场科技革命中&#xff0c;Blackbox 网站凭借其先进的技术和全面的功能&#xff0c;成为了众多AI产品中的佼佼者…

基于单片机控制的锂电池组电路的设计

摘 要: 提 出 一 种 基 于 单 片 机 控 制 的 锂 电 池 组 电 路 设计 方 案 . 采 用 8 位 CMOS 闪 存 单 片 机 PIC16F886 作 为主控芯 片 , 电 路 设计 中 含 有 S-8254 芯 片 的 一 次 保 护 电 路 、 S-8244 芯 片 的 二 次 保 护 电 路 和 MCU 的 辅 助 保 护 功…

photoshop学习笔记——选区3 快速选择工具

快速选择工具 W shift W 在3种快速选择工具之间切换 对象选择工具 photoshop CC中没有这个工具&#xff0c;利用AI&#xff0c;将款选中的对象快速的提取选区&#xff0c;测试了一下&#xff0c;选区制作的非常nice快速选择工具 跟磁性套索类似&#xff0c;自动识别颜色相似…

qt初入门9:qt记录日志的方式,日志库了解练习(qInstallMessageHandler,qslog, log4qt)

项目中用到qt&#xff0c;考虑有需要用到去记录日志&#xff0c;结合网络&#xff0c;整理一下&#xff0c;做记录。 简单了解后&#xff0c;qt实现日志模块思考&#xff1a; 1&#xff1a;借助qt自带的qInstallMessageHandler重定向到需要的目的地。 2&#xff1a;自己封装一…

JAVA SE 类和对象

类和对象 类定义和使用类的定义格式 类的实例化什么是实例化 this 引用this引用的特性 对象的构造及初始化如何初始化对象构造方法概念特性 在这里插入图片描述 **注意**&#xff1a; 封装封装的概念封装扩展之包导入包中的类自定义包包的访问权限控制举例 static成员static修饰…

MOZHE SQL手工注入漏洞测试(MySQL数据库)

主界面URL没有参数&#xff0c;无法判断是否有注入点 点击公告 【浏览器不便于查看返回包可以用burp】 测试URL 参数后加上单引号&#xff0c;报错&#xff0c;说明存在注入点 http://124.70.64.48:40021/new_list.php?id1 获取表列数 order by 4 返回200 order by 5 …

鸿蒙应用框架开发【N-Body模拟程序】

N-Body模拟程序 介绍 在本示例中&#xff0c;使用ArkTS编程语言开发了业界编程语言基准测试项目[Benchmarks Game]中的[N体问题模拟程序]&#xff0c;实现类木星体轨道计算。 本示例用到了ohos.taskpool和ohos.worker 接口。示例中的程序可以用于AOT(Ahead Of Time)等性能测…

计科录取75人!常州大学计算机考研考情分析!

常州大学&#xff08;Changzhou University&#xff09;&#xff0c;简称“常大”&#xff0c;位于江苏省常州市&#xff0c;是江苏省人民政府与中国石油天然气集团有限公司、中国石油化工集团有限公司及中国海洋石油集团有限公司共建的省属全日制本科院校&#xff0c;为全国深…

⼤模型在⽹络安全⽅⾯的应⽤汇总

引⾔ ⼤语⾔模型&#xff08;Large Language Models, LLMs&#xff09;的横空出世&#xff0c;为传统计算机科学的各个细分领域带来了颠覆性的变⾰。这种变⾰的浪潮同样席卷了⽹络安全领域&#xff0c;引发了⼀系列深刻的变化和影响。GPT-4、Gemini、Llama 2 等⼤模型以其卓越的…

7月22日学习笔记 文件共享服务nfs,SAMBA文件共享与DNS域名服务

任务背景 由于业务驱动&#xff0c;为了提⾼⽤户的访问效率&#xff0c;现需要将原有web服务器上的静态资源 ⽂件分离出来&#xff0c;单独保存到⼀台⽂件服务器上。 任务要求 1. ⼀台应⽤服务器web-server部署apache&#xff0c;静态⽹⻚资源存放在另外⼀台NFS服 务器上 …

深入理解计算机系统 CSAPP 家庭作业11.7

静态内容是指在不同请求中访问到的数据都相同的静态文件。例如&#xff1a;图片、视频、网站中的文件&#xff08;html、css、js&#xff09;、软件安装包、apk文件、压缩包文件等。 /** get_filetype - derive file type from file name*/ void get_filetype(char *filename,…

12_TypeScript 模块 以及 模块化封装DB 库

TypeScript 模块 1、模块中暴露方法12、模块中暴露方法23、模块中暴露方法34、封装[上一节的db 库](https://blog.csdn.net/qq_46143850/article/details/140664100)5、TypeScript 命名空间 模块的概念&#xff08;官方&#xff09;&#xff1a; 关于术语的一点说明&#xff1a…