『数据增强』yolov5 数据增强 与 红外数据增强

news2024/11/27 2:24:13

目录

yolov5 数据增强

Mosaic

Copy paste

 Random affine

MixUp

 Albumentations

Augment HSV(Hue, Saturation,Value)

 Random horizontal flip

红外数据增强

红外图像的缺点                                                       

红外成像技术的特点

红外图像增强经典算法

 灰度线性变换

灰度非线性变换

 直方图处理

 红外图像数字细节增强(DDE)


yolov5 数据增强

YOLOv5网络详解_哔哩哔哩_bilibili

Mosaic

4张图像使用随机缩放随机裁剪随机排布的方式拼接成一张图片

Copy paste

直接复制粘贴,但是数据集必须要求实例分割的数据标签

 Random affine

仿射变换,即旋转,缩放,平移,错切

 yaml配置文件中,只启用了缩放和平移

MixUp

将两张图片按照一定透明程度混合成一张新的图片

源码中,每次只有10%的概率启用

 Albumentations

滤波、直方图均衡化以及改变图片质量等

是一个第三方包,安装了这个包就会启动。pip列表中是默认不去安装。

Augment HSV(Hue, Saturation,Value)

随机调整色度、饱和度、明度

 Random horizontal flip

按一定比例,将图片按水平方向翻转

红外数据增强

红外图像的缺点                                                       

(1)红外热图像表征景物的温度分布,是灰度图像,没有彩色或阴影,分辨率低、分辨潜力差;

(2) 红外图像空间相关性强、对比度低、视觉效果模糊;

(3) 红外图像的清晰度低于可见光图像;

(4)外界环境的随机干扰和热成像系统的不完善,给红外图像带来多种多样的噪声,导致红外图像的信噪比非常低;

(5)外界干扰造成红外图像的非均匀性,体现为图像的固定图案噪声、串扰、 畸变等。


红外成像技术的特点

(1)红外辐射能够穿过雾、烟尘而且系统工作波段宽,系统作用距离远;

(2)采取被动工作方式,不易被发现或受干扰;

(3)可在昼夜或恶劣气候下工作,接近全天候;

(4)适合高精度跟踪瞄准;

(5)不易受射击、爆炸和照明闪光等强光影响。

图像工程:红外图像增强_Truth?的博客-CSDN博客

红外图像增强经典算法

图像增强是指根据特定的需要突出图像中的重要信息,同时减弱或去除不需要的信息。从不同的途径获取的图像,通过进行适当的增强处理,可以将原本模糊不清甚至根本无法分辨的原始图像处理成清晰的富含大量有用信息的可使用图像,有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域,从而更加容易对图像中感兴趣的目标进行检测和测量。

 灰度线性变换

灰度反转

分段线性拉伸

灰度非线性变换

指数变换用于扩展高灰度区,一般适用于过亮的图像

指数变换

 对数变换用于扩展低灰度区,一般适用于过暗的图像

对数变换

 直方图处理

全局均衡

局部直方图均衡

直方图匹配(直方图规范化)

 红外图像数字细节增强(DDE)

红外图像数字细节增强(DDE)介绍 - 知乎

红外图像通常用于检测低热量的物体,因此需要具有较高的动态范围来捕捉不同温度的目标物体。较高的位深度可以提供更多的灰度级,从而更准确地表示各个温度的变化,所以红外系统中图像大多是14位或更高位的。

而通常显示的设备只要求8位数据宽度,所以需要将14位压缩到8位。于是,如果压缩方法处理不当,使得本来探测到大动态图像的信息得不到显示,即大动态图像压缩可能会造成原有信息丢失,在显示图像中表现为图像细节的损失。

对于目前常用的线性映射(如AGC,Automatic Gain Control)或非线性映射(如直方图均衡、gamma变换)等压缩方法,由于小目标或物体局部的图像在温差或像素上都不占优势,使得这些方法在大动态图像的压缩中普遍存在缺陷。

DDE(Digital Detail Enhancement)技术可以解决这个问题,它是一种高级非线性图像处理算法,在算法处理时,先利用特殊的滤波器将图像的背景层(低频部分)和细节层(高频部分)进行分离,然后分别对提取的背景层和细节层进行相应的灰度增强和噪声抑制处理,再调整和压缩各图层的动态范围,最终合成一幅8bits的输出图像。这样,就可以在8bits范围内表现处14bits图像中的大动态温差以及目标局部的细节信息。

       低频信息:低频信息主要反映图像的整体亮度、颜色和较大尺度结构。这包括图像的平坦区域、背景、光照等。低频信息在图像中的变化较为平缓,变化趋势相对缓慢。

     高频信息:高频信息主要反映图像中的细节、纹理和较小尺度的结构。这包括图像中的边缘、纹理细节、目标物体的边界等。高频信息在图像中的变化较为剧烈,有许多细微的变化。

如上图所示,相比普通的线性映射及直方图均衡算法,DDE可以在保留动态范围的前提下,极大的增强图像的细节。图(a)中人的面部(位置1),电路板(位置3)这些高温物体的局部温差不仅都得到了体现,而且可在位置2上发现热像自身辐射在玻璃上反射所成的镜像,图(c)中高炉的炉壁以及中间的燃料通过DDE增强后也清晰可见。

声明:本文整理自网络,已在文中指明出处;如有侵权立删除!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/759951.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

常用电子元器件检测方法与经验

电子元器件检测是电子工程师和技术人员工作中不可或缺的一部分。在电子元器件制造和使用过程中,需要对元器件进行检测,以确保其质量和性能符合要求。在本文中,我们将介绍常用的电子元器件检测方法和经验,以帮助读者更好地了解和掌…

redux之reducer 为什么必须是纯函数?

在一个应用中,所有的 state 都是以一个对象树的形式存在一个单一的 store 中,唯一改变 state 的办法就是触发 action,而 reducer 就是用来编写专门的函数决定每个 action 如何改变应用的 state 。 在 Redux store 中保存了 reducer 返回的 这…

make/makefile的使用

make/makefile 文章目录 make/makefile初步认识makefile的工作流程依赖关系和依赖方法make的使用 总结 make是一个命令,是一个解释makefile中指令的命令工具,makefile是一个文件,当前目录下的文件,两者搭配使用,完成项…

RabbitMQ ---- 延迟队列

RabbitMQ ---- 延迟队列 1. 延迟队列的概念2. 延时队列使用场景3. RabbitMQ 中的 TTL3.1 消息设置 TTL3.2 队列设置 TTL3.3 两者的区别 4. 整合 springboot4.1 创建项目4.2 添加依赖4.3 修改配置文件4.4 添加 Swagger 配置类 5. 队列 TTL5.1 代码架构图5.2 配置文件类代码5.3 消…

基于PyQt5的UI界面开发——菜单与工具栏

窗口类型 我们进入QtDesigner,创建主窗口有三种类型:QMainWindow、QDialog 和 QWidget。 在新建应用程序窗口,通常选择 MainWindow 创建主窗口的图形界面就可以了。QtDesigner 创建的 “MainWindow” 虽然是一个空白的图形窗口,但…

Redis进阶底层原理 - 高可用哨兵模式

Redis哨兵模式是redis实现高可用的一种分布式架构。哨兵节点是一种特殊的Redis实例,它不用于存储业务数据,它主要工作内容如下:(高可用不是指不出问题,而是出了问题后能及时的自动化解决,从而在客户端无感&…

Qt 项目架构之----MVC架构

MVC 模式代表 Model-View-Controller(模型-视图-控制器) 模式。这种模式用于应用程序的分层开发。 Model(模型)-是应用程序中用于处理应用程序数据逻辑的部分。通常模型对象负责在数据库中存取数据。View(视图&#x…

web攻击

web攻击分为,信息泄露,弱口令,xss攻击,sql注入,文件上传,文件包含,webs hell,命令执行,xml实体注入。 #信息泄露 信息泄露主要包括敏感信息的信息,像口令&…

leetcode1171. 从链表中删去总和值为零的连续节点

1171. 从链表中删去总和值为零的连续节点 - 力扣(Leetcode) 累加数据和重复出现相同时,说明从相同和的第一次出现的下一个结点到最后一次相同累加数据的结点和为0,删除这段结点串、 给你一个链表的头节点 head,请你编…

Yocto系列讲解[技巧篇]92 - armv8 aarch64兼容armv7 32位程序运行环境

By: fulinux E-mail: fulinux@sina.com Blog: https://blog.csdn.net/fulinus 喜欢的盆友欢迎点赞和订阅! 你的喜欢就是我写作的动力! 目录 概述使能Multilib支持32位的helloworld程序执行出现No such file or directorylibc.so.6 cannot open shared object file修改内容固化…

整数数组的奇数位于数组的前半部分,偶数位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变

题目:输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有的奇数位于数组的前半部分,所有的偶数位于数组的后半部分,并保证奇数和奇数,偶数和偶数之间的相对位置不变。 思路1: 类…

一.CreateFileMapping实现的共享内存及用法

共享内存概念 1.在32位的Windows系统中,每一个进程都有权访问他自己的4GB(2324294967296)平面地址空间,没有段,没有选择符,没有near和far指针,没有near和far函数调用,也没有内存模式…

CUDA并行编程

gpu 图形处理专用单元 cpu是主机单元 gpu显卡处理器 专门执行复杂数学和几何计算 不同表面有不同光纤效果 必须达到快速计算能力 gpu专门设计为大规模并行吞吐处理设计 用于加速图形显示 , 吞吐量高 峰值计算能力 4612 GFLOP/S 一秒钟可以计算4612G次浮点数计算…

SQL注入实操

文章目录 一、sqli-lab靶场搭建二、通关笔记1.Less-1a.单引号‘b.updatexmlc.concatd.unione.information_schemaf.GROUP_CONCATg.select 1,2 2.Less-2 一、sqli-lab靶场搭建 下载路径:https://www.hibugs.net/hi-resource/sqli-labs-master.zip 下载后解压复制到w…

腾讯数据中台项目集管理实战分享︱腾讯高级项目经理张嵎桐

腾讯PCG大数据平台部高级项目经理张嵎桐先生受邀为由PMO评论主办的2023第十二届中国PMO大会演讲嘉宾,演讲议题:腾讯数据中台项目集管理实战分享。大会将于8月12-13日在北京举办,敬请关注! 议题简要: 在“IT时代”向“…

9、加载cesium世界地形

本节演示使用CCsium库加载cesium的世界地形,使用第四节单击事件的例子,修改点击事件添加地形。 1、ceisum显示地形需要引入CesiumTerrainProvider和CreateWorldTerrain类。与ceisum类似,修改鼠标点击事件,创建地形并添加到ceisum…

Apache Doris (二十八):Doris 数据导入(六)Spark Load 1- 原理及配置

目录 1. 基本原理 2. Spark集群搭建 2.1 Spark Standalone 集群搭建 2.2 Spark On Yarn 配置 3. Doris配置Spark与Yarn 3.1 Doris配置Spark 3.2 Doris配置Yarn 进入正文之前,欢迎订阅专题、对博文点赞、评论、收藏,关注IT贫道,获取高质…

leetcode:定长字串中元音的最大数目

定长字串中元音的最大数目 medium 给你字符串 s 和整数 k 。 请返回字符串 s 中长度为 k 的单个子字符串中可能包含的最大元音字母数。 英文中的 元音字母 为(a, e, i, o, u)。 示例 1: 输入:s "abciiidef", k 3 输出…

KBLAutoSwitch偶尔无法自动切换输入法的问题

KBLAutoSwitch(https://github.com/flyinclouds/KBLAutoSwitch)是一款中英文输入法自动切换软件,但是在使用过程中偶尔会出现无法自动切换成自己想要的输入法的问题,比如我将cmd窗口设为自动切换英文输入法,但是在使用…