ADAS-GPM

news2025/1/10 16:49:01


文章目录

  • Abstract
  • Introduction
    • main contribution
  • Related work
    • 特征融合
    • 上下文信息和注意力机制
    • 超分辨率
    • 锚框分配
  • Method
  • Experiment

link

Abstract

微小目标检测最近的一个趋势是引入更细粒度的标签分配策略,为分类和回归提供有希望的监督信息。然而,以往大多数基于IoU (intersection - overunion)的方法存在两个主要缺陷,包括:(1)IoU对微小目标边界盒偏差的容忍度较低;(2)样本间和样本内失衡导致的优化指导不足。作者提出了两种新的解决方案来解决这些问题:基于高斯概率分布的模糊相似度度量(GPM)和自适应动态锚点挖掘策略(ADAS)GPM旨在解决小边界框与预设锚点之间不准确的相似度测量问题,为标签分配提供更准确的基础。ADAS采用动态调整的策略进行标签分配,以解决正负样本分布偏差的问题,确保标签分配与图像中物体的分布一致

在AI-TODv2和其他微小目标检测数据集上进行了大量实验,以评估所提出的ADAS- GPM方法的性能。结果表明,在具有挑战性的AI-TODv2基准测试中,将ADAS-GPM集成到基于锚点的目标检测器中,其性能明显优于最先进的方法。所提出的ADAS-GPM方法取得了良好的结果,充分证明了该方法的有效性和潜力。

Introduction

另一方面,TOD提出了具体的挑战,包括由于特征提取中的子采样操作而导致的信息丢失,难以检测微小物体的噪声特征表示,以及对微小物体的边界盒扰动的低容忍度。遥感中的远程成像由于提供较少的边界框特征表示信息而增加了背景干扰,从而加剧了这些挑战。此外,航空图像通常信噪比较差,更容易受到图像噪声污染,导致图像模糊,细节丢失。这种低信噪比尤其不利于从微小物体中提取特征。与检测适当大小的物体相比,检测微小物体会带来更大的困难,如上所述,即使是最先进的探测器在检测这两种不同大小的物体时也表现出显著的差异。
使用IoU作为微锚分配的标准存在两个主要缺点:1)对微小目标定位偏差高度敏感。具体来说,对于微小的物体,轻微的偏差会导致IoU急剧下降,甚至下降到0。具体来说,对于微小尺寸的对象,像素的轻微偏差可能导致IoU值严重下降甚至为零,从而显着增加了采样正/负锚帧的难度。这种不稳定的变化极大地增加了分配策略中正/负锚点抽样的难度。

如图1所示,对于一个微小的物体,边界框内沿对角线方向稍有3个像素的偏差,就会导致IoU从100%显著下降到23.0%。同样的偏差对中型和大型对象的IoU值的影响更平滑,分别为66.0%和88.0%。这说明IoU对尺寸较小的物体更加敏感,并且随着物体尺寸的减小,IoU的变化更加剧烈

2)当两个边界框不相交时,IoU得分为0,当它们完全重叠时,IoU得分为1。如[86]所述,iou并不能很好地反映两者的相似性。即使边界框之间的IoU值相同,它们也可能对应各种重叠情况[63](如果这么说的话那些中心点相似性度量又何尝不是呢)。然而,在TOD中,多个对象聚在一起是很常见的,采用IoU来划分正锚和负锚是不可行的。当最高维度特征图上的预定义锚包含IoU无法区分的多个密集微小对象时,这尤其成问题。

通常,静态锚点分配策略无法解释不同大小、形状和遮挡水平下物体外观的显著变化。手工制作的分配可能导致正锚和负锚的不平衡划分,主要是在处理细长、拥挤和微小的对象时。上述观察结果表明,基于iou的静态锚分配可能会阻碍在微小对象和预定义锚之间建立适当的关系。

作者讨论了基于iou的静态锚分配中的两种不平衡分布。
1)不同大小的对象被分配不同数量的阳性样本,导致样本内不平衡。由于IoU对微小物体的敏感性,训练中微小物体的阳性样本数通常比大物体的少得多。在分类和回归过程中,样本内不平衡可能导致模型倾向于预测较大的目标,这可能会降低检测性能。
2)与微小物体匹配的阳性样本数量少,导致样本间不平衡
第一点是强调在每个训练批次或样本内部的阳性样本不平衡,第二点则是强调在整个数据集中的阳性样本不平衡

如图3(b)所示,当使用MaxIoU策略为物体分配正锚和负锚时,两个微小物体(车辆和船舶)都没有匹配正锚,因为它们与锚之间的IoU没有达到预定义的阈值。这种现象在为微小物体分配锚点时很常见,这导致在训练时期,正锚点的数量远远少于负锚点的数量。不幸的是,这些问题无法通过基于ou的分配策略得到缓解,从而加剧了训练过程中正负样本不平衡的问题。

基于此,本文设计了基于高斯概率分布的模糊相似度度量(GPM),并提出了一种自适应动态锚点挖掘策略(ADAS)。将以上两部分(ADAS和GPM)结合起来,得到一种新的锚点挖掘策略,简称ADAS-GPM。它是一种有效、灵活的TOD锚点分配策略,解决了样本间和样本内的不平衡问题。将ADAS-GPM与基于锚点的目标检测算法相结合,进一步提高了航拍图像TOD的性能。

为了计算盒之间的相似性,将水平边界盒转换为二维高斯分布。作者利用KFIoU[78]中使用的卡尔曼滤波方法来计算二维高斯分布之间的重叠面积将Wasserstein距离、Bhattacharyya距离[4]、Kullback - Leibler散度[38]等各种统计距离度量相结合,对度量进行优化,最后将新度量(GPM)与质量感知锚点挖掘方法(ADAS)相结合,为每个锚点动态分配正负锚点。GPM度量解决了IoU在两个边界框不重叠或包含在另一个边界框内时无法准确度量两个边界框相似性的问题ADAS有效地解决了微小目标匹配中的样本间和样本内不平衡问题,使网络能够同时考虑不同尺度目标的回归。

main contribution

  1. 提出了一种新的基于高斯概率分布的模糊相似度度量(GPM)来解决小边界框与预定义锚点之间匹配不良的困难。与检测器中使用的IoU相比[60],作者的方法达到了更高的精度。
  2. 提出了自适应动态锚点挖掘策略(ADAS),以确保为微小目标分配足够的高质量正锚点。缓解了样本间和样本内TOD不平衡的问题;因此,微小物体预测的整体质量变得更加准确和可靠。
  3. 基于广泛的实验,在AI-TODv2数据集上实现了与最先进方法相当的性能[72]。就像即插即用一样,作者的方法很好地应用于基于锚点的探测器。

Related work

特征融合

CNN架构的浅层通常侧重于描述几何细节,而缺乏抽象的语义信息。相比之下,深层则表现出完全相反的特征。在当前的检测范式中,小物体通常被分配到最低的金字塔特征,导致冗余表示增加[18]。整合不同层次的特征可以提供更精确的位置信息和鲁棒的语义上下文,从而提高微小物体检测的准确性。FS-SSD[45]采用平均池化的不同缩放分支形成特征金字塔,调整原有的特征融合分支进行小目标检测。BIFPN[13]将浅层特征与双向跨尺度层相结合,获得丰富的空间信息,有助于中小目标的检测。ABFPN[82]采用亚光卷积增强多尺度特征融合,进一步提高小目标检测的整体性能。SSPNet[34]指出了不同特征图之间的梯度不一致,使得浅层特征图无法充分利用其信息来检测微小物体。为了解决这个问题,SSPNet为浅层和深层建立了适当的特征共享规则。EFF[32]通过统计方法计算相邻特征层的融合因子,实现了信息从深层向浅层的传递。特征融合的出现在很大程度上弥补了金字塔下层和上层之间的空间和语义差距。

上下文信息和注意力机制

小物体往往与其他物体或背景共变,其中蕴含着丰富的上下文信息。有效地利用环境与小物体以及其他物体之间的关系,有利于微小物体的识别。inside - outside Net[3]引入了跳跃池和空间递归神经网络,分别提取感兴趣区域内外的上下文信息Hu[35]针对不同的尺度训练了单独的检测器,并以尺度不变的方式对局部上下文信息进行建模,以检测微小的人脸。注意机制[67]在计算机视觉中起着至关重要的作用,在以前的文献中得到了广泛的研究[70,85],表明了物体检测的巨大潜力。R2-CNN[58]利用全局注意力块从大尺度遥感图像中快速有效地提取小目标特征。

超分辨率

与低分辨率图像相比,高分辨率图像可以揭示物体,尤其是小物体更详细的信息。利用超分辨率网络提高输入图像的分辨率对于丰富微小物体的信息具有重要意义。PGAN[42]指出,感知生成网络缩小了微小物体和大型物体之间的表征差距。TinyFaceGAN[2]为GAN引入了一个重构模块,使其能够增强细节,并从模糊的人脸中生成清晰、高分辨率的人脸。在RemoteSGAN[19]中,将辅助网络集成到GAN中,以提高图像空间分辨率,并实现遥感图像中小目标的高精度。在[6]中,提出了一种针对微小物体的数据增强方法,该方法将GAN的对象生成器与目标分割、图像补绘和图像混合技术相结合。

锚框分配

锚点分配策略是基于锚点的检测器中的一项关键技术。然而,为微小的对象分配合理的、预定义的锚是非常具有挑战性的。ATSS[84]基于统计方法为阳性和阴性样本产生自适应阈值,使其能够自动为每个对象分配正确数量的阳性锚点。OTA[29]在全局上解决锚点分配问题,并将其表述为最优运输问题,旨在以最小的成本分配正锚点。PAA[36]概率分布正锚点和负锚点。损失感知标签分配[31]根据联合损失值将损失较小的锚点定义为正样本,反义锚点定义为负样本。

Method

该论文提出了一种基于高斯概率分布的模糊相似度指标(GPM)和自适应动态锚点挖掘策略(ADAS)来检测微小物体。首先,通过将轴对齐的边界框表示为两个维度的高斯分布,可以更准确地评估微小物体之间的相似度。其次,该论文引入了Kullback-Leibler距离(KLD)与IoU相结合的新评价指标,以提高GPM的准确性。最后,该论文还提出了一个自适应动态锚点挖掘策略(ADAS),该策略可以根据每个真实目标分配适当的正样本数量,并结合静态信息(如IoU、GPM等)设计一个渐进匹配规则,从而避免子优化和过拟合问题

相比于传统的IoU评价指标,该论文提出的GPM具有更好的一致性反映差异性和更适合测量微小物体之间相似度的特点。同时,通过引入预测分数作为指导灵活分配正负锚点的数量,该论文提出的ADAS可以更好地平衡不同大小的目标所分配的正负样本数量,从而实现更平衡的优化效果。

解决了传统IoU评价指标在测量微小物体之间相似度时存在的灵敏度问题,以及传统锚点挖掘策略中存在的一些不平衡问题,例如不同大小的目标所分配的正负样本数量不均衡等。通过引入GPM和ADAS,该论文提出了一种更准确、更平衡的微小物体检测方法。

Experiment



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1985385.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RN环境遇到的问题

空闲学习,记录一下遇到一些问题 RN中文网 问题1:npm error code CERT_HAS_EXPIRED 原因是本地 证书过期解决办法参考 npx react-native init testProject报错: npm error code CERT_HAS_EXPIRED npm error errno CERT_HAS_EXPIRED npm er…

20240806吃干榨尽飞凌OK3588-C的8+64的核心板的eMMC存储空间resize2fs

20240806吃干榨尽飞凌OK3588-C的864的核心板的eMMC存储空间 2024/8/6 11:25 缘起,使用了飞凌OK3588-C的864的核心板,但是默认的LINUX R4版本的SDK编译的IMG固件,刷机之后貌似默认只使用了32GB?的eMCC空间。 联系飞凌提供了resize2…

【ML】为什么要做batch normlization,怎么做batch normlization

为什么要做batch normlization,怎么做batch normlization 1. batch normlization1.1 批量归一化是什么:1.2 为什么要做批量归一化: 2. feature normalization2.1 特征归一化是什么:2.2 为什么要做特征归一化: 3. batc…

Linux中apache服务安装与mysql安装

目录 一、apache安装 二、MySQL安装 一、apache安装 准备环境:一台虚拟机、三个安装包(apr-1.6.2.tar.gz、apr-util-1.6.0.tar.gz、httpd-2.4.29.tar.bz2) 安装过程: tar xf apr-1.6.2.tar.gz tar xf apr-util-1.6.0.tar.gz tar xf http…

怎么限制电脑不能打开某个网页或网站(四个方法你可一定要学会)

老板:我公司的员工真的很让人头疼。 朋友:怎么了? 老板:我一不在就有人偷偷打开某些违法网站,画面不可描述啊! 朋友:难道你还不知道可以禁止员工打开某个网站? 老板:…

传奇三职业复古单机版+无需虚拟机一键安装

今天给大家带来一款单机游戏的架设:传奇单机版。沉默版本 三职业 数值不变态 ,没有花里胡哨的东西(比如切割,生肖,时装等功能),客户端为16周年客户端 。另外:本人承接各种游戏架设&a…

[论文阅读笔记34] LISA (LISA: Reasoning Segmentation via Large Language Model) 代码精读

LISA是一个很好的Reason Segmentation的baseline, 其利用特殊的token [SEG]来微调多模态LLM和SAM的decoder来实现复杂逻辑下的prompt的推理分割. 其整体框图如下, 本篇文章精度此代码并作简单复现. 1. 推理流程 流程如下: 1.1 加载Tokenizer与模型 首先利用trans…

为什么越来越多的企业走上了数字化转型之路?

原因很简单,只要我们稍加了解就能明白的。 一方面是国家政策支持,另一方面是市场竞争的压力(什么产能过剩、服务过剩、经营维度低等因素都是导致企业不得不转型提升利润的关键点)。而恰恰数字化转型是能给企业带来效率提升、成本…

MS2201以太网收发电路

MS2201 是吉比特以太网收发器电路,可以实现超高速度的 全双工数据传输。它的通信遵从 IEEE 802.3 Gigabit Ethernet 协议 中的 10 比特接口的时序要求协议。 MS2201 支持数据传输速率从 1Gbps 到 1.85Gbps 。 主要特点 ◼ 电源电压: 2.5V 、 3.3V …

【Qt】管理创建子项目

新建项目 打开是这样,无法添加子项目 pro添加 TEMPLATE subdirs有了 点击添加子项目 其他项目-子目录项目 (空的子项目,只有pro,无h、cpp) 子目录名字 直接创建子目录下子项目 选择有无界面或者其他类型项目 …

Python pyinstaller打包exe最完整教程

1 简介 python提供了多种方法用于将普通的*.py程序文件编译成exe文件(有时这里的“编译”也称作“打包”)。exe文件即可执行文件,打包后的*.exe应用不用依赖python环境,可以在他人的电脑上运行。 pyinstaller是一个第三方模块&a…

《网络安全自学教程》- Windows防火墙原理分析与策略配置

《网络安全自学教程》 防火墙(Firewall)是用来「隔离」内、外「网络」的安全设备,可以是硬件设备、软件或者云防火墙。 Windows防火墙 1、防火墙分类1.1、包过滤防火墙1.2、应用代理防火墙1.3、状态检测防火墙1.4、下一代防火墙2、开启防火墙3、添加策略1、防火墙分类 防火…

OSPF路由协议多区域

一、OSPF路由协议单区域的弊端 1、LSDB庞大,占用内存大,SPF计算开销大; 2、LSA洪泛范围大,拓扑变化影响范围大; 3、路由不能被汇总,路由表庞大,查找路由开销大。 二、如何解决OSPF单区域的问题? 引入划分区域 1、每个区域独立存储LSDB,划分区域减小了LSDB。 2、…

Python的100道经典练习题,每日一练,必成大神!!!

Python的100道经典练习题是一个广泛而深入的学习资源,可以帮助Python初学者和进阶者巩固和提升编程技能 完整的100多道练习题可在下面图片免沸获取哦~ 整理了100道Python的题目,如果你是一位初学者,这一百多道题可以 帮助你轻松的使用Python…

Harbor系列之11:制品签名

借助Cosign或Notaion对制品进行签名 制品签名和签名验证是关键的安全功能,它们允许你验证制品的完整性。Harbor 通过与 Cosign 或 Notation 的集成来支持内容信任。 项目管理员可以配置项目以强制执行内容信任,要求所有制品在从 Harbor 注册表中拉取之…

Vue3 中如何使用 Monaco

本文将介绍如何在 Vue3 使用 Monaco。 创建 vue3 项目 通过以下命令创建项目,根据提示一步一步创建即可。 npm create vuelatest除了 Typescript 其他全默认即可。 安装项目依赖 Monaco 开源项目很多,这个项目更新很活跃,用法和 react …

一、安装go环境以及编译输出HelloWorld

目前的热门技术方向从分布式微服务开始转向云原生而云原生方向需要掌握GO语言,基于此决定利用平时的时间来完成GO语言的学习。 安装(基于mac m1) (翻看了网上很多的资料,发现很多人记录的有很多问题,一个…

SuccBI+低代码文档中心 — 低代码应用(SuperPage)(上)(重点)

SuperPage介绍 SuperPage是SuccAP提供的一种可视化设计制作任意的、业务化的和个性化的页面或对话框的功能。 使用SuperPage制作个性化页面或对话框相比于传统编码方式具有如下优势: 低成本、高效率零编码、易维护可扩展、高复用美观易用、不损失业务体验 新建Su…

PMP新考纲下,考前冲刺指南

01新考纲变化 【1】题型变化 旧考纲:考试题目为200道单选题,敏捷题型占比不足10% 新考纲:考试题目为180道题;题型将包括单选题和多选题,多选题将说明需选择几个正确选项;敏捷项目管理比重增加。 【2】内…

免费【2024】springboot 分类信息服务平台移动端的设计与实现

博主介绍:✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围:SpringBoot、Vue、SSM、HTML、Jsp、PHP、Nodejs、Python、爬虫、数据可视化…