尺度和位置敏感的红外小目标检测

news2024/11/13 12:01:48

Infrared Small Target Detection with Scale and Location Sensitivity

        在本文中,着重于以更有效的损失和更简单的模型结构来提升检测性能。

问题一

        红外小目标检测(IRSTD)一直由基于深度学习的方法主导。然而,这些方法主要集中在复杂模型结构的设计上,以提取有区别的特征,而对IRSTD的损失函数的研究不足。例如,广泛使用的交并(IoU)和Dice损失对目标的尺度和位置缺乏敏感性,限制了检测器的检测性能。为了获得更好的检测性能,研究人员开发了几种损失函数。例如,对抗训练的损失、目标边缘检测的边缘损失以及目标和背景图之间的似然性损失。然而,这些损耗是针对特定的网络架构而定制的,限制了它们更广泛的应用。与这些专用损失不同,箱级(box-level)IRSTD采用了GIoU和CIoU损失。然而,这些IoU变体损失仍然缺乏尺度和位置的敏感性。

创新点

        与这些损失相比,本文制定了一个更适合IRSTD的一般损失函数。它可以区分不同尺度和位置的目标,使不同的探测器获得更好的探测性能。提出了一种新的尺度和位置敏感(SLS)损失来解决现有损失的局限性有助于检测器区分不同尺度和位置的目标:

        1)对于尺度敏感,根据目标的预测尺度和地面真实尺度来计算IOU损失的权重。预测尺度和真实尺度之间的差距越大,检测器将越关注。基于目标尺度计算IoU损失的权重,以帮助检测器区分不同尺度的目标;

        2)对于位置敏感,设计了一个位置惩罚的基础上预测和地面真实的中心点的目标,以帮助检测器更精确地定位目标。与传统的L1和L2距离相比,所设计的定位损失在不同的定位误差下产生相同的值,使得检测器能够更精确地定位目标。

问题二

        为了获得更有效的特征,大量的工作都集中在模型结构的设计上。Li 等人定制了一个密集嵌套的交互式模块,以实现多层特征融合。Zhang等人利用Taylor有限差分和方向注意策略提取目标的边缘信息。然而,这种复杂的模型结构不仅带来了更多的计算成本,但由于缺乏有效的损失函数仍然受到中等的检测性能

创新点

        设计了一个简单的面向普通U-Net的多尺度头(MSHNet),它为每个输入产生多尺度预测通过将SLS损失应用于预测的每个尺度以更少的时间消耗实现了SOTA性能。

网络结构

1. 尺度和位置敏感(SLS)损失

        尺度和位置敏感(SLS)损失,表示为LSLS,旨在处理现有损失的尺度和位置的不敏感性。它包括尺度敏感损失和位置敏感损失。从形式上讲,

其中LS和LL分别表示尺度敏感损失和位置敏感损失。下面,从尺度敏感性损失开始详细介绍SLS损失,这是基于常用的IoU损失。

1)尺度敏感损失

        假设Ap和Agt是目标的预测像素和地面实况像素的集合,它们之间的IoU损失可以公式化为:

        虽然已经被广泛用于IRSTD中,但IoU损失对目标的尺度和位置不敏感。通过为IoU损失提供权重来实现尺度敏感损失:

其中Var(·,·)是获取所提供标量的方差的函数。

2位置敏感损失

        位置敏感损失的计算是基于预测和地面实况中心点的目标。给定预测像素组Ap和地面实况像素组Agt,通过对所有像素的坐标求平均来获得Ap和Agt的对应中心点,其分别表示为cp =(xp,yp)和cgt =(xgt,ygt)。然后,将这两个中心点的坐标转换到极坐标系中。以cp为例,极坐标系中对应的距离dp和角度θp为:

        位置敏感损失可通过以下方式获得:

其中dgt和θgt分别是极坐标系中cgt的距离和角度。定位损失有效地区分了大多数不同的定位误差,使检测器对不同类型的定位误差敏感,并更准确地定位目标。

2. MSHNet检测器

        在本节中,将介绍MSHNet检测器,它是通过在普通U-Net中引入一个简单但有效的多尺度头来实现的。MSHNet的概况如图4所示。以常用的U-Net作为骨干网。在解码器中具有不同尺度的特征图被馈送到不同的预测头以获得不同尺度的预测。最后,将来自不同特征图的所有预测进行级联(如果需要,在级联之前采用上采样)以获得最终预测。在训练阶段,SLS损失被应用于每个预测。在下文中,首先详细描述多尺度头。然后介绍了SLS损耗在MSHNet中的应用。

(1)Multi-Scale Head

        设Xi为U-Net解码器中第i个尺度的特征映射,其中Hi ×Wi为空间大小,Ci为通道数。根据现有作品中的常见设置,U-Net中有4个尺度,这意味着i ∈ {1,2,3,4}。

        第i个预测pi ∈ RHi×Wi×1由相应的预测头获得,该预测头由卷积层和sigmoid激活函数实现:

注意,不同的预测头具有它们自己的专用参数。最终预测p 是基于所有4个预测获得的:

(2)Training MSHNet with SLS Loss

        由于SLS损失对尺度敏感,并且MSHNet的预测中有几个尺度,因此将SLS损失应用于所有预测。SLS损失对不同的尺度产生不同的损失值,即使它们共享相同的空间布局。假设,通过将SLS损失应用于不同的尺度,具有不同尺度的目标可以吸引检测器的不同注意力,从而导致整体上更好的检测性能。

        设pgt是地面真值标签。MSHNet的最终损失是:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2091554.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python-春游

[题目描述] 老师带领同学们春游。已知班上有 N 位同学,每位同学有从 0 到 N−1 的唯一编号。到了集合时间,老师确认是否所有同学都到达了集合地点,就让同学们报出自己的编号。到达的同学都会报出自己的编号,不会报出别人的编号&am…

单链表应用

基于单链表实现通讯录项目 //Contact.c #define _CRT_SECURE_NO_WARNINGS 1 #include"contact.h" #include"list.h"//初始化通讯录 void InitContact(contact** con) {con NULL;} //添加通讯录数据 void AddContact(contact** con) {PeoInfo info;printf…

无主灯设计:吊顶之问与光影艺术的探索

在现代家居设计中,照明不仅仅是为了满足基本的照明需求,更是一种艺术和情感的表达。随着无主灯设计越来越受到人们的青睐,许多业主开始考虑一个问题:进行无主灯设计时,是否一定需要吊顶呢?本文将深入探讨这…

2017年系统架构师案例分析试题五

目录 案例 【题目】 【问题 1】(5 分) 【问题 2】(16 分) 【问题 3】(4 分) 【答案】 【问题 1】解析 【问题 2】解析 【问题 3】答案 相关推荐 案例 阅读以下关于 Web 系统架构设计的叙述,在答题纸上回答问题 1 至问题 3。 【题目】 某电子商务企业因发…

小波神经网络的时间序列的短时交通流量预测

小波神经网络的时间序列的短时交通流量预测 通过小波分析进行负荷序列分 解, 获得不同频率负荷分量规律 ; 由粒子群算法进行粒子群适应度排序 , 提升算法收敛速度和收敛能力 ; 为避免算法陷入局部 收敛性, 引入混沌理论来增强全局搜索能力 。 预测结果

linux 系统如何进行nfs(第五节)

网上的截图: 自己的操作: 首先是 在虚拟机中的操作。 然后是在开发板上的操作。 已经是没有问题了。

AI绘画【Stable Diffusion】抽卡必备!时间管理大师Agent Scheduler插件,一键设置任务,让你的休息时间充分利用起来!

大家好,我是灵魂画师向阳 相信大家在玩 Stable Diffusion 的时候一直有一个痛点,每次出图抽卡时都只能等待上一次抽卡结束,才能继续下一次抽卡; 特别是当我们想抽大量的卡来测试不同的模型,不同的参数的效果时&#…

大学生社团管理系统

一、项目概述 Hi,大家好,今天分享的项目是《大学生社团管理系统》。 随着校园文化的不断丰富,大学里各种社团越来越多,社团活动也越来越频繁,社团管理就显得繁琐,传统的人工管理方式比较麻烦,…

Client客户端模块

一.Client模块介绍 二.Client具体实现 1.消费者/订阅者模块 2.信道管理模块 3.异步线程模块 4.连接管理模块 这个模块同样是针对muduo库客户端连接的二次封装,向用户提供创建channel信道的接口,创建信道后,可以通过信道来获取指定服务。 三…

游泳耳机哪个牌子好?四大硬核爆款游泳耳机推荐种草!

随着人们对健康生活方式的不断追求,游泳作为一项全身性的运动受到了越来越多人的喜爱。与此同时,为了在水下也能享受音乐的乐趣,游泳耳机应运而生,并迅速成为泳池和海滩上不可或缺的装备之一。面对市面上琳琅满目的游泳耳机产品&a…

线性表之静态链表

1. 静态链表的设计 1.1 定义静态链表 链表是由多个相同类型的节点组成的线性表,它的每个节点都包含一个数据项和一个指向下一个节点的指针,链表中各个节点的地址是不连续的。 下面是一个用于存储整形数据的链表节点结构: struct Node {int…

深度学习与大模型第1课环境搭建

深度学习与大模型第1课 环境搭建 1. 安装 Anaconda 首先,您需要安装 Anaconda,这是一个开源的 Python 发行版,能够简化包管理和环境管理。以下是下载链接及提取码: 链接:https://pan.baidu.com/s/1Na2xOFpBXQMgzXA…

Text Control 控件教程:智能文档处理 (IDP)

TX Text Control 是一款功能类似于 MS Word 的文字处理控件,包括文档创建、编辑、打印、邮件合并、格式转换、拆分合并、导入导出、批量生成等功能。广泛应用于企业文档管理,网站内容发布,电子病历中病案模板创建、病历书写、修改历史、连续打…

【云计算】什么是云计算服务|为什么出现了云计算|云计算的服务模式

文章目录 什么是云计算服务本地部署VS云计算SaaS PaaS IaaS公有云、私有云、混合云为什么优先发展云计算服务的厂商是亚马逊、阿里巴巴等公司 什么是云计算服务 根据不同的目标用户,云计算服务(Cloud Computing Services)分为两种&#xff1…

前端性能优化:提升网站加载速度的五个关键技巧

聚沙成塔每天进步一点点 本文回顾 ⭐ 专栏简介前端性能优化:提升网站加载速度的五个关键技巧1. 引言2. 前端性能优化的五个关键技巧2.1 减少HTTP请求技巧说明实现示例 2.2 启用浏览器缓存技巧说明实现示例 2.3 使用内容分发网络(CDN)技巧说明…

完美洗牌的秘密(五)——完美洗牌的性质和变体

‍ ‍早点关注我,精彩不错过! 之前4篇文章,我们介绍清楚了完美洗牌的3对基本定理。今天,我们来看在这一般的描述基础上,还有哪些常见性质和变体值得探讨。 所谓操作的性质,在扑克牌数学魔术的语境下&#x…

公务员事业编【判断推理】 之“逻辑判断” 个人NOTE

目录 1、翻译推理 1.1 翻译规则之“前推后” 1.2 翻译规则之“逆否等价” 1.3 翻译规则之“后推前” 1.4 且和或 2、组合排列(代入法/排除法) 3、日常结论 4、逻辑论证 4.1 加强类 4.1.1 搭桥(论证力度最强) 4.1.2 补充…

系统架构设计师 - 软件架构设计(2)

软件架构设计 软件架构设计(20多分)最重要基于架构的软件开发 ★ ★ ★概念开发过程架构需求、设计过程架构文档化架构复审架构实现、演化过程 软件质量属性 ★ ★ ★ ★ ★软件架构评估 ★ ★ ★ ★ ★概念架构评估方法评估方式基于场景的评估方法 软件…

EmguCV学习笔记 VB.Net 9.1 VideoCapture类

版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 EmguCV是一个基于OpenCV的开源免费的跨平台计算机视觉库,它向C#和VB.NET开发者提供了OpenCV库的大部分功能。 教程VB.net版本请访问…