CEASC:基于全局上下文增强的自适应稀疏卷积网络在无人机图像上的快速目标检测

news2024/9/29 20:58:10
Adaptive Sparse Convolutional Networks with Global Context Enhancement for
Faster Object Detection on Drone Images

摘要

        提出了一种基于稀疏卷积的探测头优化方法,该方法在精度和效率之间取得了较好的平衡。然而,该算法对微小物体的上下文信息融合不足,且在前景尺度变化时,对遮挡比例的控制不灵活。针对上述问题,提出了一种新的全局上下文增强自适应稀疏卷积网络(CEASC)该算法首先利用全局背景统计量代替稀疏采样特征统计量,构建了背景增强的组归一化(CE-GN)层,然后设计了一种自适应的多层掩膜策略,在不同尺度下生成最优的掩膜比例,以获得更紧凑的前景覆盖,提高了算法的准确性和效率。具体来说,首先开发一个上下文增强稀疏卷积(CESC)来捕获全局信息并增强焦点特征,它由具有上下文增强组规范化(CE-GN)层的残差结构组成。由于CE-GN专门保留了一组整体特征,并将其应用于归一化,因此它补偿了稀疏卷积造成的上下文损失,并稳定了前景区域的分布,从而绕过了准确性的急剧下降。然后,提出了一个自适应多层掩蔽(AMM)计划,它分别估计最佳的掩模比通过最小化精心设计的损失在不同层次的特征金字塔网络(FPN),平衡检测精度和效率。在VisDrone和UAVDT两个主要测试平台上的实验结果表明,CEASC能够显著降低GFLOPs,加快推理过程,并具有较好的性能。

创新点

        1)提出了一种新的基于稀疏卷积的检测头优化方法,即CEASC,以有效的无人机目标检测。

        2)引入了一个上下文增强的稀疏卷积层和一个自适应多层掩蔽方案来优化掩码比,从而在检测精度和效率之间实现最佳平衡。

网络模型

        方法如图2所示,给定一个基本检测器,整个CEASC网络的目标是通过开发上下文增强稀疏卷积(CESC)来优化FPN中不同层的检测头,CESC通过一个轻量级卷积模块以及上下文增强组归一化(CEGN)层将焦点信息与全局上下文相结合。设计了一个自适应多层掩模(AMM)模块,使模型能够自适应地产生具有适当掩模比的掩模,从而在精度和效率上达到更好的平衡。

1.上下文增强稀疏卷积
1.1稀疏卷积

        无人机图像上的大多数现有检测器都使用密集的检测头,在整个特征图上进行卷积。虽然充分探索视觉线索有助于检测微小物体,但密集头部需要更多的计算,这不适用于资源受限的UAV平台。同时,前景区域仅占据无人机获取的帧的一小部分,这表明密集头部在背景上进行了大量计算操作,其中包含的用于对象检测的有用信息少得多。该观察揭示了通过仅在前景区域上计算来加速检测头的潜力。

        稀疏卷积(SC)通过使用稀疏掩模来学习对前景区域进行操作,并证明可以有效加快各种视觉任务的推理阶段。受其启发,构建了基于SC的网络。具体地说,给定来自FPN的第i层的特征映射Xi ,SC采用由共享核Wmask组成的掩码网络。基于Wmask对Xi进行卷积生成软特征Si ,通过使用Gumbel-Softmax技巧将其进一步转化为掩码矩阵Hi ∈ {0,1}B×1×H×W,公式如下:

其中g1,g2 ∈ RB×1×H×W表示随机Gumbel噪声,σ表示sigmoid函数,τ是Gumbel-Softmax中相应的温度参数。

        根据等式(1)在推理期间,只有掩码值为1的区域参与卷积,从而降低了总的计算成本。Hi的稀疏性由掩模比r ∈ [0,1]控制,通常手动设置为大于0.9。由于基本检测器在检测框架中有一个分类头和一个回归头,考虑到它们通常关注不同的区域,为每个头分别引入一个掩码网络。每个探测头采用四个卷积-GN-ReLU层和一个卷积层来进行预测,其中,用SC层取代传统的卷积层。

1.2上下文增强

        上下文线索有利于目标检测然而,SC仅对前景执行卷积,并放弃具有有用信息的背景,这可能会破坏整体准确性,特别是在无人机图像中存在微小对象的情况下。为了解决这个问题,提出了一个轻量级的CESC模块,共同利用焦点信息和全局上下文进行增强,同时提高后续计算的稳定性。如图2所示,对特征图Xi应用逐点卷积,生成全局上下文特征Gi。由于SC只处理Xi中的少数元素,因此经过多轮SC后,GI往往会变得稳定,而不会花费太多额外的计算成本。

        作为SC的重要组成部分,将全局上下文信息Gi嵌入到SparseConvolution-GN-ReLU层中,其将特征映射Xij,掩码Hi和全局特征Gi作为输入,其中j表示第j个SparseConvolution-GN-ReLU层。采用Gi的平均值和标准差进行归一化,而不是像传统SC那样使用激活的元素来计算组归一化的统计数据,旨在补偿缺失的上下文。假设Li,j是在对Xi,j应用SC之后的输出特征图,通过CE-GN如下获得上下文增强的特征Fij

其中mean[·]和std[·]分别表示均值和标准差,w和B是可学习参数。

        为了进一步减轻SC中的信息损失并使训练过程更加稳定,在训练期间除了稀疏卷积之外还额外保持正常的密集卷积,生成在完整输入特征图上卷积的特征图Cij。然后,采用Cij通过优化MSE损失来增强稀疏特征图Fij,如下所示:

其中L是FPN中的层数。

        最终通过将Gi添加到Fij来在激活层之前采用残差结构,即Fij= Fij + Gi,这加强了上下文保持。CESC模块和CE-GN层的完整架构如图2所示。

2.自适应多层掩蔽

        在没有任何额外约束的情况下,稀疏检测器倾向于生成具有大激活比(或小掩模比)的掩模以获得更高的精度,从而增加了总体计算成本。为了解决这个问题,大提出了AMM方案来自适应地控制激活率(或抑制掩模率)。

        具体地,AMM首先基于地面实况标签来估计最优掩模比率。通过利用标签分配技术,对于第i个FPN层,获得地面实况分类结果Ci,其中c表示包括背景的类别数量; hi和wi分别表示特征图的高度和宽度。第i个FPN层中的最佳激活比率Pi估计为

其中Pos(Ci)和Numel(Ci)分别指示属于正(前景)实例的像素的数量和所有像素的数量。

        为了引导网络自适应地生成具有适当掩码比的掩码,采用以下损失

其中,Pos(Hi)/Numel(Hi)表示掩模Hi的活化率。通过使Lamm最小化,Hi被迫遵守与地面真实前景比率Pi相同的激活比率,从而便于生成足够的掩模比率。

        通过添加常规检测损失Ldet,将总体训练损失公式化如下:

其中α、β是平衡Lnorm和Lamm重要性的超参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2087725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C/C++ JSON ORM

structs #include "json_struct.h" #include <vector>JS_ENUM(Error, None, InvalidRange, IllegalParam, Nullptr, OverLimitLen) JS_ENUM_DECLARE_STRING_PARSER(Error)// 搜索匹配区域 struct RangeContent {size_t start;size_t end;std::strin…

基于协同过滤与情感分析的酒店评论分析与景区推荐系统实现

文章目录 有需要本项目的代码或文档以及全部资源&#xff0c;或者部署调试可以私信博主项目介绍系统界面推荐模块主题分类文本可视化每文一语 有需要本项目的代码或文档以及全部资源&#xff0c;或者部署调试可以私信博主 项目介绍 近年来&#xff0c;旅游行业风生水起&#…

#单片机高级 硬件部分笔记

课程内容 硬件基础知识PCB基础知识嘉立创EDA&#xff08;专业版&#xff09;软件的安装及使用PCB设计PCB设计规则&#xff08;原理图、布局、布线&#xff09;项目&#xff08;暂定&#xff09; 1、硬件基础 初级硬件工程师 熟练掌握数字电路、模拟电路知识&#xff0c;熟悉常用…

unity的问题记录(信息管理)

闭包 捕获引用&#xff1a;当你在委托或 lambda 表达式中使用外部变量时&#xff0c;它们捕获的是这个变量的引用&#xff0c;而不是当时的值。变量的生命周期&#xff1a;捕获的变量的生命周期不受限于它的作用域&#xff0c;委托可以在变量的作用域结束后继续访问它。 为了…

今晚8点直播预告——模拟RCT,真实世界研究新方法,快来了解一下吧

这是讲座预告&#xff0c;我们来向大家介绍一下真实世界研究的新方法—模拟RCT&#xff01; 郑老师喜欢交流&#xff0c;于是在2024年&#xff0c;决定邀请各位一起参加统计学沙龙&#xff0c;基本每周一期&#xff0c;欢迎各位朋友来交流、讲课。 本期沙龙&#xff0c;在8月29…

【ubuntu笔记】拉取docker镜像

拉取docker镜像 更换国内源 修改配置文件 sudo vim /etc/docker/daemon.json{"registry-mirrors": ["https://ustc-edu-cn.mirror.aliyuncs.com/","https://hub-mirror.c.163.com","https://mirror.baidubce.com","https://cc…

【Java】Maven多环境切换实战(实操图解)

Java系列文章目录 补充内容 Windows通过SSH连接Linux 第一章 Linux基本命令的学习与Linux历史 文章目录 Java系列文章目录一、前言二、学习内容&#xff1a;三、问题描述四、解决方案&#xff1a;4.1 Maven多环境配置学习4.2 切换环境4.2.1 先打包4.2.2 之后可以切换 五、总结…

聊聊Netty异常传播链与最佳实践

写在文章开头 Netty通过责任链的思想解耦了各个业务的处理逻辑,是的用户可以非常方便的根据不同的生命周期进行相应的业务处理。而本文将针对Netty中的异常和异常传播过程进行分析,并给出最佳的处理技巧,希望对你有帮助。 Hi,我是 sharkChili ,是个不断在硬核技术上作死的…

Electron 项目实战 03: 实现一个截图功能

实现效果 实现思路 创建两个window&#xff0c;一个叫mainWindow&#xff0c;一个叫cutWindowmainWindow&#xff1a;主界面用来展示截图结果cutWindow&#xff1a;截图窗口&#xff0c;加载截图页面和截图交互逻辑mainWindow 页面点击截图&#xff0c;让cutWIndow 来实现具体…

WEB应用服务器TOMCAT知识点

TOMCAT介绍 Tomcat是一个开源的Java Web应用服务器&#xff0c;主要用于运行Java编写的网站。 Apache Tomcat是由Apache Software Foundation&#xff08;ASF&#xff09;开发的一个开源Java Web应用服务器&#xff0c;最初由Sun Microsystems捐赠给Apache软件基金会&#xf…

数据结构(Java实现):栈和队列相关练习题

文章目录 1. 题目链接2. 题目解析2.1 括号匹配2.2 逆波兰表达式求值2.3 出栈入栈次序匹配2.4 最小栈2.5 环形数组队列2.6 用队列实现栈2.7 用栈实现队列 1. 题目链接 括号匹配逆波兰表达式求值出栈入栈次序匹配最小栈设计循环队列用队列实现栈用栈实现队列 2. 题目解析 2.1 …

基于RK3568平台移植ffmpeg3.4.5及ffmpeg验证

目录 一、概述二、环境要求2.1 硬件环境2.2 软件环境三、移植流程3.1 编译x2643.2 编译mpp3.3 编译ffmpeg四、ffmpeg验证4.1 ffmpeg配置说明4.2 ffmpeg推流/拉流使用说明4.2.1 使用http方式推流/拉流4.2.1.1 先执行ffmpeg服务4.2.1.2 再执行ffmpeg进行推流4.2.1.3 最后执行vlc进…

等保测评中的数据安全保护:重点与挑战

在信息安全等级保护&#xff08;等保&#xff09;测评中&#xff0c;数据安全保护是核心关注点之一&#xff0c;它不仅关系到企业的合规性&#xff0c;还直接影响到企业的运营安全和用户信任。本文将深入探讨等保测评中数据安全保护的重点与挑战&#xff0c;为企业提供有效的应…

JavaScript初级——事件传播

1、事件的传播 关于事件的传播网景公司和微软公司有不同的理解&#xff1a; 微软公司认为事件应该是由内向外传播&#xff0c;也就是当事件触发时&#xff0c;应该先触发当前元素上的事件&#xff0c;然后再向当前元素的祖先元素上传播&#xff0c;也就说事件应该在冒泡阶段执行…

如何解决U盘无法压缩卷或删除卷的问题

U盘在日常使用中&#xff0c;偶尔会遇到无法压缩卷或删除卷的情况。出现这些问题通常与U盘的磁盘状态或文件系统有关。本文将介绍一种有效的解决方法&#xff0c;通过使用Windows自带的磁盘管理工具diskpart来解决这些问题。 一、问题原因 U盘无法压缩卷或删除卷的常见原因包…

Nginx部署Vue前端项目全攻略:从构建到上线一步到位!

要将前端 Vue 项目部署到 Nginx&#xff0c;你需要遵循以下步骤&#xff1a; 首先确保你已经安装了 Node.js 和 npm。如果没有&#xff0c;请访问 Node.js 官网 下载并安装。 使用 Vue CLI 创建一个新的 Vue 项目&#xff08;如果你还没有一个&#xff09;&#xff1a; npm i…

探索未知,悦享惊喜 —— 您的专属盲盒小程序,即将开启奇妙之旅

在这个充满无限可能的数字时代&#xff0c;每一次点击都可能是通往惊喜的门户。我们匠心打造的“惊喜盲盒”小程序&#xff0c;正是为了给您带来前所未有的娱乐体验与心灵触动。在这里&#xff0c;每一份盲盒都蕴藏着精心挑选的宝藏&#xff0c;等待着与您的不期而遇。 【探索…

学习bat脚本

内容包含一些简单命令或小游戏&#xff0c;在乐趣中学习知识。 使用方法&#xff1a; 新建文本文档&#xff0c;将任选其一代码保存到文档中并保存为ASCII编码。将文件后缀改为.bat或.cmd双击运行即可。 一. 关机脚本 1. 直接关机 echo off shutdown -s -t 00秒直接关机。 2…

H5手机端调起支付宝app支付

1.调起APP页面如下 步骤 1.让后端对接一下以下文档&#xff08;手机网站支付通过alipays协议唤起支付宝APP&#xff09; https://opendocs.alipay.com/open/203/107091?pathHash45006f4f&refapi 2.后端接口会返回一个form提交表单 html&#xff1a;在页面中定义一个d…

halcon2

halcon自带图片路径 C:\Users\Public\Documents\MVTec\HALCON-18.11-Progress\examples 案例1&#xff1a;blob 固定阈值分割图像-车牌号识别 案例2&#xff1a;blob 动态阈值分割 匹配字母 案例1:打开窗口并画几何图形 &#xff08;ROI 感兴趣区域&#xff09; 并且距离测量…