【SCI论文解读复现NO.1】基于Transformer-YOLOv5的侧扫声纳图像水下海洋目标实时检测

news2024/11/19 2:42:40

前言

此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮助大家解答疑惑。解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注私信我。

一、摘要

针对传统人工检测侧扫声纳(SSS)图像中水下目标的不足,提出了一种实时自动目标识别(ATR)方法。该方法包括图像预处理、采样、变压器模块与YOLOv 5s集成的ATR(即TR-YOLOv 5s)和目标定位。针对SSS图像目标稀疏、特征贫乏的特点,提出了一种新的TR-YOLOv 5s网络和降采样原理,并引入注意机制,以满足水下目标识别的精度和效率要求。实验结果表明,该方法的平均准确率(mAP)为85.6%,实时识别速度约为0.068s/幅图像。  

二、网络模型及核心创新点

 广泛应用实时水下目标检测的关键是找到一种合适的检测算法,该算法平衡了速度和精度,并且由于甲板单元的缓慢更换和船上AUV的有限尺寸,该算法还应该具有尽可能低的计算要求。YOLOv 5是SOTA目标检测算法,具有快速检测速度和精确精度,在COCO val 2017数据集上获得了72%的AP@0.5。此外,YOLOv 5s的最小型号大小仅为14兆,部署方便。然而,YOLOv 5s是使用光学样本集构建的,该光学样本集不完全适用于SSS图像。此外,水下目标样本的数量远小于光学样本。单独使用YOLOv 5s进行实时检测并不能满足需求,需要结合侧扫声纳图像与光学图像的具体差异对YOLO进行改进。与光学图像相比,由于分辨率的限制,声纳图像具有稀疏特征,而由于海域过于广阔,声纳图像往往在目标周围具有稀疏特征。因此,本文专门在YOLOv 5s中增加了一个变换器模块,以关注目标自身特征,忽略目标周围的特征,即:在YOLOv 5s中引入了注意机制,提出了一种改进的实时目标检测算法TR-YOLOv 5s,如图6所示。

三、应用数据集

我们收集了两个SSS图像集A和B,用于探测器训练和测试。数据集A主要包括来自Google检索的经过辐射校正、斜距校正等后处理的图像。而数据集B主要包括未经任何优化的原始灰度图像。数据集A和B的一些示例如图12所示。

 四、实验效果(部分展示)

为了评估由预训练加权和变压器模块引起的探测器性能增加,进行了消融研究。我们比较了四种情况下的精确度、召回率、mAP、macro-F2评分和GFLOPs,包括从头训练的YOLOv 5、通过预训练加权初始化的YOLOv 5、从头训练的TR-YOLOv 5和通过预训练加权初始化的TR-YOLOv 5,测试集见表4。

 与SSS测量后的目标检测相比,所提出的实时检测对于现场的快速目标检测和定位是非常有效的。为了进一步评估该方法的性能,还将该方法与现有的主要实时水下目标检测方法进行了比较,如表8所示。

五、实验结论

该方法集原始图像预处理、采样、TR-YOLOv 5s检测器和定位于一体,实现了侧扫声纳瀑布图像中水下目标的自动检测,具有较高的精度和效率,能够满足实时水下目标检测的要求。根据SSS图像的特点和目标在检测图像中的分布情况,给予相应的变换模块、下采样等措施是非常必要的,这对提高水下目标实时检测的精度和效率是非常有益的。为了获得更好的性能,可以考虑声纳数据增强、少样本学习甚至零炮学习方法,并研究模型压缩技术等更灵活的网络结构进行实时检测。此外,还应考虑基于SSS图像特性的特殊模块或底层计算模式。

六、投稿期刊介绍

 

 

注:论文原文出自Real-Time Underwater Maritime Object Detection in Side-Scan Sonar Images Based on Transformer-YOLOv5. 本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注下面公众号,私信我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/107001.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【小学信息技术教资面试】《制作通讯录》教案

1.题目:制作通讯录 2.内容: 3.基本要求: (1)使用任务驱动法进行教学。 (2)掌握表格的插入和信息的填写。 (3)试讲时间是10分钟。 《制作通讯录》教案 一、教学目标&am…

我国核桃种植深加工行业供给较为充足 未来大健康消费时代将带来广阔市场

根据观研报告网发布的《2022年中国核桃种植深加工行业分析报告-行业竞争策略与发展动向研究》显示,核桃加工分为初加工与深加工。其中核桃深加工包括核桃油的压榨、核桃蛋白粉的制备、以核桃仁为原料生产休闲食品、以核桃青皮、壳等为原料生产加工日化产品等&#x…

Java agent 使用

一、前言 于一个即将上线的应用来说,系统监控是必不可少的,为什么需要监控呢?应用是跑在服务器上的,应用在运行过程中会发生各自意想不到的问题,像大家熟知的OOM,mysql故障,服务器宕机&#xff…

SpringBoot+Vue实现前后端分离的教务评教系统

文末获取源码 开发语言:Java 使用框架:spring boot 前端技术:JavaScript、Vue.js 、css3 开发工具:IDEA/MyEclipse/Eclipse、Visual Studio Code 数据库:MySQL 5.7/8.0 数据库管理工具:phpstudy/Navicat JD…

将spark的数据保存到MySQL

文章目录前言环境的准备是必要的下载解压放置文件代码书写注意事项结束语前言 我们用spark对数据进行分析和提取数据后要对得到的数据进行保存接下来的内容是将数据保存到MySQL数据库中 环境的准备是必要的 下载 (本小博主已经为看官大人准备好了下载地址点击下载…

【JVM实战系列】「监控调优体系」实战开发arthas-spring-boot-starter监控你的微服务是否健康

前提介绍 相信如果经历了我的上一篇Arthas的文章[【JVM实战系列】「监控调优体系」针对于Alibaba-Arthas的安装入门及基础使用开发实战指南]之后,相信你对Arthas的功能和使用应该有了一定的理解了。那么我们就要进行下一步的探索功能。 Arthas对于SpringBoot2的支…

无效回表谁的锅?存储引擎:这事儿不赖我

明确场景 要回答这个问题,我们一般分几步来走: 1.确认问题,对齐Sql语句; 2.解答问题本身,也就是时间复杂度分析; 3.针对本身提出这个场景,可能出现的性能瓶颈进行分析; 4.针对瓶…

vue+element模仿腾讯视频电影网站

一.布局设计 官方图例: demo效果: 顶部1;左侧菜单栏2;右侧内容展示区3; 关键点: 顶部固定,不随页面滚动而滚动;左侧可局部滚动显示更多菜单;右侧局部滚动&#xff…

拓扑梅尔智慧办公平台(Topomel Box) 3.0发布

今天,2022年12月21日,我很高兴地宣布:拓扑梅尔智慧办公平台(Topomel Box)的3.0版本正式发布。 下面,请允许我简单地介绍下新版本的一些基本情况。 新特性 1) 统一的文件管理 将所有你关心的文件都统一存放在同一个地方&#xff…

Linux 4.7内核syncookie的性能

虽然现在的内核都已经是4.11版本了,但本文依旧基于较老的内核版本旧事重提,就4.7版本的一个针对syncookie的一个优化书写一段吹捧与嘲讽。 自从4.4版本的Lockless TCP listener以来,针对TCP在大并发连接处理这块一直都没有更大的突破&#x…

RNA-seq 详细教程:注释(15)

学习内容 了解可用的基因组注释数据库和存储信息的不同类型比较和对比可用于基因组注释数据库的工具应用各种 R 包检索基因组注释基因组注释 对二代测序结果的分析需要将基因、转录本、蛋白质等与功能或调控信息相关联。为了对基因列表进行功能分析,我们通常需要获得…

哈希冲突概率计算及python仿真

目录 1. 前言 2. 生日问题 3. 哈希冲突问题 4. 简易python仿真 5. 从另一个角度看哈希冲突概率 1. 前言 Hash函数不是计算理论的中基本概念,计算理论中只有单向函数的说法。所谓的单向函数,是一个复杂的定义,严格的定义要参考理论或者密…

老板,明年我用Seata搞定分布式事务管理的规范化建设 | 中篇

辞旧迎新,22年要结束了,明年做什么想好了嘛?要不要用 Seata 搞定公司分布式事务管理的规范化建设? 欢迎关注微信公众号「架构染色」交流和学习 一、背景 在上一篇《明年用Seata搞定分布式事务管理的规范化建设 | 上篇》 中介绍了…

低成本、高效率!华为云桌面助力企业数字化转型

在云计算飞速发展的今天,传统办公设备体积大、能耗高、维护难、更新换代快等问题日益凸显,而基于云计算平台的虚拟办公系统逐渐被业界接受并得到广泛应用。其中,华为云桌面Workspace既满足了企业移动办公、远程办公、安全办公等要求&#xff…

恒业微晶冲刺创业板上市:计划募资8亿元,戴联平为实控人

12月20日,上海恒业微晶材料科技股份有限公司(下称“恒业微晶”)在深圳证券交易所创业板递交招股书。本次冲刺创业板上市,恒业微晶计划募资8亿元,将用于恒业新型分子筛项目。 据天眼查信息显示,恒业微晶成立…

Servlet中Cookie和Session技术

一、状态管理1.1 现有问题HTTP协议是无状态的,不能保存每次提交的信息如果用户发来一个新的请求,服务器无法知道它是否与上次的请求有联系对于那些需要多次提交数据才能完成的Web操作,比如登录来说,就有问题了。1.2 概念将浏览器与…

牛津大学最新 | LUMix:Mixup改进版,几行代码轻松涨点!

点击下方卡片,关注“自动驾驶之心”公众号ADAS巨卷干货,即可获取点击进入→自动驾驶之心【目标检测】技术交流群后台回复【LUMix】获取论文!!!摘要当使用噪声样本和正则化技术进行训练时,现代深度网络可以更…

云端数据“上榜”了!

背景介绍随着全球特别是北美地区VNF网络应用渐渐地往云上迁移,云环境中更高的性能需求变得越来越迫切。作为一流数据处理中心部门,随着大势所趋,不仅仅专研于裸机的性能数据,也开始关注Intel平台在不同云环境中的性能表现。在DPDK…

外汇天眼:日本央行突然上调收益率目标上限,日元10分钟内涨超2%

12 月 20 日,日本央行公布利率决议,并在货币政策会议上宣布堪称“黑天鹅事件”的重大政策转变。日本央行意外地调整了收益率曲线控制计划,宣布将收益率目标上限从 0.25% 上调至 0.5% 左右,同时又将 1 至 3 月日本国债购买规模提高…

Java当中多态的理解

1. 什么是多态 同一操作,作用于不同的对象,可以有不同的解释,产生不同的执行结果,这就是多态性。 对应到 Java 里就是针对同一个类型的对象,执行同一个方法,会表现出不同的行为。 简单点说: 就是用基类…