目标检测论文解读复现【NO.21】基于改进YOLOv7的小目标检测

news2024/12/26 20:47:48

前言

此前出了目标改进算法专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读最新目标检测算法论文,帮助大家解答疑惑。解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注私信我。

一、摘要

 当前,目标检测技术趋于成熟,但小目标检测仍是研究的难点所在。针对目标检测过程中小目标像素少、覆盖面积小、信息少更容易出现漏检情况的问题,提出了一种改进的YOLOv7目标检测模型。首先,结合特征分立合并思想对YOLOv7网络模型中的MPConv模块进行改进,以减少网络特征处理过程造成的特征损失,并通过实验找到了网络放置改进MPConv模块的最佳位置;其次,由于小目标检测过程中容易出现漏检的现象,算法利用ACmix注意力模块在增加网络对小尺度目标敏感度的同时降低噪声所带来的影响;最后,算法使用SIoU替换原YOLOv7网络模型中的CIoU以此来优化损失函数,减少损失函数自由度,提高网络鲁棒性。在欧卡智舶公开的FloW-Img子数据集上进行实验对比,对于数据集中密集、小目标和超小目标三种情况的图片,改进后的YOLOv7网络模型相比于原网络,漏检情况得到很好的改善。同时结果表明,改进后的YOLOv7网络模型m AP可达到71.1%,相比于基线YOLOv7网络模型提升了4个百分点,检测效果优于原网络与其他经典目标检测网络。

二、网络模型及核心创新点

1改进的MPConv模块

2. ACmix注意力模块

3. 损失函数

三、应用数据集

本文实验数据集采用欧卡智舶发布(http://www.orca-tech.cn/datasets)的无人船视角下内河漂浮垃圾数据集,该数据集是全球第一个真实内河场景下、无人船视角的漂浮垃圾检测数据集。

四、实验效果(部分展示)

1.下图针对小目标图片,改进前后网络均检测出2个目标,但改进后网络的预测框置信度明显大于原网络。

2.对于下图超小目标(目标框大小为0.05×0.04)的图片,原网络漏检,而改进后的网络仍能检测出目标。

3.其结果如下表所示。改进后的YOLOv7算法在输入相同尺寸图片的情况下,mAP值超过了其它经典网络,更适合小目标检测场景。

五、实验结论

实验结果表明,改进后的YOLOv7网络检测效果优于原网络和其它经典目标检测网络。下一步研究计划,通过对数据集的扩增,增加数据集中的检测类别以扩大模型的检测范围,提高在实际应用中的检测性能。

六、投稿期刊介绍

注:论文原文出自戚玲珑,高建瓴.基于改进YOLOv7的小目标检测[J/OL].计算机工程. https://doi.org/10.19678/j.issn.1000-3428.0065942

解读的系列文章,本人已进行创新点代码复现,有需要的朋友可关注下面公众号,私信我。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/99631.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java项目:基于SSM的高校运动会管理系统的设计与实现

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 该高校运动会信息管理系统是以B/S架构为设计基础并基于SSM框架开发的系统。系统采用了Java语言和MySQL数据库来实现。 系统按预定的算法完成了创…

数据结构---删去k个数字后的最小值

删去k个数字后的最小值思路贪心算法JAVA实现1JAVA实现2给出一个整数,从该整数中去掉k个数字,要求剩下的数字形成的新整数尽可能小。应该如何选取被去掉的数字? 其中整数的长度大于或等于k,给出的整数的大小可以超过long类型的数字…

计算机毕业设计 基于HTML+CSS+JavaScript 大气的甜品奶茶美食餐饮文化网页设计与实现23页面

👨‍🎓静态网站的编写主要是用HTML DIVCSS JS等来完成页面的排版设计👩‍🎓,常用的网页设计软件有Dreamweaver、EditPlus、HBuilderX、VScode 、Webstorm、Animate等等,用的最多的还是DW,当然不同软件写出的…

Java+SSM房屋租赁系统房屋出租房产(含源码+论文+答辩PPT等)

项目功能简介: 该项目采用的技术实现如下 后台框架:Spring、SpringMVC、MyBatis UI界面:jQuery 、JSP 数据库:MySQL 系统功能 系统分为前台用户界面和后台系统管理: 1.前台用户界面 用户注册、用户登录、用户中心、浏览房源、房源…

代码随想录训练营第54天|休息日 小结

打家劫舍系列 198. 打家劫舍对于当前的房间,无非就两种选择:偷与不偷。如果当前房间偷,那么前一个房间就不偷,即dp[i] dp[i-2] nums[i];如果当前房间不偷,那么dp[i] dp[i-1],因此递推公式为…

ch3_1_多进程的概念

1. CPU 的管理 CPU的工作原理: 从内存中取出程序的指令, 执行程序中的指令; 1.1 多道程序 假设A 程序运行时, 遇到 IO 处理时, 为了能够执行A 程序的后续指令, 正常情况下 cpu 需要等待着IO 处理完成&am…

后端快速学习VUE(一):VUE入门

个人博客地址 http://xiaohe-blog.top/ 文章目录1. 简介2. 基本使用2.1 引入Vue2.2 基本使用2.3 总结 :3. v-text、v-html指令的使用4. v-on : 事件绑定4.1 事件的三要素:4.2 v-on的基本使用4.3 v-on获取vue实例this4.4 事件绑定简化写法5. 常用指令5.1 …

useRef 源码解读

文章目录useRef 源码解读mountRefupdateRefref 的生命周期(工作流程)总结:render 阶段commit 阶段总述具体阐述safelyDetachRefcommitAttachRefuseRef 源码解读 由于 string 类型的 ref 已不推荐使用,所以只针对 function &#…

论文复现-1:bertscore

Bertscore是计算相似度的一种方法。 遗留问题:使用model layer 中的单一层 还是多个层,会对结果造成很大的影响吗? sent_encode函数是使用tokenizer将句子做encode。 tokenizer.encode( sent, add_special_tokensTrue, add_prefix_spaceTrue,…

HTML与CSS基础

2022.12.12 程序员在前端写完代码之后通过浏览器的渲染和解析成为用户看到的网页 浏览器出品的公司不同,内部的渲染引擎也不同。导致解析相同代码时的速度、性能、效果也不同 相同的前端网页在不同浏览器中运行的的结果也可能不同 WEB的三大标准 HTML包含页面内…

Java+MySQL基于SSM的智能办公管理系统

随着时代的发展,人们越来越来希望通过简单方便快捷的方式来进行办公,通过自能办公系统可以实现在线办公,这种办公模式脱离了传统纸质办公很多困扰,在实现现代化的同时提高了办公的效率。 本智能办公管理系统采用JAVA语言来进行开发,用小巧灵活的MySQL数据库做完后台存储解释。本…

痞子衡职场经验与感悟分享 - 索引

大家好,我是痞子衡,是正经搞技术的痞子。本系列痞子衡给大家分享的是职场经验与见闻感悟。 痞子衡在嵌入式行业也摸打滚爬了不少年,有一些个人经验可以给大家参考。所谓他山之石可以攻玉,希望痞子衡的经验对大家的职场之路有所帮…

jsp+ssm计算机毕业设计电影影评网【附源码】

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: JSPSSM mybatis Maven等等组成,B/S模式 Mave…

java基础的综合运用

文章目录前言一.类的设计书籍类书架类用户类二.行为的规范2.1 增加书籍2.2展示所有书籍2.3查找书籍2.4 删除书籍2.5 归还书籍2.6 借阅书籍2.7 退出系统三.测试类的方法四.项目的目录前言 在我们学习完面向对象的知识之后,我们就要运用相关知识去实现一个图书管理系…

十六进制转Ascii脚本(包含\x处理)

目录 1.前言 2.十六进制转换脚本(包含处理\x) 1.前言 在以前玩CTF的时候,会遇到十六进制编码,特别是带\x的那种,网上虽然也有在线解密网站,但是对于\x解码不是特别友好。 2.十六进制转换脚本(包含处理\x&#

【Flink实时数仓】数据仓库项目实战 《四》日志数据分流 【DWD】

文章目录【Flink实时数仓】数据仓库项目实战 《四》日志数据分流-流量域 【DWD】1.流量域未经加工的事务事实表1.1主要任务1.1.1数据清洗(ETL)1.1.2新老访客状态标记修复1.1.3新老访客状态标记修复1.2图解1.3代码1.4数据测试1.4.1 测试脏数据1.4.2 测试e…

论文写作神器,SCI 写作必备

一、论文写作建议与英文句型积累/引用 1. Academic Phrasebank 网址: https://www.phrasebank.manchester.ac.uk/ Academic Phrasebank:从引言工作到结论提出了论文写作的详细建议,并在每个小点给出了海量的英语表达以供参考。是 SCI 新手…

linux red hat 8.0 搭建DNS服务

DNS简介: 简单的来说,DNS就是把域名和IP地址联系在一起的服务,有了DNS服务器,你就不用输入IP地址来访问一个网站,可以通过输入网址访问。 可以把DNS服务理解成网易有道词典,你去搜索一个英语单词&#xff0…

【MindStudio训练营第一期】【昇腾AI训练营新手班学习笔记】大作业

介绍 大作业:使用MindStudio成功复现昇腾社区中的MindX SDK应用案例 选题:黑白图像上色 https://www.hiascend.com/zh/developer/mindx-sdk/case-studies/d0c56d6f-a6f9-4b77-8587-db8272f22f3b 步骤 运行 使用MindStudio打开下载到的工程文件 创建d…

jsp+ssm计算机毕业设计大学新生军训管理系统【附源码】

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: JSPSSM mybatis Maven等等组成,B/S模式 Mave…