多篇论文介绍-摘要

news2025/1/12 15:47:39

论文地址https://arxiv.org/pdf/2301.10051.pdf

目录

01CIEFRNet:面向高速公路的抛洒物检测算法

02改进 YOLOv5 的 PDC 钻头复合片缺损识别

03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测

04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测

​编辑05 基于改进YOLOv8的SAR图像飞机目标检测算法

​编辑​编辑

06 基于改进YOLOv8的隧道火灾检测研究

 07 融合 CA-BiFPN 的轻量化人体姿态估计算法

 08基于改进 YOLOv5s 的果园环境葡萄检测

09 基于融合 GhostNetV2 的 YOLO v7 水稻籽粒检测

10 结合特征重用与特征重建的 YOLO 绝缘子检测方法


        WIoU 更多的关注到普通样本的锚框,有效防止网络模型产生不能收敛的梯度,提升了检测精度。

加速了模型的收敛速度,检测精度提升了 0.11 个百分点。使用 WIoU 损失函数对模型进行优化,模型损失降到了更低,并使得检测边框也更加贴合被检测物体。

01CIEFRNet:面向高速公路的抛洒物检测算法

摘要:高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征提纯的抛洒物检测算法,记为CIEFRNet。首先,设计了一种融合上下文transformer的主干特征提取模块(CSP-COT),充分挖掘局部静态上下文信息和全局动态上下文信息,增强小抛洒物的特征表示;其次,在主干网络中使用改进的空间金字塔池化(ISPP),通过级联的空洞卷积实现特征的多尺度下采样,减轻目标细节信息的损失;为提高特征融合能力,设计了特征提纯模块(CNAB),其中嵌入了提出的一种混合注意力机制(ECSA),可抑制图像背景噪声,强化微小抛洒物的特征;最后,引入基于动态非单调聚焦机制的WIloU优化损失函数,提高小抛洒物学习能力,加速网络收敛。实验结果表明,所提方法在自制的高速公路抛洒物数据集上的精确率、召回率、APo;和APo.5.a9s分别达到96.5%、81.6%、88.1%和46.5%,优于当前主流的目标检测方法,其算法复杂度也更低,满足实际场景应用需要。
关键词:抛洒物检测;上下文信息;空间金字塔池化;注意力机制;损失函数


02改进 YOLOv5 的 PDC 钻头复合片缺损识别

摘要:PDC钻头复合片的缺损情况是影响钻进效率的重要因素,检测 PDC钻头复合片是否缺损是修复PDC钻头的前提。为了减少对PDC'钻头复合片的误检,提升检测准确率,提出了一种基于改进VOLOv5的目标检测算法。该方法以YOLOv5网络为基础,融合RepVGG重参数化模块增强网络的特征提取能力;在C3模块中引入坐标注意力机制,在通道注意力机制中嵌入位置信息,提升对缺损复合片的目标检测能力;将边界框回归损失函数改进为WIoU损失函数,制定合适的梯度增益分配策略。实验结果表明,改进后的网络的精确率提升2%,召回率提升0.9%,平均精度均值(mAP)提升了1.3%,达到了98%,能够实现对 PDC钻头复合片的缺损识别。
关键字:PDC钻头复合片;YOLOv5; RepVGG;坐标注意力机制;WIoU损失函数

03 基于SimAM注意力机制的DCN-YOLOv5水下目标检测


摘要:【目的】针对水下环境复杂,水下目标因光线折射等问题导致的目标边界模糊或外观、形状可能会发生非刚性形变,使水下目标检测困难,提出了一种基于SimAM注意力机制的DCN-YOLOv5水下目标检测方法。【方法】首先,采用YOLOv5所使用的双向金字塔网络(BiFPN, Bi-directional Feature Pyramid Network)在多个尺度上提取和融合特征信息,从而提高目标辨别的准确度;其次,针对水下目标的外观、形状的变化问题,将C3模块中的CBS模块结合可变形卷积(DCN, Deformable Convolution),提出DBS模块并组成D3模块替换部分C3模块,以适应水下目标的外观、形状的变化;同时,融入加权注意力机制(SimAM),自适应地调节模型的关注度,进一步在复杂场景下增强特征表达能力;最后,考虑目标边界模糊,为改善目标定位精度,采用WIoU(Wise-loU)损失函数来替换交叉嫡损失,能够更好地适应不同目标类型和尺寸的特点,提高算法鲁棒性。【结果】实验结果表明,DCN-YOLOv5可以达到87.57%的平均精度(mAP),检测效果优于YOLOv5网络和其他经典网络,平均每张图像的识别时间仅为24.5ms。【结论】通过实验结果可以证明模型在检测精度明显提升的同时兼顾检测的实时性,对水下目标检测用于实际用途有着一定的参考价值。
关键词:水下目标检测;SimAM注意力机制;可变形卷积; WloU

04 基于改进YOLOv7-tiny 算法的输电线路螺栓缺销检测

        传统 YOLOv7-tiny 算法采用CIOU  损失函数作为边界框的损失函数。由于训练数据集中不可避免地存在低质量样本,这些样本往往会导致模型的泛化能力下降,特别是当存在几何因素(例如距离和纵横比)时,该问题尤为突出;为此,使用WIloU损失函数替代CIoU损失函数。实验测试了2个版本的WIoU函数(WIoUvl和WloUv2) ,经过多次实验,最终选择了WloUv2版本作为替代版本。首先,在loU损失函数的基础上结合了距离注意力机制,得到了具有2层注意力机制的WloUv1;其中,第1层注意力用于计算样本之间的距离,第2层注意力则用于惩罚低质量样本,则有


05 基于改进YOLOv8的SAR图像飞机目标检测算法


 

         为了解决样本质量的不平衡问题,后续又提出Focal-EIOU 损失函数,假设y为控制抑制程度的参数。Focal-EIOU损失函数公式如下:

 

06 基于改进YOLOv8的隧道火灾检测研究

        CIoU虽然将边界框回归的距离、重叠面积、中心点偏移以及宽高比都考虑在内,避免了DIoU中心点重合时交并比一样无法区分的情况,对于边界框回归有更好的收敛率。但是没有考虑到真实框与预测框之间不匹配的方向。文献[28]指出CIoU公式(5)中v仅仅只是反映了宽高比的差异,而不是预测框宽高和真实框宽高的实际关系,并且质量差的回归样本对回归损失产生了比较大的影响,回归质量相对较好的样本则难以进一步优化。出于这两个原因导致模型训练收敛速度慢且效率较低,预测框不够精确。该文献提出Focal EloUv1来解决质量较好和质量较差的样本间的 BBR 平衡问题。

        但是由于EIoU使用静态聚焦机制(FM,Focusing Mechanism),非单调FM的潜力没有被充分利用,基于这一思想,文献[29]提出了一种具有动态非单调FM 的损失,名为WIoU。

 

 07 融合 CA-BiFPN 的轻量化人体姿态估计算法

        训练数据集中不可避免的包含低质量样本,距离、纵横比等几何度量都会加剧对低质量样本的惩罚从而使模型的泛化性能下降,因此高质量样本不能够很好的进一步优化。因此本文又引入了具有动态非单调聚焦机制的WloU126损失函数对样本进行平衡,通过动态非单调聚焦机制将loU替换为离群度来评估锚框的质量,以避免几何因素(例如距离和纵横比)对模型的过度惩罚,即
        

6 WIoU 示意图
Fig. 6 Chematic diagram of the WIoU

 08基于改进 YOLOv5s 的果园环境葡萄检测

        原YOLOv5s采用CIoU Loss做预测框的损失函数,CIoU损失函数在DIoU的基础上引入了预测边界框与真实边界框的长宽比,在一定程度上可以加快预测框的回归速度,但是两个边界框长宽比的定义十分模糊,并不利于网络的优化。本研究采用了Wise-IoUv3损失函数[28],与前者相比,Wise-loUv3没有引入长宽比的计算,而是在基于注意力的边界框损失 Wise-IoU vl 上,采用了动态非单调的聚焦机制,使用“离群度”来描述锚框的质量。
        首先基于注意力的边界框损失 Wise-IoU vl计算式如下:

09 基于融合 GhostNetV2 YOLO v7 水稻籽粒检测

本文采用 WIoU 替换原来的CIoU作为新的损失函数,首先根据距离度量构造了距离注意力,得到了具有两层注意力机制的WIoUv1:

Focal Loss设计了一种针对交叉嫡的单调聚焦机制,有效降低了普通度量值对损失值的干扰。这使得模型能够聚焦于重要度量值,获得分类性能的提升。WIoUv2构造了单调聚焦系数Liou的表达式:

 

 

10 结合特征重用与特征重建的 YOLO 绝缘子检测方法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1190615.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jquery的项目,html页面使用vue3 +element Plus

vue3&#xff0c;element引入 <script src"../vue3.3.8/vue.global.js"></script> <link rel"stylesheet" href"js/elementPlus/index.css"> <script src"js/elementPlus/index.full.js"></script>…

Linux友人帐之网络编程基础NFS服务器

一、概述 1.1NFS基础概念 NFS服务器&#xff08;Network File System&#xff09;是一种网络文件系统协议&#xff0c;它允许不同计算机之间共享文件系统中的文件。它是一种专门用于在网络上共享文件和目录的服务器。NFS服务器可以把本地的文件系统目录通过网络共享给其它计算…

【C++】——类与对象(一)

&#x1f383;个人专栏&#xff1a; &#x1f42c; 算法设计与分析&#xff1a;算法设计与分析_IT闫的博客-CSDN博客 &#x1f433;Java基础&#xff1a;Java基础_IT闫的博客-CSDN博客 &#x1f40b;c语言&#xff1a;c语言_IT闫的博客-CSDN博客 &#x1f41f;MySQL&#xff1a…

Python tkinter实现复刻Windows记事本UI和菜单的文本编辑器(一)

下一篇&#xff1a;Python tkinter实现复刻Windows记事本UI和菜单的文本编辑器&#xff08;二&#xff09;-CSDN博客 介绍&#xff1a; Windows操作系统中自带了一款记事本应用程序&#xff0c;通常用于记录文字信息&#xff0c;具有简单文本编辑功能。Windows的记事本可以新…

LoadRunner脚本编写之二

下面来回顾一下嵌套循环例子。 Action() {int i,j; //生命两个变量for (i1;i<5;i) //第一重循环&#xff0c;循环5次{if (i3) break; //当i等于3时&#xff0c;跳出本重循环elselr_output_message("i%d",i); //否则&#xff0c;输入i的值for (j1;j<…

效率提升75%!要做矩阵号,更要做好矩阵号管理

在如今的信息数字化时代&#xff0c;面对竞争日趋激烈的市场&#xff0c;数字化转型成为了企业提高效率和竞争力、实现可持续发展的重要手段。 这一两年来&#xff0c;我们也发现&#xff0c;越来越多的品牌企业开始探索数字化转型的实践&#xff0c;通过使用自建或者采买的数据…

Spring Task定时任务框架

二十四、Spring Task 24.1 介绍 Spring Task 是Spring框架提供的任务调度工具&#xff0c;可以按照约定的时间自动执行某个代码逻辑。 定位&#xff1a;定时任务框架 作用&#xff1a;定时自动执行某段Java代码 为什么要在Java程序中使用Spring Task&#xff1f; 应用场景…

linux系统,确认账户密码正确

linux系统&#xff0c;确认账户密码正确 1、问题背景2、解决方法 1、问题背景 有时在linux系统安装软件时&#xff0c;有的软件可能会在安装过程中创建系统用户&#xff0c;同时会给出这个用户的密码。过了一段时间我们不确定这个密码是否还正确&#xff0c;那怎么确认这个密码…

大数据-玩转数据-Flume

一、Flume简介 Flume提供一个分布式的,可靠的,对大数据量的日志进行高效收集、聚集、移动的服务,Flume只能在Unix环境下运行。Flume基于流式架构,容错性强,也很灵活简单。Flume、Kafka用来实时进行数据收集,Spark、Flink用来实时处理数据,impala用来实时查询。二、Flume…

深度学习中的图像增强合集

引言 图像增强是我们在深度学习领域中绕不开的一个话题&#xff0c;本文我们将讨论什么是图像增强&#xff0c;并在三个不同的 python 库中实现它&#xff0c;即 Keras、Pytorch 和 augmentation&#xff08;专门用于图像增强的一个库&#xff09;。所以第一个问题就是什么是图…

基于Python的书籍数据采集与可视化分析系统

温馨提示&#xff1a;文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 基于Python的书籍数据采集与可视化分析系统旨在挖掘和分析海量图书数据背后的规律和趋势&#xff0c;为读者、出版商和数据分析师提供更深入的洞察和辅助决策。本系统依托于某瓣庞大的图书…

UT代码编译至build文件夹

得克萨斯大学奥斯汀分校代码&#xff1a;代码文件按照网上很多的做法是直接**cmake .****make**则会出现以下的内容&#xff1a;但是这样做未免有些杂乱&#xff0c;会将编译生成的Makefile和其他数据文件全部存放在utaustinvilla3d-master下&#xff0c;比较杂乱。根据我们编译…

VINS-Mono-后端优化 (二:预积分残差雅可比推导)

文章目录 对位置 δ α \delta\alpha δα 进行求导位置误差 δ α \delta\alpha δα 对平移 P b k w P^{w}_{b_{k}} Pbk​w​ 的求导位置 δ α \delta\alpha δα 对旋转 R w b k R^{b_{k}}_{w} Rwbk​​ 进行求导 对速度 δ β \delta\beta δβ 进行求导速度 δ β…

你别说,还真好用,Apipost-IDEA插件

写完代码还得重复打字编写接口文档&#xff1f;代码量大定位接口定义方法太难找&#xff1f;麻烦&#xff01;写完代码还得复制粘贴到postman进行调试&#xff1f; 这三点太麻烦&#xff1f;今天给大家推荐一款IDEA插件&#xff0c;写完代码IDEA内一键生成API文档&#xff0c;…

Sui学术研究奖公布,资助研究者探索人工智能、能源市场和区块链游戏

Sui基金会高兴地宣布首轮Sui学术研究奖&#xff08;SARAs&#xff09;的获奖者。SARAs计划提供资助&#xff0c;支持推动Sui区块链技术的研究。学术和研究界对我们的初次征集呈现出大量高质量的提案。 已接受的九个提案涵盖了各种主题&#xff0c;如token经济学、智能合约机制…

Modbus协议简介及模拟环境搭建

Modbus协议是一种已广泛应用于当今工业控制领域的通用通讯协议&#xff0c;Modbus 是MODICON公司&#xff08;现为施耐德电气公司的一个品牌&#xff09;最先倡导的一种软的通讯规约。 通过此协议&#xff0c;控制器相互之间、或控制器经由网络(如以太网)可以和其它设备之间进…

Kakao账号如何注册使用?如何Kakao多开?外贸必备全面教程

Kakao是目前韩国地区最流行的通讯生活服务软件&#xff0c;相当于我们国内的微信&#xff0c;如果您的业务正准备或者正在进军这个区域&#xff0c;那么少不了需要注册并使用这个平台&#xff0c;甚至需要Kakao多开&#xff08;多账号同时管理与使用&#xff09;&#xff0c;本…

Linux mx6ull-驱动(1)hello

编写第一个驱动&#xff0c;hello_drv 一、获取内核、编译内核。 这里为什么要获取内核呢&#xff0c;因为我们写的是驱动程序&#xff0c;而不是裸机程序。也就是我们的板子已经烧入进去了uboot、内核&#xff0c;根文件。然后我们要在这个板子的内核的基础上&#xff0c;来…

2023-11-09 node.js-有意思的项目-记录

摘要: 2023-11-09 node.js-有意思的项目-记录 记录: 1、 NodeBB Star: 13.3k 一个基于Node.js的现代化社区论坛软件&#xff0c;具有快速、可扩展、易于使用和灵活的特点。它支持多种数据库&#xff0c;包括MongoDB、Redis和PostgreSQL&#xff0c;并且可以轻松地进行自定义…

软件测试|MySQL LIKE:深入了解模糊查询

简介 在数据库查询中&#xff0c;模糊查询是一种强大的技术&#xff0c;可以用来搜索与指定模式匹配的数据。MySQL数据库提供了一个灵活而强大的LIKE操作符&#xff0c;使得模糊查询变得简单和高效。本文将详细介绍MySQL中的LIKE操作符以及它的用法&#xff0c;并通过示例演示…