无缝钢管内表面缺陷检测的自强化感知协调网络

news2024/12/19 13:54:23

摘要

 无缝钢管是重要的工业材料。然而,无缝钢管中的内表面缺陷检测具有挑战性,并且会显著影响无缝钢管的性能和寿命。现有的检测方法是劳动强度大的,并且检测结果的可视化程度低。因此,本文提出了一种新型的管道内表面缺陷螺旋式全向检测机器人和交互式可视化软件组成的检测系统。经过在无缝钢管工厂的测试,该系统实现了对其内表面缺陷的全面、无线、高效的检测和可视化。此外,我们构建了一个无缝钢管的内表面缺陷数据集,命名为SSP2000。该数据集包含9个缺陷类别的2000张图像,其中存在许多挑战。此外,为了准确检测缺陷,我们设计了SRPCNet,可以有效地解决这些挑战。具体来说,我们首先使用协同感知增强模块来丰富特征空间并增强感知。然后,分层注意力整合模块使用自适应注意力权重合并深层和浅层特征。最后,双边自融合模块充分利用层内特征并产生预测结果。所提出的SRPCNet在八个评价指标上均优于现有的方法。

主要内容

(1)提出了一种用于检测无缝钢管内表面缺陷的全新的检测系统(图2),包括螺旋式全向检测机器人和可视化交互式软件。该系统能够准确、高效地检测内径范围为100至150mm的无缝钢管中的内表面缺陷,检测效率为6m/min。

(2)提出了首个在无缝钢管内表面缺陷数据集(SSP2000),其中包含9类无缝钢管中常见的内表面缺陷(图3),以及5类检测挑战和10个子挑战(图4)。

(3)准确地检测出无缝钢管内表面的缺陷是一项具有挑战的任务,因此使用VGG16作为骨干网络来提取多级特征,提出了一种自增强感知协同网络(SRPCNet)检测算法,网络整体结构如图5。

(4)在SSP2000中许多图像中存在跨尺度多目标、伪装与非伪装缺陷混合等挑战,这意味着检测算法要有足够的特征的感知能力和表达能力。为了同时实现大感受野和增强特征表达,我们提出了协同感知增强模块,如图6所示。

(5)在经过协同感知增强模块获得了增强后的多层特征后,为了能够在充分的关注到整个图像内尽可能多的缺陷的同时,能够较为完整地检测出其中的大尺度缺陷,设计了分层注意力整合模块,如图7所示。

(6)在经过分层注意力整合模块将多层特征融合后,为充分提取融合后的特征中的信息,设计了双边自融合模块,如图8所示。

实验结果

对比实验

表1中的定量结果表明,当处理具有挑战性的无缝钢管内表面缺陷图像时,例如伪装与非伪装缺陷混合和跨尺度多目标,所提出的SRPCNet在所有八个评估指标上都优于其他比较方法,这清楚地表明了所提出的SRPCNet的优势。值得注意的是,我们的方法在所有四个F-measure上表现出显着的提升。此外,所有方法的MAE值都相对较小,这归因于数据集中对象的尺寸较小。

 可视化比较结果如图9所示,表明本文方法能够有效应对检测挑战。

消融实验

使用相同的八个评估指标,在SSP2000数据集上进行了一系列的消融实验,来对SRPCNet中关键模块的贡献进行定量评估,我们去除了所有的模块获得了baseline的结果,并对所有模块的单独使用和组合进行了大量的实验,定量结果见表2。

还进行了更多的消融实验,以进一步证明协同感知增强模块和分层注意力整合模块的有效性。我们单独去除了协同感知增强模块,并将其替换为几个先进的特征增强模块,例如MFAM,DFA和ERF。此外,我们还单独去除了分层注意力整合模块及其相应的特征融合结构,将其替换为几个众所周知的特征融合结构,包括FPN,路径聚合和BiFPN。获得的定量结果见表3。实验结果表明,协同感知增强模块和分层注意力整合模块的性能优于其他方法,这主要归功于协同感知增强模块的有效感知能力和分层注意力整合模块的综合特征融合。

泛化性实验

  为了进一步验证SRPCNet的泛化能力,在SD-saliency-900数据集上进行了泛化实验,定量实验结果如表4所示。结果表明,SRPCNet在SD-saliency-900数据集上也取得了令人满意的性能,有效地证明了SRPCNet的泛化能力和有效性。这些结果进一步证实了SRPCNet能够处理其他类型的钢材表面缺陷检测任务。

复现代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2262204.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Kioptrix靶场渗透--level1.1

目录 环境搭建 镜像包下载 下载后解压,并修改配置 开始渗透 获取IP 获取具体服务 尝试sql注入 尝试命令执行 反弹shell 提权 查看Linux的内核版本 下载脚本 将脚本上传至靶机 编译脚本 编译后执行 第一个脚本失败,再找个脚本 使用cat /…

AI技术在演示文稿制作中的应用一键生成PPT

在快节奏的现代工作环境中,时间就是金钱。为了提高工作效率,许多专业人士都在寻找能够快速生成演示文稿(PPT)的工具。本文将探讨AI技术如何帮助用户自动生成演示文稿,从文案撰写到排版,最终输出成品&#x…

中国当代印章孙溟㠭篆刻锤凿印《无题Ⅵ》

孙溟㠭篆刻锤凿印《无题Ⅵ》 孙溟㠭篆刻锤凿印《无题Ⅵ》 此作品有人说看到了流星雨,有人说看到了战争,有人说看到了疾风暴雨,有人说看到了烟花庆新年,有人说是天气突变下的冰雹……!至于是什么仁者见仁智者见智。 孙…

游戏引擎学习第54天

仓库: https://gitee.com/mrxiao_com/2d_game 回顾 我们现在正专注于在游戏世界中放置小实体来代表所有的墙。这些实体围绕着世界的每个边缘。我们有活跃的实体,这些实体位于玩家的视野中,频繁更新,而那些离玩家较远的实体则以较低的频率运…

STM32F407ZGT6-UCOSIII笔记2:UCOSIII任务创建实验-Printf 函数卡住 UCOSIII 系统问题解决

今日简单编写熟悉一下UCOSIII系统的任务创建代码,理解一下OS系统: 并发现以及解决了 Printf 函数卡住 UCOSIII 系统问题解决 文章提供测试代码讲解、完整工程下载、测试效果图 目录 文件结构解释: 任务函数文件: 目前各个文件任…

linux centos 7 安装 mongodb7

MongoDB 是一个基于文档的 NoSQL 数据库。 MongoDB 是一个文档型数据库,数据以类似 JSON 的文档形式存储。 MongoDB 的设计理念是为了应对大数据量、高性能和灵活性需求。 MongoDB使用集合(Collections)来组织文档(Documents&a…

kafka的处理的一些问题 消费延迟

kafka的处理的一些问题 消费者客户端不但没有背压而且内存充足,但产生的消费延迟越来越大在Kafka的Leader副本宕机时 消费者客户端不但没有背压而且内存充足,但产生的消费延迟越来越大 比如我们这个kakfa集群一共有3个Broker节点 TOp1有5个分区&#xf…

计算机网络技术基础:3.计算机网络的拓扑结构

网络拓扑结构是指用传输媒体互连各种设备的物理布局,即用什么方式把网络中的计算机等设备连接起来。将工作站、服务站等网络设备抽象为点,称为“节点”;将通信线路抽象为线,称为“链路”。由节点和链路构成的抽象结构就是网络拓扑…

Vue3源码笔记阅读1——Ref响应式原理

本专栏主要用于记录自己的阅读源码的过程,希望能够加深自己学习印象,也欢迎读者可以帮忙完善。接下来每一篇都会从定义、运用两个层面来进行解析 定义 运用 例子:模板中访问ref(1) <template><div>{{str}}</div> </template> <script> impo…

STM32F407寄存器点灯

背景描述&#xff1a; 最近用32开发遇到问题不得不看寄存器了&#xff0c;就回顾了一下寄存器手册的查看方式和寄存器的使用方法&#xff1b; 上一次这么细致的记录还是在刚学习STM32的时候&#xff0c;之前觉得看寄存器手册以及配置寄存器是有点难度的事情&#xff0c;现在回头…

2024年12月11日Github流行趋势

项目名称&#xff1a;maigret 项目维护者&#xff1a;soxoj, kustermariocoding, dependabot, fen0s, cyb3rk0tik项目介绍&#xff1a;通过用户名从数千个站点收集个人档案信息的工具。项目star数&#xff1a;12,055项目fork数&#xff1a;870 项目名称&#xff1a;uv 项目维护…

Halcon中histo_2dim(Operator)算子原理及应用详解

在Halcon中&#xff0c;histo_2dim算子是一个用于计算双通道灰度值图像的直方图的工具。以下是对该算子的原理及应用的详细解释&#xff1a; 一、原理 histo_2dim算子的函数原型为&#xff1a;histo_2dim(Regions, ImageCol, ImageRow : Histo2Dim : : )。 输入参数&#xff…

mysql免安装版配置教程

一、将压缩包解压至你想要放置的文件夹中&#xff0c;注意&#xff1a;绝对路径中要避免出现中文 二、在解压目录下新建my.ini文件&#xff0c;已经有的就直接覆盖 my.ini文件内容 [mysqld] # 设置3306端口 port3306 # 设置mysql的安装目录 basedirD:\\tools\\mysql-8.1.0-win…

(六)- DRM驱动开发(qcom)

一&#xff0c;Linux Android Display 1&#xff0c;Linux Android Display Software Subsystem 密 2&#xff0c;Linux Android Display Architecture 密 二&#xff0c;DRM/KMS Adreno DPU 1&#xff0c;硬件框图 密 1.1 Qualcomm Adreno DPU 8-Series Overview 密 …

手眼标定工具操作文档

1.手眼标定原理介绍 术语介绍 手眼标定&#xff1a;为了获取相机与机器人坐标系之间得位姿转换关系&#xff0c;需要对相机和机器人坐标系进行标定&#xff0c;该标定过程成为手眼标定&#xff0c;用于存储这一组转换关系的文件称为手眼标定文件。 ETH&#xff1a;即Eye To …

CTFshow-文件上传(Web151-170)

CTFshow-文件上传(Web151-170) 参考了CTF show 文件上传篇&#xff08;web151-170&#xff0c;看这一篇就够啦&#xff09;-CSDN博客 Web151 要求png&#xff0c;然后上传带有一句话木马的a.png&#xff0c;burp抓包后改后缀为a.php&#xff0c;然后蚁剑连接&#xff0c;找fl…

基于YOLOv8模型监控视频中的车辆检测与识别应用

1.摘要 该项目旨在通过技术手段加强交通纪律&#xff0c;提供一种更为人性化和智能化的交通监控方法。具体而言&#xff0c;通过利用PyQt5、YOLOv8和TensorFlow等技术栈&#xff0c;实现了对车辆的高效检测与识别&#xff0c;主要实现车辆类型识别以及速度监测等功能&#xff0…

CISC RISC

CISC&#xff1a;设计目标是通过复杂的指令来提高代码密度&#xff0c;减少指令数量&#xff0c;适合内存资源较为有限的系统。CISC处理器的硬件复杂度较高&#xff0c;但在某些应用场合&#xff08;如桌面计算机&#xff09;能够提供足够的性能。 RISC&#xff1a;设计目标是…

AI Agent与MEME:技术与文化融合驱动Web3创新

AI Agent如何引领Web3新时代&#xff1f; 随着Web3与区块链技术的迅速发展&#xff0c;AI Agent作为人工智能与区块链的交汇点&#xff0c;正在逐步成为推动去中心化生态的重要力量。同时&#xff0c;MEME文化凭借其强大的社区驱动力和文化渗透力&#xff0c;在链上生态中扮演着…

前端的知识(部分)

11 前端的编写步骤 第一步:在HTML的页面中声明方法 第二步:在<script>中定义一个函数,其中声明一个data来为需要的数据 赋值一个初始值 第三步:编写这个方法实现对应的功能