Yolov5创新:NEU-DET钢材表面缺陷检测,优化组合新颖程度较高,CVPR2023 DCNV3和InceptionNeXt,涨点明显

news2025/1/11 2:58:42

1.钢铁缺陷数据集介绍

NEU-DET钢材表面缺陷共有六大类,分别为:'crazing','inclusion','patches','pitted_surface','rolled-in_scale','scratches'

每个类别分布为:

训练结果如下:

2.基于yolov5s的训练

map值0.742

 

2.1  Inception-MetaNeXtStage

 

论文地址: https://arxiv.org/pdf/2303.16900.pdf

代码: GitHub - sail-sg/inceptionnext: InceptionNeXt: When Inception Meets ConvNeXt

单位:NUS, Sea AI Lab(颜水成等人)

摘要:受ViT的 long-range 建模能力的启发,大核卷积来扩大感受野用于提升模型性能,比如ConvNeXt了采用7x7深度卷积。虽然这种深度操作符只消耗少量FLOPs,但高内存访问成本,它在很大程度上损害了强大计算设备上的模型效率。为了解决这个问题,我们提出将大核深度卷积分解为沿通道维度的四个并行分支,即小平方内核、两个正交带核和一个恒等映射。通过这种新的Inception深度卷积,我们构建了一系列网络,即IncepitonNeXt,它们不仅具有高吞吐量,而且保持了有竞争力的性能。

       图 1:准确性和训练之间的权衡吞吐量。 所有模型均在 DeiT 训练下进行训练超参数 [61、37、38、69]。 训练吞吐量在批量大小为 128 的 A100 GPU 上测量。ConvNeXt-T/kn 表示具有深度卷积的变体内核大小为 n × n。 InceptionNeXt-T 兼具两者ResNet-50 的速度和 ConvNeXt-T 的准确性。

 

图 2:MetaFormer、MetaNext、ConvNeXt 和 InceptionNeXt 的框图。 

     将Inception的思想和ConvNeXt的设计相结合,从而实现了对大核深度卷积的有效分解。这种分解不仅减少了参数量和计算量,而且保留了大核深度卷积的优势,即扩大了感受野和提高了模型性能。

对应博客:涨点神器:CVPR2023 InceptionNeXt当Inception遇见ConvNeXt,在Yolov5/Yolov7/Yolov8即插即用,小目标检测涨点明显_AI小怪兽的博客-CSDN博客

 2.2 DCNV3

 

论文:https://arxiv.org/abs/2211.05778

代码:GitHub - OpenGVLab/InternImage: [CVPR 2023 Highlight] InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions

  理论部分参考知乎:CVPR2023 Highlight | 书生模型霸榜COCO目标检测,研究团队解读公开 - 知乎 

      不同于近来聚焦于大核的CNN方案,InternImage以形变卷积作为核心操作(不仅具有下游任务所需的有效感受野,同时具有输入与任务自适应空域聚合能力)。所提方案降低了传统CNN的严格归纳偏置,同时可以学习更强更鲁棒的表达能力。ImageNet、COCO以及ADE20K等任务上的实验验证了所提方案的有效性,值得一提的是:InternImage-H在COCO test-dev上取得了新的记录65.4mAP。 

 

对应博客:

涨点神器:Yolov8引入CVPR2023 InternImage:注入新机制,扩展DCNv3,助力涨点,COCO新纪录65.4mAP!_AI小怪兽的博客-CSDN博客

map为0.757

 

2.3 DCNV3+MetaNeXtStage

map为0.776

3.总结

通过引入CVPR2023 DCNV3和MetaNeXtStage思想,在钢铁缺陷中取得涨点从原始map值0.742提升至0.776,从原始且相比较于发表的一些论文,创新新颖程度好很多,有需要自取可以在自己数据集进行实验,并很有可能发表论文成功哦!!!

源码详见:

基于Yolov5的NEU-DET钢材表面缺陷检测,优化组合新颖程度较高:CVPR2023 DCNV3和InceptionNeXt,涨点明显_AI小怪兽的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1020290.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

1978-2021年全国各省城镇与农村恩格尔系数数据

1978-2021年全国各省城镇与农村恩格尔系数数据 1、时间:1978-2021年 2、指标:城镇恩格尔系数、农村恩格尔系数 3、范围:31省市 4、来源:各省年鉴 5、用途:反应居民生活质量 6、指标解释: 恩格尔系数…

C++---链表

1、链表 1.1、链表的结构 每个链表开头都有一个头指针Head尾节点的指针域为NULL,用于判断此列表是否结束 如果一个链表开始就为NULL,那么该链表为空链表 链表中的先后不代表在真实内存中的位置,只是单纯的逻辑上关系 1.2、创建链表 我们首…

Spring常见面试题总结

什么是Spring Spring是一个轻量级Java开发框架,目的是为了解决企业级应用开发的业务逻辑层和其他各层的耦合问题,以提高开发效率。它是一个分层的JavaSE/JavaEE full-stack(一站式)轻量级开源框架,为开发Java应用程序…

iPhone升级iOS17后待机模式不能用、没反应?这7个方法快速解决!

iPhone待机模式是苹果为iOS17版本加入的新功能之一,当我们不用iPhone 时,能将它随手放在一旁,并以横向全屏的方式观看时钟与App小工具资讯等。 不过有些果粉发现他们的iPhone待机模式不能用、没反应,照着步骤操作也无法进入iPhon…

MX6LL控制LED设备

注:本篇基于野火IMX6LL PRO开发板 一.什么是驱动程序 驱动程序(Driver)是一种软件,用于充当操作系统与硬件设备之间的桥梁,使它们能够互相通信和交互。驱动程序的主要功能是提供一个标准化的接口,使操作系…

从0搭建夜莺v6基础监控告警系统(一):基础服务安装

文章目录 1. 写在前面1.1. 官方文档传送门1.2. 部署环境 2. 服务安装2.1. 基础设置2.2. 安装中间件2.3. 安装 nightingale-v62.4. 安装 VictoriaMetrics2.5. 安装 Categraf 3. 部署总结3.1. 安装总结 1. 写在前面 1.1. 官方文档传送门 项目介绍 架构介绍 仪表盘 黄埔营培训计…

来袭!SOLIDWORKS 2024 主要增强功能

在SOLIDWORKS软件使用过程中,我们知道您创建了出色的设计,您的出色设计也会得到构建。为了简化和加快从概念到制造产品的产品开发流程,SOLIDWORKS 2024 包含用户驱动的全新增强功能,重点关注: • 提高工作智能化程度。…

怎么在便携式手持嵌入式设备中实现安全的数字数据传输

为了实施附加的安全性,一些密码算法也可以指定一组不应从设备公开的常数值。这些存储在设备中的,需要防止未经授权暴露的秘密密钥和秘密值在一系列文章中被称为“秘密密钥”。 秘密密钥存储在设备内部,甚至在设备的整个生命周期中都存在。设…

浅谈双十一背后的支付宝LDC架构和其CAP分析

本人汤波,superthem.com 圆领超级个体创始人,Github page地址:https://tbwork.github.io/ 看到很多人在盗用我的文章,还标记成原创,进行收费,非常令人作呕。 我的所有技术文章全部免费阅读,大家…

在Python中 作用域与命名空间的坑

前言: 嗨喽~大家好呀,这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 1. 命名空间 1.1 什么是命名空间 Namespace命名空间,也称名字空间,是从名字到对象的映射。 Python中,大…

VMware17 不可恢复错误mks解决方案

用的虚拟机VMware17版本,然后运行带HDR的unity程序,结果报错 网上找了很多解决方案,都没用。毕竟需要在不放弃虚拟机3D加速的情况下运行。 最终皇天不负有心人,亲测有效的方法: 在虚拟机名字.vmx文件里添加以下2行&a…

【整理】难得的中文开源数据集

搞大模型训练,最重要的就是高质量的数据集。 得数据者得天下。全球最大的AI开源社区Huggingface上,已经有5万多的开源数据集了,其中涉及中文的数据集只有区区可怜的151个。中国的AI产业要迎头赶上,中文的数据集是最大的短板之一。…

IOTE2023物联网展最新快讯|央企入驻,找物联网平台这一家就够了

IOTE 2023第20届国际物联网展深圳站即将于9月20-22日在深圳国际会展中心(宝安)启幕!航天科技控股集团股份有限公司旗下AIRIOT物联网平台亮相【工业物联网展区9B31-1展位】。 AIRIOT物联网平台定位于通用型物联网技术框架产品,以软…

oracle创建数据库以及用户,并导入dmp格式数据

oracle创建数据库以及用户,并导入dmp格式数据 安装可参考之前的文章https://blog.csdn.net/qq_43421954/article/details/132717546?spm1001.2014.3001.5501 首先创建表空间(也就是其他数据库所谓的数据库) 使用的是navicat,连接配置可以参…

python 异常

1.捕获异常 2.密码爆破 3.

Feign远程调用丢失请求头

前言 我们在写服务端项目的时候,总会限制对某些资源的访问,最常见的就是要求用户先登录才能访问资源,当用户登录后就会将此次会话信息保存进session,同时返回给浏览器指定的cookie键值,下次浏览器再次访问&#xff0c…

【虚拟现实】2023年VR技术的10个应用行业

1.医疗保健 现代医疗保健的培训方式离不开VR虚拟现实。。由于医疗行业的特殊性,不允许拿大量的病人来练手,但医疗又非常注重实践,一些新手医生就缺乏锻炼的机会,而VR虚拟现实技术很好的解决了这一问题。医生可以在高清晰、低延时…

【C++】搜索二叉树底层实现

目录 一,概念 二,实现分析 1. 插入 (1.)非递归版本 (2.)递归版本 2. 打印搜索二叉树 3.查找函数 (1.)非递归版本 (2.)递归版本 4. 删除函数&#x…

【Linux-Day13-生产者消费者模型】

生产者消费者模型 生产者消费者问题概述 生产者/消费者问题,也被称作有限缓冲问题。可以描述为:两个或者更多的线程共享同一个缓冲 区,其中一个或多个线程作为“生产者”会不断地向缓冲区中添加数据,另一个或者多个线程作为“消…

基于CNN-LSTM的时序预测MATLAB实战

一、算法原理 1.1 CNN原理 卷积神经网络具有局部连接、权值共享和空间相关等特性。卷积神经网络结构包含卷积层、激活层和池化层。 (a)二维卷积层将滑动卷积滤波器应用于输入。该层通过沿输入垂直和水平方向 移动滤波器对输入进行卷积,并计…