【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月 22 日论文合集)

news2024/12/22 15:06:31

文章目录

  • 一、检测相关(9篇)
    • 1.1 Wildfire Detection Via Transfer Learning: A Survey
    • 1.2 Polygon Detection for Room Layout Estimation using Heterogeneous Graphs and Wireframes
    • 1.3 Exploiting Multimodal Synthetic Data for Egocentric Human-Object Interaction Detection in an Industrial Scenario
    • 1.4 Lightweight wood panel defect detection method incorporating attention mechanism and feature fusion network
    • 1.5 A Comprehensive Study on the Robustness of Image Classification and Object Detection in Remote Sensing: Surveying and Benchmarking
    • 1.6 End-to-End Augmentation Hyperparameter Tuning for Self-Supervised Anomaly Detection
    • 1.7 Spiking Neural Network for Ultra-low-latency and High-accurate Object Detection
    • 1.8 Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards
    • 1.9 BMAD: Benchmarks for Medical Anomaly Detection

一、检测相关(9篇)

1.1 Wildfire Detection Via Transfer Learning: A Survey

基于迁移学习的野火检测研究综述

论文地址:

https://arxiv.org/abs/2306.12276

在这里插入图片描述
本文调查了不同的公开可用的神经网络模型,用于检测野火使用常规可见距离相机,放置在山顶或森林瞭望塔。神经网络模型在ImageNet-1 K上进行了预训练,并在自定义野火数据集上进行了微调。这些模型的性能进行了评估,在一组不同的野火图像,调查提供了有用的信息,为那些有兴趣使用转移学习野火检测。Swin Transformer-tiny具有最高的AUC值,但ConvNext-tiny检测到所有野火事件,并且在我们的数据集中具有最低的误报率。

1.2 Polygon Detection for Room Layout Estimation using Heterogeneous Graphs and Wireframes

基于异构图和线框的房间布局估计多边形检测

论文地址:

https://arxiv.org/abs/2306.12203

在这里插入图片描述
提出了一种基于神经网络的多边形语义平面检测方法。该方法可以例如用于解决房间布局估计任务。该方法是建立在,结合并进一步发展了几个不同的模块,从以前的研究。该网络采用RGB图像,并使用沙漏主干估计线框和特征空间。从这些,线和结特征被采样。然后将线和接合点表示为无向图,从该无向图获得所寻找的平面的多边形表示。这最后一步的两种不同的方法进行了研究,其中最有前途的方法是建立在异构图形Transformer。在所有情况下,最终输出是语义平面在2D中的投影。结构化3D数据集的方法进行了评估,我们调查的性能都使用采样和估计的线框。实验显示了基于图形的方法的潜力,通过在使用合成线框检测的2D度量中的房间布局估计中优于现有技术的方法。

1.3 Exploiting Multimodal Synthetic Data for Egocentric Human-Object Interaction Detection in an Industrial Scenario

在工业场景中利用多模合成数据进行以自我为中心的人-物交互检测

论文地址:

https://arxiv.org/abs/2306.12152

在这里插入图片描述
在本文中,我们解决了以自我为中心的人与物体的交互(EHOI)检测在工业环境中的问题。为了克服在此上下文中缺乏公共数据集,我们提出了用于生成与若干注释和数据信号配对的EHOI的合成图像(例如,深度图或实例分割掩模)。使用建议的管道,我们提出了EgoISM-HOI一个新的多模态数据集组成的合成EHOI图像在工业环境中的手和物体的丰富注释。为了证明所提出的工具产生的合成EHOI数据的实用性和有效性,我们设计了一种新的方法,预测和结合不同的多模态信号来检测RGB图像中的EHOI。我们的研究表明,利用合成数据预训练所提出的方法显着提高性能时,在现实世界的数据测试。此外,所提出的方法优于国家的最先进的类不可知的方法。为了支持这一领域的研究,我们在www.example.com上公开发布了数据集、源代码和预训练模型https://iplab.dmi.unict.it/egoism-hoi。

1.4 Lightweight wood panel defect detection method incorporating attention mechanism and feature fusion network

一种融合注意力机制和特征融合网络的轻质人造板缺陷检测方法

论文地址:

https://arxiv.org/abs/2306.12113

在这里插入图片描述
近年来,深度学习在木板缺陷检测方面取得了重大进展。然而,仍然存在诸如检测低、检测速度慢以及难以在木板表面上部署嵌入式设备等挑战。为了克服这些问题,本文提出了一种轻量化的木板缺陷检测方法YOLOv 5-LW,该方法结合了注意力机制和特征融合网络。首先,为了提高可接受缺陷的检测能力,我们引入了多尺度双向特征金字塔网络(MBiFPN)作为特征融合网络。MBiFPN减少了特征丢失,丰富了局部和细节特征,提高了模型对可接受缺陷的检测能力。其次,为了实现轻量级设计,我们重构了ShuffleNetv 2网络模型作为骨干网络。这种重建减少了参数的数量和计算要求,同时保持性能。我们还引入了Stem Block和Spatial Pyramid Pooling Fast(SPPF)模型来补偿轻量级设计所带来的任何准确性损失,确保模型的检测能力保持不变,同时具有计算效率。第三,我们通过引入高效通道注意力(ECA)来增强骨干网络,这提高了网络对与缺陷检测相关的关键信息的关注。该模型通过关注本质特征,能够更准确地识别和定位缺陷,并利用自主开发的木板缺陷数据集对该方法进行了验证,实验结果表明了改进的YOLOv 5-LW方法的有效性。与原模型相比,该方法的准确率达到92.8%,参数个数减少27.78%,计算量压缩41.25%,检测推理速度提高10.16%。

1.5 A Comprehensive Study on the Robustness of Image Classification and Object Detection in Remote Sensing: Surveying and Benchmarking

遥感图像分类与目标检测稳健性的综合研究:测量与基准

论文地址:

https://arxiv.org/abs/2306.12111

在这里插入图片描述
深度神经网络(DNN)在遥感(RS)图像解释中得到了广泛的应用。然而,在以前的工作中已经证明DNN容易受到不同类型的噪声的影响,特别是对抗性噪声。令人惊讶的是,一直缺乏对RS任务的鲁棒性的全面研究,促使我们对RS中图像分类和对象检测的鲁棒性进行彻底的调查和基准测试。据我们所知,这项研究代表了RS任务中自然鲁棒性和对抗鲁棒性的第一次全面检查。具体来说,我们已经策划并公开了包含自然和对抗性噪声的数据集。这些数据集是评估基于DNN的模型的鲁棒性的宝贵资源。为了提供模型鲁棒性的全面评估,我们用许多不同的分类器和检测器进行了细致的实验,包括广泛的主流方法。通过严格的评估,我们发现了有见地和有趣的发现,揭示了对抗性噪声制作和模型训练之间的关系,对各种模型的敏感性和局限性有了更深入的了解,并为开发更具弹性和鲁棒性的模型提供了指导。

1.6 End-to-End Augmentation Hyperparameter Tuning for Self-Supervised Anomaly Detection

端到端增强超参数自监督异常检测方法

论文地址:

https://arxiv.org/abs/2306.12033

在这里插入图片描述
自监督学习(SSL)已经成为一种有前途的范例,它将自我生成的监督信号呈现给现实世界的问题,绕过了大量的手动标记负担。SSL对于异常检测等无监督任务特别有吸引力,其中标记的异常通常不存在并且获取成本很高。虽然自监督异常检测(SSAD)最近出现了兴趣激增,但文献未能将数据增强视为超参数。同时,最近的工作已经报道,增强的选择有显着的影响检测性能。在本文中,我们介绍了ST-SSAD(自调整自监督异常检测),第一个系统的方法SSAD方面严格调整增强。为此,我们的工作提出了两个关键贡献。第一个是新的无监督验证损失,它量化了增强的训练数据和(未标记的)测试数据之间的对齐。在原则上,我们采用转导,量化的程度,增强模仿真正的异常生成机制,在对比增强数据与任意的伪异常,而不考虑测试数据。其次,我们提出了新的可微增强函数,允许数据增强超参数通过我们提出的验证损失进行端到端的调整。两个测试平台的语义类异常和微妙的工业缺陷的实验表明,系统调整增强提供了显着的性能增益超过目前的做法。

1.7 Spiking Neural Network for Ultra-low-latency and High-accurate Object Detection

基于尖峰神经网络的超低延迟高精度目标检测

论文地址:

https://arxiv.org/abs/2306.12010

在这里插入图片描述
尖峰神经网络(SNN)因其能量效率和大脑启发的事件驱动特性而引起了广泛的兴趣。虽然像Spiking-YOLO这样的最新方法已经将SNN扩展到更具挑战性的对象检测任务,但它们通常具有高延迟和低检测精度,使得它们难以部署在延迟敏感的移动平台上。此外,从人工神经网络(ANN)到SNNs的转换方法很难保持ANN的完整结构,导致特征表示差和转换错误高。为了应对这些挑战,我们提出了两种方法:时间步长压缩和尖峰时间相关集成(STDI)编码。前者通过压缩信息减少了ANN-SNN转换所需的时间步长,而后者设置了一个时变阈值,以扩大信息容量。我们还提出了一个基于SNN的超低延迟和高精度对象检测模型(SUHD),该模型在PASCAL VOC和MS COCO等非平凡数据集上实现了最先进的性能,与MS COCO数据集上的Spiking-YOLO相比,时间步长减少了750倍,平均精度(mAP)提高了30%。据我们所知,SUHD是迄今为止最深入的基于尖峰的对象检测模型,它实现了超低的时间步长来完成无损转换。

1.8 Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards

探索数据集合成的有效性–苹果检测在果园中的应用

论文地址:

https://arxiv.org/abs/2306.11763

在这里插入图片描述
近年来,深度目标检测模型取得了显著的成功,但仍然存在一个主要障碍:需要大量的训练数据。获得这样的数据是一个繁琐的过程,主要是耗时的,导致新的研究途径,如合成数据生成技术的探索。在这项研究中,我们探讨了稳定扩散2.1-基地生成合成数据集的苹果树的对象检测和比较,它的基线模型训练的现实世界的数据。在使用提示工程创建真实苹果树的数据集并利用先前训练的稳定扩散模型之后,通过训练YOLOv5m对象检测模型来注释和评估自定义数据集,以预测真实世界苹果检测数据集中的苹果。选择YOLOv5m是因为其快速的推理时间和最小的硬件需求。结果表明,当在一组真实世界图像上评估时,在生成的数据上训练的模型与在真实世界图像上训练的基线模型相比表现略差。然而,这些发现仍然非常有希望,因为平均精度差异仅为0.09和0.06,分别。定性结果表明,该模型可以准确地预测苹果的位置,除了在严重遮荫的情况下。这些发现说明了潜在的合成数据生成技术作为一个可行的替代广泛的训练数据的对象检测模型的收集。

1.9 BMAD: Benchmarks for Medical Anomaly Detection

BMAD:医疗异常检测基准

论文地址:

https://arxiv.org/abs/2306.11876

在这里插入图片描述
异常检测(AD)是机器学习和计算机视觉中的一个基础研究问题,在工业检测,视频监控和医疗诊断中具有实际应用。在医学成像中,AD对于检测和诊断可能指示罕见疾病或病症的异常尤其重要。然而,缺乏一个通用的和公平的基准评估AD方法的医学图像,这阻碍了更广泛的和强大的AD方法在这个特定的领域的发展。为了弥合这一差距,我们引入了一个全面的评估基准评估异常检测方法的医学图像。该基准包括来自五个医学领域(即,脑MRI、肝CT、视网膜OCT、胸部X射线和数字组织病理学)和三个关键评估指标,并且包括总共十四种最先进的AD算法。这个标准化和精心策划的医疗基准与结构良好的代码库,使最近提出的异常检测方法之间的全面比较。这将有助于社会进行公平的比较,并推动AD在医学影像领域的发展。有关BMAD的更多信息,请访问我们的GitHub存储库:https://github.com/DorisBao/BMAD。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/674959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端中的相关概念

谁道人生无再少, 门前流水尚能西。 桃花落尽胭脂透, 庭院无声五更鸡。 —— 杜甫《端午节》 HTML中class属性 HTML中class属性是一种用于为元素定义样式和标识的属性,以下是class属性的几种常见用法实例,包括标识元素、定义样…

利用OpenCV计算条形物体的长度

0、前言 在图像处理中,我们可能会遇到求一个线条长度的场景,比如,现在有一条裂缝,需要求其长度,或者有一个长条形的零件需要知道其长度。 本文利用OpenCV和skimage两个库,提供了一个解决方案。 1、解决步…

贪心法与动态规划的对比分析

高级算法设计课程论文 题 目:贪心法与动态规划的对比分析 作者姓名: 作者学号: 专业班级: 提交时间: 2023/6/3 目 录 1 引言 1 2 分析过程 2 2.1多段图的最短路径问题 2 2.2最小生成树问题 4 3动态规划与贪心法的对…

【动态规划算法练习】day3

文章目录 一、931. 下降路径最小和1.题目简介2.解题思路3.代码4.运行结果 二、64. 最小路径和1.题目简介2.解题思路3.代码4.运行结果 三、面试题 17.16. 按摩师1.题目简介2.解题思路3.代码4.运行结果 总结 一、931. 下降路径最小和 1.题目简介 931. 下降路径最小和 题目描述&…

浅析 GeoServer CVE-2023-25157 SQL注入

原创稿件征集 邮箱:eduantvsion.com QQ:3200599554 黑客与极客相关,互联网安全领域里 的热点话题 漏洞、技术相关的调查或分析 稿件通过并发布还能收获 200-800元不等的稿酬 更多详情,点我查看! 简介 GeoServer是一个开…

十八、网络基础(一)

一、协议 (一)前置 协议其实是一种约定!!! 计算机之间的传输媒介是光信号和电信号 , 通过 " 频率 " 和 " 强弱 " 来表示 0 和 1 这样的信息 , 要想传递各种不同的信息 , 就需要约定好双方的数据…

(自己动手开发自己的语言练手级应用)JSON(JavaScript Object Notation) 产生式(BNF)

写自己的开发语言时&#xff0c;很多人都会拿JSON当第一个练习对象 开源net json FJSON 解析工具https://dbrwe.blog.csdn.net/article/details/107611540?spm1001.2014.3001.5502 <json> :: <object> | <array> <object> :: "{" [ <me…

分布式学习第三天 nginx学习

目录 1. 一些基本概念 1.1 Nginx初步认识 1.2 正向/反向代理 1.3 域名和IP 2. Nginx 安装和配置 2.1 安装 2.2 配置 3. Nginx的使用 3.1 部署静态网页 3.2 反向代理和负载均衡 课外知识导读 1. URL和URI 2. DNS解析过程 复习 1. 一些基本概念 1.1 Nginx初步认识…

团体程序设计天梯赛-练习集L1篇②

&#x1f680;欢迎来到本文&#x1f680; &#x1f349;个人简介&#xff1a;Hello大家好呀&#xff0c;我是陈童学&#xff0c;一个与你一样正在慢慢前行的普通人。 &#x1f3c0;个人主页&#xff1a;陈童学哦CSDN &#x1f4a1;所属专栏&#xff1a;PTA &#x1f381;希望各…

在我掉入计算机的大坑并深陷其中时,一门名为“C语言”的编程语言让我沉迷

各位CSDN的uu们你们好呀&#xff0c;小雅兰好久没有更新博客啦&#xff0c;今天来小试牛刀&#xff01;&#xff01;&#xff01; 上一篇博客小雅兰是说自己原本是自动化专业的学生&#xff0c;但是因为一次偶然的机会对计算机的相关知识产生了浓厚的兴趣。那么&#xff0c;小雅…

Linux Ubuntu man文档的图文安装教程

文章目录 前言man文档的起源man文档的安装man文档的使用总结 前言 当提及"man文档"时&#xff0c;通常是指Unix和类Unix系统中的手册页&#xff08;man page&#xff09;&#xff0c;因为Linux是在Unix的基础上发展而来的操作系统&#xff0c;所以我们的Linux也有ma…

操作系统 - 内存管理

✅作者简介&#xff1a;人工智能专业本科在读&#xff0c;喜欢计算机与编程&#xff0c;写博客记录自己的学习历程。 &#x1f34e;个人主页&#xff1a;小嗷犬的个人主页 &#x1f34a;个人网站&#xff1a;小嗷犬的技术小站 &#x1f96d;个人信条&#xff1a;为天地立心&…

INDEMIND相机ROS bag包数据的回放

实验需要IMU相机&#xff0c;跑算法是在ROS下跑&#xff0c;在 ROS 系统中&#xff0c;可以使用 bag 文件来保存和恢复系统的运行状态&#xff0c;比如相机话题的 bag 包&#xff0c;然后回放用来进行联合外参标定&#xff0c;也可以使用EVO工具显示算法轨迹&#xff0c;这里记…

合宙Air724UG Cat.1模块硬件设计指南--GPIO控制

GPIO控制 简介 GPIO&#xff08;General-purpose input/output&#xff09;&#xff0c;通用型之输入输出的简称&#xff0c;可实现某时刻电平状态的输出与输入&#xff0c;即可以通过它们输出高低电平或者通过它们读入引脚的状态-是高电平或是低电平。 特性 共支持28个GPIO&a…

A Neural Conversational Model 读后感

目录 摘要 1、介绍 2、相关工作 3、模型 4、数据&#xff08;后面都是具体的东西&#xff0c;不赘述&#xff09; 5、总结 使用微软翻译得到的中文原文&#xff1a; 摘要 会话建模是自然语言理解和机器智能中的一项重要任务。尽管存在以前的方法&#xff0c;但它们通常仅…

MySQL数据库:数据库的约束以及数据的聚合、联合查询

目录 一.关系模型的简要概述 二.数据库的约束 2.1约束类型 2.2NULL约束 2.3 UNIQUE&#xff1a;唯一约束 2.4 默认约束 2.5 PRIMARY KEY&#xff1a;主键约束 2.6 FOREIGN KEY&#xff1a;外键约束 2.7 CHECK约束 三.高效率查询 3.1高效率查询的分类 3.2聚合查询 …

Nginx热升级到1.23.4过程指导手册

一、问题描述 因环境内部安全扫描发现CVE-2021-23017、CVE-2022-41741、CVE-2022-41742、CVE-2019-20372漏洞&#xff0c;经分析后&#xff0c;需要将nginx升级到1.23.4版本&#xff1b; 现场环境&#xff1a;centos7.4 1708、nginx 1.20.1 资料&#xff1a;软件下载、360安全…

spring框架-循环依赖问题(二)

文章目录 什么是循环依赖解决循环依赖的办法知识扩展 什么是循环依赖 两个或多个类之间存在彼此依赖的情况,形成一个循环依赖链 代码&#xff1a; 单例bean的循环依赖&#xff1a; 先了解Bean的生命周期&#xff1a;1.实例化 2.初始化、3.使用 4.销毁 详细了解Bean生命周期…

数据库高级

数据库高级&#x1f985; 文章目录 数据库高级&#x1f985;范式&#x1f98d;什么是范式&#x1f40a;第一范式——1NF&#x1f996;第二范式——2NF&#x1f41f;第三范式——3NF&#x1f409;总结&#x1f419; 五大约束&#x1f40f;主键约束&#x1f421;外键约束&#x1…

第五章 ResNeXt网络详解

系列文章目录 第一章 AlexNet网络详解 第二章 VGG网络详解 第三章 GoogLeNet网络详解 第四章 ResNet网络详解 第五章 ResNeXt网络详解 第六章 MobileNetv1网络详解 第七章 MobileNetv2网络详解 第八章 MobileNetv3网络详解 第九章 ShuffleNetv1网络详解 第十章…