【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(5月26日论文合集)

news2025/1/21 12:56:00

文章目录

  • 一、检测相关(9篇)
    • 1.1 Energy-based Detection of Adverse Weather Effects in LiDAR Data
    • 1.2 Anomaly Detection with Conditioned Denoising Diffusion Models
    • 1.3 Mask Attack Detection Using Vascular-weighted Motion-robust rPPG Signals
    • 1.4 Improved Multi-Scale Grid Rendering of Point Clouds for Radar Object Detection Networks
    • 1.5 Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving
    • 1.6 Learning Occupancy for Monocular 3D Object Detection
    • 1.7 Towards Total Online Unsupervised Anomaly Detection and Localization in Industrial Vision
    • 1.8 Leveraging object detection for the identification of lung cancer
    • 1.9 Entropy-Aware Similarity for Balanced Clustering: A Case Study with Melanoma Detection

一、检测相关(9篇)

1.1 Energy-based Detection of Adverse Weather Effects in LiDAR Data

基于能量的激光雷达数据中不利天气影响的检测

论文地址:

https://arxiv.org/abs/2305.16129

在这里插入图片描述

自动驾驶车辆依赖于LiDAR传感器对环境进行感知。然而,雨、雪、雾等恶劣天气条件会对这些传感器造成负面影响,导致测量数据中引入不必要的噪声,降低了其可靠性。在本研究中,我们通过提出一种新的方法来检测LiDAR数据中的恶劣天气效应来解决这个问题。

我们将这个问题重新定义为异常检测任务,并利用能量框架来检测点云中的异常值。具体而言,我们的方法通过学习将能量评分与内点点云关联起来,将高能量评分与异常值关联起来,从而实现对恶劣天气效应的鲁棒检测。通过广泛的实验,我们证明了我们的方法在恶劣天气检测方面表现更好,并且对未见过的天气效应具有更高的鲁棒性,超过了先前最先进的方法。此外,我们还展示了如何利用我们的方法进行同时的异常检测和语义分割。最后,为了推动在恶劣天气条件下的LiDAR感知研究领域的发展,我们发布了SemanticSpray数据集,其中包含在类似高速公路场景中标记的车辆喷雾数据。

1.2 Anomaly Detection with Conditioned Denoising Diffusion Models

基于条件去噪扩散模型的异常检测

论文地址:

https://arxiv.org/abs/2305.15956

在这里插入图片描述
基于重建的方法在异常检测方面一直难以取得竞争性的性能。本文引入了一种称为Denoising Diffusion Anomaly Detection(DDAD)的方法。我们提出了一种新颖的去噪过程,用于基于目标图像的图像重建。这样可以得到一个与目标图像密切相似的连贯恢复图像。随后,我们的异常检测框架利用这种条件化,在去噪过程中将目标图像设定为输入图像,以引导去噪过程,从而实现无缺陷的重建,并保持正常模式。我们通过对输入图像和重建图像进行像素级和特征级的比较来定位异常。最后,为了增强特征比较的有效性,我们引入了一种域自适应方法,利用我们的条件化去噪过程生成的示例来微调特征提取器。该方法在各种数据集上进行了验证,包括MVTec和VisA基准数据集,分别实现了99.5%和99.3%的图像级AUROC的最先进结果。

1.3 Mask Attack Detection Using Vascular-weighted Motion-robust rPPG Signals

基于血管加权运动稳健rPPG信号的伪装攻击检测

论文地址:

https://arxiv.org/abs/2305.15940

在这里插入图片描述

1.4 Improved Multi-Scale Grid Rendering of Point Clouds for Radar Object Detection Networks

一种改进的雷达目标检测网络点云多尺度网格绘制方法

论文地址:

https://arxiv.org/abs/2305.15836

在这里插入图片描述
对于基于雷达的物体检测任务,将点云首先转换为网格表示,然后应用卷积神经网络的架构能够取得良好的性能。然而,从不规则的点云数据到密集的网格结构的转换通常会导致信息的丢失,这是由于点的离散化和聚合造成的。在本文中,我们提出了一种新颖的架构,即多尺度KPPillarsBEV,旨在减轻网格渲染的负面影响。具体而言,我们提出了一种新颖的网格渲染方法,即KPBEV,它利用核心点卷积的描述能力,在网格渲染过程中改进了局部点云上下文的编码。此外,我们提出了一种通用的多尺度网格渲染形式,将多尺度特征图与任意网格渲染方法结合到检测网络的卷积主干中。我们在nuScenes数据集上进行了大量实验证明了这些方法在检测性能和计算复杂度方面的优势。所提出的多尺度KPPillarsBEV架构在nuScenes验证集的Car AP4.0(匹配阈值为4米的平均精度)上相对于基线提高了5.37%,相对于先前的最先进方法提高了2.88%。此外,所提出的单尺度KPBEV网格渲染相对于基线提高了2.90%的Car AP4.0,并且保持了相同的推理速度。

1.5 Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving

基于语言制导的点云自动驾驶三维目标检测

论文地址:

https://arxiv.org/abs/2305.15765

在这里插入图片描述

1.6 Learning Occupancy for Monocular 3D Object Detection

单目三维目标检测中的学习占有率

论文地址:

https://arxiv.org/abs/2305.15694

在这里插入图片描述

由于缺乏准确的3D信息,单目3D检测是一项具有挑战性的任务。现有的方法通常依赖于几何约束和密集的深度估计,以促进学习,但往往不能充分利用的好处,在锥台和3D空间的三维特征提取。在本文中,我们提出了\textbf{OccupancyM 3D},一种学习单目3D检测占用的方法。它直接学习平截头体和3D空间中的占用,从而产生更具鉴别力和信息量的3D特征和表示。具体来说,通过使用同步的原始稀疏激光雷达点云,我们定义的空间状态,并生成基于体素的占用标签。我们制定一个简单的分类问题和设计相关的占用率损失的占用率预测。所得占用估计被用来增强原始截头体/3D特征。因此,在KITTI和Waymo开放数据集上的实验表明,该方法达到了新的技术水平,并以显着的优势超越了其他方法。代码和预训练模型将在\url{https://github.com/SPengLiang/OccupancyM3D}上提供。

1.7 Towards Total Online Unsupervised Anomaly Detection and Localization in Industrial Vision

面向工业视觉的全在线无监督异常检测与定位

论文地址:

https://arxiv.org/abs/2305.15652

在这里插入图片描述

虽然现有的图像异常检测方法产生了令人印象深刻的结果,但它们大多是离线学习范式,需要过多的数据预收集,限制了它们在具有在线流数据的工业场景中的适应性。基于在线学习的图像异常检测方法与工业在线流数据更兼容,但很少受到关注。本文首次提出了一种完全在线学习的图像异常检测方法,即LeMO,用于在线图像异常检测的学习记忆方法。LeMO利用正交随机噪声初始化的可学习内存,消除了内存初始化中对过多数据的需求,并避免了离线数据收集的低效。此外,一个基于对比学习的异常检测损失函数的设计,使内存和图像目标为导向的功能在线联合优化。该方法简单、高效。大量的实验证明了LeMO在在线环境中的优越性能。此外,在离线设置中,LeMO也与当前最先进的方法竞争,并在Few-Shot场景中实现出色的性能。

1.8 Leveraging object detection for the identification of lung cancer

利用目标检测识别肺癌

论文地址:

https://arxiv.org/abs/2305.15813

在这里插入图片描述

肺癌构成了一个重大的全球公共卫生挑战,强调了早期检测对改善患者预后的重要性。深度学习算法的最新进展在医学图像分析中显示出有希望的结果。本研究的目的是探讨目标检测,特别是YOLOv5,一个先进的目标识别系统,在医学成像肺癌识别的应用。为了训练和评估算法,从Kaggle获得包括胸部X射线和对应注释的数据集。YOLOv5模型用于训练能够检测癌性肺病变的算法。训练过程涉及优化超参数和利用增强技术来增强模型的性能。经过训练的YOLOv5模型在识别肺癌病变方面表现出出色的能力,显示出高准确率和召回率。它成功地确定了胸部X光片中的恶性区域,并通过一个单独的测试集进行了验证,该测试集优于以前的技术。此外,YOLOv5模型证明了计算效率,实现了实时检测,并使其适合集成到临床程序中。这种方法有望帮助放射科医生早期发现和诊断肺癌,最终导致及时治疗和改善患者预后。

1.9 Entropy-Aware Similarity for Balanced Clustering: A Case Study with Melanoma Detection

用于平衡聚类的熵感知相似性:黑色素瘤检测的案例研究

论文地址:

https://arxiv.org/abs/2305.15417

在这里插入图片描述

聚类数据是一种无监督学习方法,旨在将一组数据点划分为多个组。它是机器学习和数据挖掘中一个关键而又苛刻的主题。它的成功应用跨越了各个领域。然而,传统的聚类技术需要考虑在特定的应用中的平衡意义。因此,本文解决了不平衡聚类问题的挑战,并提出了一种新的方法,平衡聚类,利用熵感知的相似性,这可以被定义为程度的平衡。我们创造了一个术语,熵感知的相似性平衡聚类(EASB),它最大限度地平衡在聚类过程中的互补聚类不平衡的数据,并将熵在一个新的相似性公式,占角度差异和距离。该方法的有效性在实际的黑色素瘤医学数据上进行了评估,特别是国际皮肤成像合作组织(ISIC)2019年和2020年的挑战数据集,以证明它如何在保持平衡的同时成功地对数据进行聚类。最后,我们可以确认,所提出的方法在检测黑色素瘤表现出出色的性能,与经典的方法相比。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/573541.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AccessShareLock pg cancel backend terminate backend

AccessShareLock 在PostgreSQL中,AccessShareLock是一种用于控制对数据库对象并发访问的锁类型。它是一种读锁,允许多个事务同时从同一个对象进行读取,但它阻止并发事务获取冲突的锁,比如写锁或独占锁。 当一个事务在对象上获取…

【指针的深刻理解】

如何看待下面代码中的a变量? #include<stdio.h> int main() {int a 0;//同样的一个a&#xff0c;在不同的表达式中&#xff0c;名称是一样的&#xff0c;但是含义是完全不同的&#xff01;a 10;//使用的是a的空间&#xff1a;左值int b a; //使用的是a的内容&#x…

Java jiraClient上传附件不能在浏览器预览的问题分析

最近测试的同学反馈问题说使用平台的报bug上传视频的附件以后&#xff0c;然后在jira上确没有办法通过点击附件进行预览&#xff0c;而需要下载下来才能够查看。但是如果是直接在jira上进行上传附件就不会有这个问题 如果说不了解具体原因的&#xff0c;其实就会觉得这个问题非…

【Linux】Top命令参数解释

TOP命令 这是一个Linux系统下 top 命令所输出的进程监控信息。以下是各列含义&#xff1a; top - 09:52:15&#xff1a;当前时间。 up 27 min&#xff1a;系统已经运行的时长。 2 users&#xff1a;当前有2个用户登录到系统上。 load average: 0.97, 0.41, 0.21&#xff1a;系…

Git进阶+Jenkins入门

文章目录 1 Git进阶——GitFlow工作流程1.1 master与develop分支1.1.1 master1.1.2 develop 1.2 feature分支1.3 Release分支1.4 hotfix分支1.1.3 1 Git进阶——GitFlow工作流程 1.1 master与develop分支 1.1.1 master master&#xff1a;发布上线分支&#xff0c;基于master打…

c++调用dll出现LNK2001 无法解析的外部符号

先说说下正常的dll。 动态库显试调用一般3个文件.h .lib .dll &#xff0c;隐式调用 只需要2个文件:.h&#xff08;函数定义&#xff09; .dll 静态库2个文件&#xff1a;.h .lib 先说C正常dll显式调用 #include "BYD_MES/MES2Interface.h" //#include 是以当前…

HTML表单标签form分析

说明&#xff1a;在html的标签中&#xff0c;表单标签与后台联系密切&#xff0c;像用户登录、注册&#xff0c;都是用到页面的表单标签&#xff0c;用户将信息填入到表单中&#xff0c;提交到后端业务中校验处理&#xff0c;再将结果反馈给前端页面。 表单内的标签分别有&…

ChatGPT国内免费使用的方法有哪些?分享几个网内可用的免费的ChatGPT网页版

目录 一、ChatGpt是什么&#xff1f; 二、ChatGPT国内免费使用的方法&#xff1a; 第一点&#xff1a;电脑端 第二点&#xff1a;手机端 三、结语&#xff1a; 一、ChatGpt是什么&#xff1f; ChatGPt是美国OpenAI [1] 研发的聊天机器人程序 。更是人工智能技术驱动的自然语言…

【学习日记2023.5.26】 之 客户端之完善缓存和购物车模块

文章目录 7. 用户端之完善缓存和购物车模块7.1 缓存菜品7.1.1 问题说明7.1.2 实现思路7.1.3 代码开发7.1.4 功能测试7.1.5 提交代码 7.2 缓存套餐7.2.1 Spring Cache7.2.1.1 介绍2.1.2 常用注解7.2.1.3 入门案例 7.2.2 实现思路7.2.3 代码开发7.2.4 功能测试7.2.5 提交代码 7.3…

14-C++面向对象(单例模式、const成员、浅拷贝、深拷贝)

单例模式 单例模式&#xff1a;设计模式的一种&#xff0c;保证某个类永远只创建一个对象 构造函数\析构函数 私有化 定义一个私有的static成员变量指向唯一的那个单例对象&#xff08;Rocket* m_rocket&#xff09; 提供一个公共的访问单例对象的接口&#xff0…

[组合数学] 容斥原理polya定理

数学 A 170 物理 B130 化学C120 A ∩ B 45 A ∩ C 20 B ∩ C 22 A ∩ B ∩ C 3 A\cap B 45\quad A\cap C20 \quad B\cap C 22 \quad A\cap B\cap C 3 A∩B45A∩C20B∩C22A∩B∩C3 ∣ A ∪ B ∪ C ∣ A B C − A ∩ B − B ∩ C − A ∩ C A ∩ B ∩ C 170 130 …

vcruntime140.dll丢失怎么办?怎么解决vcruntime140.dll丢失的问题

当您运行一个需要此文件的程序时&#xff0c;如果您的系统中不存在这个文件&#xff0c;会提示出错信息“找不到vcruntime140.dll”或“vcruntime140.dll丢失”。这种情况下&#xff0c;您需要解决这个问题&#xff0c;才能继续运行此应用程序。我们将介绍vcruntime140.dll丢失…

python基于协同过滤推荐算法的电影观后感推荐管理系统的设计

本课题所设计的影单管理系统&#xff0c;使用B/S架构&#xff0c;Python语言进行开发&#xff0c;它的优点代码不能从浏览器查看&#xff0c;保密性非常好&#xff0c;比其他的影单管理更具安全性。Python还容易修改和调试&#xff0c;毕竟影视是在不断发展过程中&#xff0c;难…

【P34】JMeter ForEach控制器(ForEach Controller)

文章目录 一、ForEach控制器&#xff08;ForEach Controller&#xff09;参数说明二、准备工作三、测试计划设计 一、ForEach控制器&#xff08;ForEach Controller&#xff09;参数说明 可以对一个组变量进行循环迭代&#xff1b;该组件通常与后置处理器中的 JSON 提取器、正…

自动化测试工具——Selenium详解

前言 Selenium是一个用于Web应用程序测试的工具。是一个开源的Web的自动化测试工具&#xff0c;最初是为网站自动化测试而开发的&#xff0c;类型像我们玩游戏用的按键精灵&#xff0c;可以按指定的命令自动操作&#xff0c;不同是Selenium可以直接运行在浏览器上&#xff0c;…

AIBlockChain:“知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理、区块链和爬虫技术的智能会议系统》软件系统案例的界面简介、功能介绍分享之二、会中智能

AI&BlockChain&#xff1a;“知名博主独家讲授”人工智能创新应用竞赛【精选实战作品】之《基于计算机视觉、自然语言处理、区块链和爬虫技术的智能会议系统》软件系统案例的界面简介、功能介绍分享之二、会中智能系统 目录 人工智能竞赛【精选实战作品】之《基于计算机视…

【网络编程一】初识网络:IP与端口号 网络模型

目录 &#x1f31f;需要知道 一、基础概念 &#x1f308;1、IP地址与端口号 &#x1f308;2、五元组 二、协议分层 &#x1f308;1、OSI七层网络网络模型 &#x1f308;2、TCP/IP五层(四层)模型 &#x1f308;3、封装和分用&#xff08;重点&#xff01;&#xff09; &…

Kotlin 协程中的并发问题:我明明用 mutex 上锁了,为什么没有用?

前言 最近在接手的某项目中&#xff0c;主管给我发来了一个遗留以久的 BUG&#xff0c;让我看看排查一下&#xff0c;把它修复了。 项目的问题大概是在某项业务中&#xff0c;需要向数据库插入数据&#xff0c;而且需要保证同种类型的数据只被插入一次&#xff0c;但是现在却…

每日一练 | 网络工程师软考真题 Day13

阅读以下说明&#xff0c;回答以下问题1至问题6。 【说明】 某公司的两个部门均采用Windows 2003的NAT功能共享宽带连接访问Internet&#xff0c;其网络结构和相关参数如图2-1所示。ISP为该公司分配的公网IP地址段为202.117.12.32/29。 【问题1】在Windows 2003中&#xff0c;…

NodeJS Crypto加密⑤

文章目录 ✨文章有误请指正&#xff0c;如果觉得对你有用&#xff0c;请点三连一波&#xff0c;蟹蟹支持&#x1f618;前言NODE内置模块Zlib模块 createGzip&#xff08;CreateGzip方法 异步&#xff09;Crypto加密模块 getHashes 方法 createHash 方法 createHmac 方法…