【计算机视觉 | 目标检测 | 图像分割】arxiv 计算机视觉关于目标检测和图像分割的学术速递(7 月 31 日论文合集)

news2024/9/30 21:19:10

文章目录

  • 一、检测相关(9篇)
    • 1.1 Semi-Supervised Object Detection in the Open World
    • 1.2 Multi-layer Aggregation as a key to feature-based OOD detection
    • 1.3 Non-invasive Diabetes Detection using Gabor Filter: A Comparative Analysis of Different Cameras
    • 1.4 Local and Global Information in Obstacle Detection on Railway Tracks
    • 1.5 Implicit neural representation for change detection
    • 1.6 Anatomy-Aware Lymph Node Detection in Chest CT using Implicit Station Stratification
    • 1.7 Small, but important: Traffic light proposals for detecting small traffic lights and beyond
    • 1.8 End-to-end Remote Sensing Change Detection of Unregistered Bi-temporal Images for Natural Disasters
    • 1.9 Detecting Morphing Attacks via Continual Incremental Training
  • 二、分割|语义相关(3篇)
    • 2.1 OAFuser: Towards Omni-Aperture Fusion for Light Field Semantic Segmentation of Road Scenes
    • 2.2 One-shot Joint Extraction, Registration and Segmentation of Neuroimaging Data
    • 2.3 Scale-aware Test-time Click Adaptation for Pulmonary Nodule and Mass Segmentation

一、检测相关(9篇)

1.1 Semi-Supervised Object Detection in the Open World

开放世界中的半监督目标检测

https://arxiv.org/abs/2307.15710

在这里插入图片描述
用于半监督对象检测的现有方法假设存在于训练和未标记数据集中的固定类集合,即,分发(ID)数据。当这些技术部署在开放世界中时,这些技术的性能显著降低,这是由于未标记数据和测试数据可能包含在训练期间未看到的对象,即,分布外(OOD)数据。我们在本文中探讨的两个关键问题是:我们能发现这些OOD样本吗?如果能,我们能从中学习吗?考虑到这些因素,我们提出了开放世界半监督检测框架(OWSSD),它可以有效地检测OOD数据以及从ID和OOD数据中学习的半监督学习管道。我们介绍了一个集成的OOD检测器组成的轻量级自动编码器网络只训练ID数据。通过广泛的评估,我们证明了我们的方法与最先进的OOD检测算法相比具有竞争力,并且还显着提高了开放世界场景中的半监督学习性能。

1.2 Multi-layer Aggregation as a key to feature-based OOD detection

多层聚合是基于特征的OOD检测的关键

https://arxiv.org/abs/2307.15647

在这里插入图片描述
深度学习模型很容易受到在训练阶段未观察到的输入图像变化的干扰,从而导致不可预测的预测。检测这样的分布外(OOD)图像在医学图像分析的背景下是特别关键的,其中可能的异常的范围是非常宽的。最近,出现了一类新的方法,基于对训练模型的中间特征的分析。这些方法可分为2组:单层方法,其考虑在固定的、仔细选择的层处获得的特征图,以及多层方法,其考虑由模型生成的特征图的集合。虽然有希望,这些算法的适当比较仍然缺乏。在这项工作中,我们比较了各种基于特征的OOD检测方法的OOD(20种)的大光谱,代表约7800三维MRI。我们的实验揭示了两种现象。首先,多层方法始终优于单层方法,其倾向于具有取决于异常类型的不一致行为。第二,OOD检测性能高度依赖于底层神经网络的架构。

1.3 Non-invasive Diabetes Detection using Gabor Filter: A Comparative Analysis of Different Cameras

基于Gabor滤波的糖尿病无创检测:不同摄像机的对比分析

https://arxiv.org/abs/2307.15480

在这里插入图片描述
本文比较和探讨了移动终端的相机和笔记本电脑相机的性能作为方便的工具,用于捕获图像的非侵入性检测糖尿病(DM)使用面部块纹理特征。年龄在20至79岁之间的参与者被选择用于数据集。使用12 MP和7 MP移动相机以及笔记本电脑相机在正常照明条件下拍摄照片。提取的面部块进行分类,使用k-最近邻(k-NN)和支持向量机(SVM)。捕获100个图像,预处理,使用Gabor滤波,并迭代。该系统的性能进行了测量的准确性,特异性和灵敏度。使用具有100个图像的SVM,从12 mp后置摄像头实现了96.7%准确度、100%灵敏度和93%特异性的最佳性能。

1.4 Local and Global Information in Obstacle Detection on Railway Tracks

轨道障碍物检测中的局部信息和全局信息

https://arxiv.org/abs/2307.15478

在这里插入图片描述
铁路上可靠的障碍物检测可以帮助防止导致受伤和潜在损坏或训练的碰撞。不幸的是,通用对象检测器没有足够的类来考虑所有可能的场景,并且以铁路上的对象为特征的数据集很难获得。我们建议利用浅层网络学习铁路分割正常铁路图像。网络的有限接受域防止了过度自信的预测,并允许网络专注于铁路环境的局部非常独特和重复的模式。此外,我们通过学习幻觉无障碍图像来探索全局信息的受控包含。我们评估我们的方法在一个自定义的数据集,具有人工增强的障碍物的铁路图像。我们提出的方法优于其他基于学习的基线方法。

1.5 Implicit neural representation for change detection

用于变化检测的隐式神经表示法

https://arxiv.org/abs/2307.15428

在这里插入图片描述
由于不匹配的空间支持和采集系统噪声,检测在同一地理区域在两个不同时间采集的一对3D机载LiDAR点云中发生的变化是一项具有挑战性的任务。最近尝试检测点云的变化是基于监督的方法,这需要大量的标记数据在现实世界中的应用程序中不可用。为了解决这些问题,我们提出了一种无监督的方法,包括两个部分:用于连续形状重建的神经场(NF)和用于分类变化的高斯混合模型。NF提供了一种网格不可知的表示,以编码具有不匹配的空间支持的双时间点云,其可以被正则化以增加高频细节并减少噪声。在任意空间尺度下比较每个时间戳处的重建,导致检测能力的显著增加。我们将我们的方法应用于城市蔓延的模拟LiDAR点云的基准数据集。该数据集提供了具有不同分辨率,输入模式和噪声水平的不同挑战性场景,允许将我们的方法与当前最先进的方法进行多场景比较。我们在这个数据集上拥有以前的方法,在联合度量的交集中有10%的保证金。此外,我们将我们的方法应用于现实世界的情况下,以确定非法挖掘(抢劫)的考古遗址,并确认他们从现场专家的调查结果相匹配。

1.6 Anatomy-Aware Lymph Node Detection in Chest CT using Implicit Station Stratification

隐式站分层在胸部CT解剖感知淋巴结检测中的应用

https://arxiv.org/abs/2307.15271

在这里插入图片描述
在放射学图像中发现异常淋巴结对于诸如癌症转移分期和放射治疗计划的各种医疗任务是非常重要的。淋巴结(LN)是散布在全身的小腺体。它们根据其解剖位置被分组或定义到各种LN站。不同站点中的LN的CT成像外观和背景显著不同,这对自动化检测,特别是对病理性LN提出了挑战。出于这种观察,我们提出了一种新的端到端的框架,以提高LN检测性能,利用他们的站信息。我们设计了一个多头探测器,使每个头专注于区分某些站点的LN和非LN结构。伪站标签由LN站分类器生成,作为训练期间的多任务学习的形式,因此我们在推断期间不需要另一个显式LN站预测模型。我们的算法进行了评估82例肺癌和91例食管癌患者。所提出的隐式站分层方法在两个数据集上分别将每名患者2个假阳性的胸部淋巴结的检测灵敏度从65.1%提高到71.4%和从80.3%提高到85.5%,这显著优于各种现有的最先进的基线技术,例如nnUNet、nnDetection和LENS。

1.7 Small, but important: Traffic light proposals for detecting small traffic lights and beyond

小,但重要:用于检测小交通灯和更远的交通灯的交通灯建议

https://arxiv.org/abs/2307.15191

在这里插入图片描述
交通灯检测是自动驾驶汽车和驾驶员辅助系统背景下的一个具有挑战性的问题。虽然大多数现有的系统在大型交通灯上产生了良好的效果,但检测小型和小型交通灯往往被忽视。这里的一个关键问题是CNN中固有的下采样,导致用于检测的低分辨率特征。为了缓解这个问题,我们提出了一个新的交通灯检测系统,包括一个新的交通灯建议生成器,利用一般对象的建议生成,细粒度的多尺度功能的结果,并注意有效的处理。此外,我们设计了一个新的检测头分类和细化我们的建议。我们评估我们的系统上三个具有挑战性的,公开可用的数据集,并将其与六种方法进行比较。结果显示,小型和微型交通灯至少有12.6美元的大幅改善,以及所有大小的交通灯的强劲结果。

1.8 End-to-end Remote Sensing Change Detection of Unregistered Bi-temporal Images for Natural Disasters

自然灾害未配准双时相图像端到端遥感变化检测

https://arxiv.org/abs/2307.15128

在这里插入图片描述
基于遥感图像的变化检测是遥感领域的一个重要研究方向。深度网络在检测双时遥感图像的变化方面取得了显著的成功,并在各个领域得到了应用。在自然环境日益恶化、自然灾害频繁发生的情况下,利用遥感图像准确、快速地识别灾区受损建筑物具有重要意义。本文的目的是研究变化检测专门为自然灾害。考虑到变化检测研究中使用的现有公共数据集是注册的,这与双时间图像不匹配的实际场景不一致,本文介绍了一种未注册的端到端变化检测合成数据集,称为xBD-E2 ECD。此外,我们提出了一个端到端的变化检测网络命名为E2 ECDNet,它采取未注册的双时间图像对作为输入,并同时产生流场预测结果和变化检测预测结果。值得注意的是,我们的E2 ECDNet还支持注册图像对的变化检测,因为注册可以被视为非注册的特殊情况。此外,本文重新定义了正确预测一个积极的情况下,并引入了基于邻域的变化检测评估指标的标准。实验结果表明,显着的改善。

1.9 Detecting Morphing Attacks via Continual Incremental Training

通过连续增量训练检测变形攻击

https://arxiv.org/abs/2307.15105

在这里插入图片描述
数据传输和存储的限制限制了组成单个数据集(也利用不同的数据源)以执行基于批处理的训练过程的可能性的场景,使得鲁棒模型的开发特别具有挑战性。我们假设,最近的持续学习(CL)范式可能是一个有效的解决方案,使增量训练,甚至通过多个网站。实际上,CL的一个基本假设是,一旦模型被训练,旧数据就不能再用于连续的训练迭代,原则上可以删除。因此,在本文中,我们研究了在这种情况下不同的持续学习方法的性能,模拟了每次有新的数据块(即使是可变大小的数据块)可用时都会更新的学习模型。实验结果表明,一个特定的CL方法,即学习不忘记(LwF),是一个最好的性能算法。然后,我们研究了它在变形攻击检测和对象分类任务中的使用和参数化,特别是关于可用的新训练数据量。

二、分割|语义相关(3篇)

2.1 OAFuser: Towards Omni-Aperture Fusion for Light Field Semantic Segmentation of Road Scenes

OAFuser:面向全口径融合的道路场景光场语义分割

https://arxiv.org/abs/2307.15588

在这里插入图片描述
光场摄像机可以提供丰富的角度和空间信息,以增强图像语义分割,用于自动驾驶领域的场景理解。然而,光场摄像机广泛的角度信息包含了大量冗余数据,这对于智能汽车有限的硬件资源来说是压倒性的。此外,不适当的压缩导致信息损坏和数据丢失。为了挖掘有代表性的信息,我们提出了一个全孔径融合模型(OAFuser),它利用密集的上下文从中心视图和发现的角度信息,从子孔径图像生成一个语义一致的结果。为了避免网络传播过程中的特征丢失,同时简化光场相机的冗余信息,我们提出了一个简单而非常有效的子孔径融合模块(SAFM),以嵌入子孔径图像到角度特征,而无需任何额外的存储器成本。此外,为了解决视点间空间信息不匹配的问题,我们提出了中心角校正模块(CARM)实现了特征再排序,防止了由于信息不对称而造成的特征遮挡。我们提出的OAFuser在UrbanLF-Real和-Syn数据集上实现了最先进的性能,并在UrbanLF-Real Extended数据集上在mIoU中创造了84.93%的新记录,增益为+4.53%。OAFuser的源代码将在https://github.com/FeiBryantkit/OAFuser公开。

2.2 One-shot Joint Extraction, Registration and Segmentation of Neuroimaging Data

神经影像数据的一次联合提取、配准和分割

https://arxiv.org/abs/2307.15198

在这里插入图片描述
脑图像的提取、配准和分割是神经影像学研究中必不可少的预处理步骤。目的是从原始成像扫描中提取大脑(即,提取步骤),将其与目标脑图像(即,配准步骤)并标记解剖脑区域(即,分段步骤)。传统的研究通常集中在开发单独的方法,在监督设置中的提取,配准和分割任务。这些方法的性能在很大程度上取决于训练样本的数量和专家进行目视检查以进行纠错的程度。然而,收集体素级标签并对高维神经图像(例如,3D MRI)在许多医学研究中昂贵且耗时。在本文中,我们研究了问题的一次性联合提取,注册和分割的神经影像数据,它只利用一个标记的模板图像(又名。图谱)和一些未标记的原始图像用于训练。我们提出了一个统一的端到端的框架,称为JERS,共同优化的提取,注册和分割任务,允许他们之间的反馈。具体来说,我们使用一组提取,注册和分割模块来学习提取掩码,变换和分割掩码,其中模块通过自我监督相互连接和相互加强。在真实世界数据集上的实验结果表明,我们提出的方法在提取,配准和分割任务中表现出色。我们的代码和数据可以在https://github.com/Anonymous4545/JERS上找到

2.3 Scale-aware Test-time Click Adaptation for Pulmonary Nodule and Mass Segmentation

用于肺结节和肿块分割的尺度感知测试时间点击自适应

https://arxiv.org/abs/2307.15645

在这里插入图片描述
肺结节和肿块是肺癌筛查中的重要影像学特征,在临床诊断中需要仔细处理。尽管基于深度学习的医学图像分割取得了成功,但对各种大小的结节和肿块病变的鲁棒性能仍然具有挑战性。在本文中,我们提出了一个多尺度神经网络与规模意识的测试时间适应,以解决这一挑战。具体来说,我们引入了一个自适应的规模意识的测试时间点击适应方法的基础上毫不费力地获得病变点击测试时间线索,以提高分割性能,特别是对于大病变。所提出的方法可以无缝集成到现有的网络。在开源和内部数据集上的广泛实验一致地证明了所提出的方法在一些CNN和基于Transformer的分割方法上的有效性。我们的代码可在https://github.com/SplinterLi/SaTTCA上获得。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/836959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【福建事业单位-推理判断】03类别推理

【福建事业单位-推理判断】03类别推理 一、类别推理1.1语义关系考点一、近义反义关系(不需要严格的,意思相近即可)近义反义的二级辨析(感情色彩)考点二:比喻义、象征义 1.2 逻辑关系1.2.1全同关系&#xff…

【性能测试】性能数据采集工具nmon安装使用及报告参数含义详解

目录 nmon nmon下载 解压安装 启动 数据采集配置 生成图形结果 nmon报告中的参数含义 资料获取方法 nmon nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与分析工具,它能在系统运行过程中实时地捕捉系统资源的使用情况,并且能输出结果到文…

OJ:C++ | [vector] — 力扣

文章目录 118. 杨辉三角 - 力扣思路解: 17. 电话号码的字母组合 - 力扣思路:递归解: 137. 只出现一次的数字 II- 力扣思路:解: 118. 杨辉三角 - 力扣 题目链接:118. 杨辉三角 - 力扣(LeetCode&…

车载开发核心技术——SystemUI控制技术

SystemUI是指车载开发中的一个重要组件,它负责管理和控制车机的用户界面和交互功能。本文将详细介绍SystemUI的各项控制技术,包括音量控制、RingtonePlayer、电源管理、任务管理、通知栏和服务定制,并提供相关代码示例和解析。 一、音量控制…

【Docker】Docker容器化技术基础

Docker容器化技术 Docker(软件跨环境迁移)Docker概念:安装Dockerdocker架构配置Docker镜像加速器 一、Docker命令服务daemon相关的命令镜像相关命令Docker容器相关命令 二、Docker容器的数据卷数据卷概念配置数据卷配置数据卷容器 三、Docker…

【linux--->数据链路层协议】

文章目录 [TOC](文章目录) 一、数据链路层协议概念二、以太网帧格式1.字段分析 三、局域网通信原理四、ARP协议1.结构2.作用3.ARP通信过程4.ARP协议相关命令 五、局域网内中间人原理六、DNS系统(域名系统)1.域名概念2.DNS系统组成3.DNS协议3.浏览器输入域名后的通信过程4.dig工…

网络授权验证在线发卡系统是什么

软件授权发卡系统是一种用于对软件进行授权管理的系统。在当前数字化时代,软件授权发卡系统的应用越来越广泛,不仅可以帮助软件开发商保护自己的软件知识产权,还可以帮助用户合法使用软件,从而实现双赢的局面。 软件授权发卡系统的…

深度学习实战46-基于CNN的遥感卫星地图智能分类,模型训练与预测

大家好,我是微学AI,今天给大家介绍一下深度学习实战46-基于CNN的遥感卫星地图智能分类,模型训练与预测。随着遥感技术和卫星图像获取能力的快速发展,卫星图像分类任务成为了计算机视觉研究中一个重要的挑战。为了促进这一领域的研究进展,EuroSAT数据集应运而生。本文将详细…

设计图一般都用什么工具制作?

每个设计师都需要设计图制作软件对设计图软件的选择也有一些需求,可以提高一些效率。网上有很多免费的PC设计软件。本文推荐了2023年5款易用的设计图制作软件 1.即时设计 即时设计是一款免费的在线 UI 设计工具,无系统限制,浏览器打开即可使…

WiFi无线组网温湿度实时监测系统

近年来随着我国电子技术和无线通信技术的快速发展,远距离数据采集传输被应用到众多领域,由于事关环境安全和生命健康,受到了各行各界的关注。在温湿度监测中,目前采用的通信技术主要是4G、WiFi、以太网、LoRa等,今天&a…

新学期来临,如何快速创建分班查询系统?

离开学的时间越来越近,一些老师正为如何通知学生分班信息而感到困扰。他们意识到使用在线文档存在学生信息安全的问题,因为同学和家长在查询时可能会误操作并更改其他同学的信息。另外,如果老师们需要逐个给同学和家长打电话通知,…

激荡十三年,消费金融进入“体验争夺战”的下半场

消费金融行业又开始涌动着变局。 先是一些老玩家悬着的心,终于落地。过去两年,消费金融是蚂蚁集团整改的关键板块。前不久,蚂蚁集团被监管部门开出71.23亿元的“罚单”,市场普遍认为这是利空出尽的信号。 与此同时,竞…

PDM系统解密:数据管理的利器

在当今数字化时代,数据管理对企业的重要性不言而喻。而PDM系统作为一款强大的数字化工具,正扮演着企业数据管理的利器角色。让我们一同探索PDM系统的功能科普,了解它是如何助力企业高效管理数据,实现卓越发展的。 一、数据中心化存…

C++ 对象指针

1.对象指针的一般概念 和基本类型的变量一样,每一个对象在初始化之后都会在内存中占有一定的空间。因此,既可以通过对象名,也可以通过对象地址来访问一个对象。虽然对象同时包含了数据和函数两种成员,与一般变量略有不同&#xf…

8.4作业

用信号量的方式实现打印1234567后打印7654321循环交替打印。 #include<stdio.h> #include<string.h> #include<stdlib.h> #include<head.h> char buf[]"1234567"; sem_t sem; void *callBack1(void *arg) {int i0;int sstrlen(buf)-1;while…

Arthas常用命令之trace、watch、jad、mc

目录 一、Arthas是什么 二、Arthas能解决哪些问题 三、Arthas安装启动 3.1 环境说明 3.2 下载地址 3.3 快速使用 四、Arthas基础命令 五、Arthas查看jvm相关数据 六、Arthas搬砖过程中的常用命令 6.0 查看已加载的类信息 6.1 查看已加载类中的方法信息 6.2 反编译…

面向新能源智能汽车的新基建

一&#xff0e;什么是未来所需要的新基建&#xff1f; 二&#xff0e;如何正确认识新基建&#xff1f; 三&#xff0e;如何实现新基建有效投资/最大化新基建后期价值&#xff1f; 1、什么是面向新能源智能汽车的基础设施体系&#xff1f; 汽车电动化、智能化离不开新型基础设…

Dockerfile构建lamp镜像

1、构建目录 [rootdocker ~]# mkdir compose_lamp [rootdocker ~]# cd compose_lamp/ 2、编写Docekerfile [rootdocker compose_lamp]# vim Dockerfile #基础镜像 FROM centos:7#维护该镜像的用户信息 MAINTAINER Crushlinux <crushlinux163.com>#安装httpd RUN yum -…

企业新片场排名如何优化

企业新片场排名如何优化 要如何去做关键SEO&#xff1f;第一个我们要做的就是做好 SEO 关键词的选词&#xff0c;一般就是会有第一个常用的选词方法&#xff0c;第一是以常用的提问词去做&#xff0c;不实像是情人节买什么礼物&#xff0c;母亲节买什么礼物&#xff0c; 618 有…

c++类的继承和派生、继承和访问权限、子类的构造函数、子类型、二义性问题、多重继承、虚基类、以及常见错误

继承和派生 现实写照 父亲“派生”出儿子 儿子“继承”自父亲 派生和派生&#xff0c;本质是相同的&#xff0c;只是从不同的角度来描述。 继承和派生在UML 中的表示 注意是“空心三角箭头”&#xff0c;从子类【派生的类】指向父类【被继承的类】 父类&#xff0c;也称为“基…