【计算机视觉 | 目标检测】arxiv 计算机视觉关于分类和分割的学术速递(6月 22 日论文合集)

news2024/12/22 13:11:38

文章目录

  • 一、分类相关(4篇)
    • 1.1 Annotating Ambiguous Images: General Annotation Strategy for Image Classification with Real-World Biomedical Validation on Vertebral Fracture Diagnosis
    • 1.2 Benchmark data to study the influence of pre-training on explanation performance in MR image classification
    • 1.3 Generalizable Metric Network for Cross-domain Person Re-identification
    • 1.4 Pre-Pruning and Gradient-Dropping Improve Differentially Private Image Classification
  • 二、分割|语义相关(6篇)
    • 2.1 Joint Dense-Point Representation for Contour-Aware Graph Segmentation
    • 2.2 Online Unsupervised Video Object Segmentation via Contrastive Motion Clustering!
    • 2.3 Using super-resolution for enhancing visual perception and segmentation performance in veterinary cytology
    • 2.4 Few-Shot Rotation-Invariant Aerial Image Semantic Segmentation
    • 2.5 Lumbar spine segmentation in MR images: a dataset and a public benchmark
    • 2.6 DIAS: A Comprehensive Benchmark for DSA-sequence Intracranial Artery Segmentation

一、分类相关(4篇)

1.1 Annotating Ambiguous Images: General Annotation Strategy for Image Classification with Real-World Biomedical Validation on Vertebral Fracture Diagnosis

模糊图像标注:脊椎骨折诊断生物医学验证图像分类的通用标注策略

论文地址:

https://arxiv.org/abs/2306.12189

在这里插入图片描述
虽然存在许多方法来解决策展数据集内的分类问题,但由于数据的偏见或模糊性,这些解决方案在生物医学应用中往往不足。当从脊椎数据推断身高减少时,这些困难尤其明显,临床公认的Genant评分的关键组成部分。虽然半监督学习、建议使用和类混合等策略可能会提供一些解决方案,但清晰和优越的解决方案仍然难以捉摸。本文介绍了解决这些问题的一般策略的流程图。我们通过构建具有超过300,000个注释的脊椎骨折数据集来演示这种策略的应用。这项工作有利于过渡到临床有意义的分数的分类问题,并丰富了我们的理解椎体高度降低。

1.2 Benchmark data to study the influence of pre-training on explanation performance in MR image classification

用于研究预训练对磁共振图像分类解释性能影响的基准数据

论文地址:

https://arxiv.org/abs/2306.12150

在这里插入图片描述
卷积神经网络(CNN)经常并且成功地用于医学预测任务。它们通常与迁移学习结合使用,从而在任务的训练数据稀缺时提高性能。由此产生的模型非常复杂,通常无法提供对其预测机制的任何见解,从而激发了“可解释”人工智能(XAI)领域。然而,以往的研究很少定量评估XAI方法的“解释性能”对地面真实数据,迁移学习及其对解释性能的客观措施的影响尚未进行调查。在这里,我们提出了一个基准数据集,允许量化的解释性能在现实的磁共振成像(MRI)分类任务。我们采用这个基准来了解迁移学习对解释质量的影响。实验结果表明,流行的XAI方法应用于相同的底层模型的性能差异很大,即使只考虑正确分类的例子。我们进一步观察到,解释性能强烈依赖于用于预训练的任务和预训练的CNN层的数量。这些结果在纠正解释和分类性能之间的实质性相关性后成立。

1.3 Generalizable Metric Network for Cross-domain Person Re-identification

用于跨域人员再识别的泛化度量网络

论文地址:

https://arxiv.org/abs/2306.11991

在这里插入图片描述
人员重新识别 (Re-ID) 是公共安全的一项关键技术,并且在监督环境中取得了重大进展。 然而,由于看不见的测试域以及训练集和测试集之间的域转移,跨域(即域泛化)场景在 Re-ID 任务中提出了挑战。 为了应对这一挑战,大多数现有方法旨在为所有领域学习领域不变或稳健的特征。 在本文中,我们观察到样本对空间中训练集和测试集之间的数据分布差距小于样本实例空间中的数据分布差距。 基于这一观察,我们提出了一个通用度量网络(GMN)来进一步探索样本对空间中的样本相似性。 具体来说,我们在主网络之后添加一个度量网络(M-Net),并对其正负样本对特征进行训练,然后在测试阶段使用。 此外,我们引入了基于 Dropout 的扰动(DP)模块,通过丰富样本对多样性来增强度量网络的泛化能力。 此外,我们开发了配对身份中心(PIC)损失,通过确保具有相同配对身份的样本对特征一致来增强模型的辨别力。 我们通过在多个基准数据集上进行大量实验来验证我们提出的方法的有效性,并确认我们的 GMN 中每个模块的价值。

1.4 Pre-Pruning and Gradient-Dropping Improve Differentially Private Image Classification

预剪枝和梯度下降改进差异化私有图像分类

论文地址:

https://arxiv.org/abs/2306.11754

在这里插入图片描述
当应用差分隐私来训练深度神经网络时,可扩展性是一个重大挑战。 常用的 DP-SGD 算法难以保持高水平的隐私保护,同时在中等大小的模型上实现高精度。 为了应对这一挑战,我们利用了神经网络过度参数化这一事实,这使我们能够改进具有差异隐私的神经网络训练。 具体来说,我们引入了一种新的训练范式,它使用 \textit{pre-pruning} 和 \textit{gradient-dropping} 来减少参数空间并提高可扩展性。 该过程首先预修剪原始网络的参数以获得较小的模型,然后使用 DP-SGD 进行训练。 在训练过程中,不太重要的梯度会被丢弃,并且仅更新选定的梯度。 我们的训练范式引入了预剪枝率和梯度下降率、隐私损失和分类准确性之间的紧张关系。 过多的预剪枝和梯度下降会降低模型的容量并降低准确性,而训练较小的模型需要较少的隐私预算才能获得良好的准确性。 我们评估了这些因素之间的相互作用,并证明了我们的训练范式在几个基准图像分类数据集上从头开始训练和微调预训练网络的有效性。 这些工具还可以轻松地融入现有的培训范例中。

二、分割|语义相关(6篇)

2.1 Joint Dense-Point Representation for Contour-Aware Graph Segmentation

轮廓感知图分割的联合密点表示法

论文地址:

https://arxiv.org/abs/2306.12155

在这里插入图片描述

我们提出了一种新的方法,结合图形和密集的分割技术,共同学习点和像素轮廓表示,从而利用每种方法的好处。这解决了典型图分割方法中的缺陷,其中未对准的目标限制网络学习有区别的顶点和轮廓特征。我们的联合学习策略允许对丰富多样的语义特征进行编码,同时缓解基于密度的方法中常见的轮廓稳定性问题,其中像素级目标可能导致解剖学上难以置信的拓扑结构。此外,我们确定的情况下,正确的预测落在轮廓边界受到惩罚,并解决这个新的混合轮廓距离损失。我们的方法在几个胸部X射线数据集上进行了验证,证明了对各种密集和基于点的方法的分割稳定性和准确性的明显改善。我们的源代码可在以下网址免费获得:www.github.com/kitbransby/Joint_Graph_Segmentation

2.2 Online Unsupervised Video Object Segmentation via Contrastive Motion Clustering!

基于对比运动聚类的在线无监督视频对象分割

论文地址:

https://arxiv.org/abs/2306.12048

在这里插入图片描述
在线无监督视频对象分割(UVOS)使用先前帧作为其输入以自动地从流式视频分离主要对象,而不使用任何进一步的手动注释。一个主要的挑战是模型无法访问未来,必须完全依赖于历史,即,一旦捕获到当前帧,就从当前帧预测分割掩模。在这项工作中,提出了一种新的对比运动聚类算法的光流作为其输入的在线UVOS通过利用共同的命运的原则,视觉元素往往被视为一个群体,如果他们拥有相同的运动模式。我们建立了一个简单有效的自动编码器来迭代总结不可学习的原型基地的运动模式,而基地反过来帮助学习的嵌入式网络的表示。此外,一个基于边界先验的对比学习策略的发展,以提高前景和背景特征的歧视,在表示学习阶段。所提出的算法可以在任意尺度的数据上进行优化,帧、剪辑、数据集)并以在线方式执行。在 DAVIS 16 \textit{DAVIS}_{\textit{16}} DAVIS16 FBMS \textit{FBMS} FBMS SegTrackV   2 \textit{SegTrackV 2} SegTrackV 2数据集上的实验表明,我们的方法的准确性分别超过了以前的最先进的在线UVOS方法0.8%,2.9%和1.1%。此外,通过使用在线深度子空间聚类来处理运动分组,与SoTA在线UVOS方法相比,我们的方法能够以 3 × 3\times 3×更快的推理时间实现更高的准确性,并在有效性和效率之间进行了良好的权衡。

2.3 Using super-resolution for enhancing visual perception and segmentation performance in veterinary cytology

利用超分辨率增强兽医细胞学中的视觉感知和分割性能

论文地址:

https://arxiv.org/abs/2306.11848

在这里插入图片描述
本研究的主要目的是通过结合超分辨率(SR)架构来提高细胞学图像的语义分割质量。另一个贡献是开发了一个新的数据集,旨在提高成像质量的存在不准确的焦点。我们的实验结果表明,SR技术集成到分割流水线可以导致一个显着的改善高达25%的平均精度(mAP)分割度量。这些发现表明,利用SR架构对于推进细胞学图像分析的最新技术水平具有很大的希望。

2.4 Few-Shot Rotation-Invariant Aerial Image Semantic Segmentation

Few-Shot旋转不变航拍图像语义分割

论文地址:

https://arxiv.org/abs/2306.11734

在这里插入图片描述
Few-Shot航拍图像分割是一项具有挑战性的任务,涉及精确解析查询航拍图像中的对象,具有有限的注释支持。传统的匹配方法,而不考虑不同的对象取向可能无法激活具有不同取向的同类对象。此外,常规算法可能导致对得分较低的旋转语义对象的错误识别。为了应对这些挑战,作者提出了一种新的Few-Shot旋转不变的空中语义分割网络(FRINet)。FRINet匹配每个查询功能旋转自适应与方向变化,但类别一致的支持信息。来自不同方向的分割预测由相同的标签监督,并且主干在基本类别中进行预训练以提高分割性能。实验结果表明,FRINet达到国家的最先进的性能在Few-Shot的空中语义分割基准。

2.5 Lumbar spine segmentation in MR images: a dataset and a public benchmark

磁共振图像中的腰椎分割:一个数据集和一个公共基准

论文地址:

https://arxiv.org/abs/2306.12217

在这里插入图片描述
本文提出了一个大的公开可用的多中心腰椎磁共振成像(MRI)数据集与参考分段的椎骨,椎间盘(IVD),和椎管。该数据集包括来自218名有腰痛病史的患者的447个矢状位T1和T2 MRI系列。它是从四个不同的医院收集的,并被分为培训(179名患者)和验证(39名患者)集。通过在数据集的一小部分上训练分割算法来使用迭代数据注释方法,从而实现剩余图像的半自动分割。该算法提供了初始分割,随后对其进行审查、手动校正并添加到训练数据中。我们为这个基线算法和nnU-Net提供了参考性能值,它们的性能相当。我们设置了一个连续的分割挑战,以允许不同的分割算法的公平比较。本研究可促进脊柱分割领域更广泛的合作,并提高腰椎MRI的诊断价值。

2.6 DIAS: A Comprehensive Benchmark for DSA-sequence Intracranial Artery Segmentation

DIAS:DSA序列颅内动脉分割的综合基准

论文地址:

https://arxiv.org/abs/2306.12153

在这里插入图片描述
数字减影血管造影(DSA)序列中颅内动脉(IA)的自动分割是诊断IA相关疾病和指导神经介入手术的重要步骤。然而,缺乏公开的数据集阻碍了这一领域的研究。在本文中,我们发布了DIAS,IA分割数据集,由来自颅内介入治疗的120个DSA序列组成。除了像素级注释外,该数据集还为弱监督IA分割研究提供了两种类型的涂鸦注释。我们提出了一个全面的基准评估这个具有挑战性的数据集的性能,利用完全,弱,半监督学习方法。具体而言,我们提出了一种方法,将降维模块纳入2D/3D模型,以实现DSA序列中的血管分割。对于弱监督学习,我们提出了一个基于涂鸦学习的图像分割框架,SSCR,它包括涂鸦监督和一致性正则化。此外,我们引入了一个随机补丁为基础的自我训练框架,利用未标记的DSA序列,以提高分割性能。我们在DIAS数据集上的广泛实验证明了这些方法作为未来研究和临床应用的潜在基线的有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/674882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无需专业知识!学会用TensorFlow 2实现天气识别的秘诀

💡《目标识别100例》使用的是Python语言、TensorFlow框架,包含了几十种CNN算法案例💎 附有 🖥 源码 ,可一键运行,避免调试烦恼🏆 课程大作业、毕业论文可直接考借鉴🎈 同时 附带各种算法原理及对应的代码教程,用户可根据自身情况快速排列组合,在不同的数据集上实…

从零开始:入门双目视觉你需要了解的知识

文章目录 前言 双目相机标定去畸变极线校正(立体校正)立体匹配深度图生成文章已经同步更新在3D视觉工坊啦,原文链接如下: 前言 双目立体视觉是计算机视觉中的一个重要领域,它利用两个相机拍摄同一场景的不同视角的图像…

HDLBits笔记5:Circuits.Combinational Logic.Basic gates

Wire 实现一个电路完成in和out的连线 module top_module (input in, output out);assign out in; endmoduleGND 实现一个电路将out连到GND module top_module (output out);assign out 1b0; endmoduleNOR 实现或非门 module top_module (input in1,input in2,output ou…

Vue-消息订阅与发布(pub/sub)

消息订阅与发布(pub/sub) 消息订阅与发布和全局事件总线一样,也是一种组件间通信的方式 pub/sub全称为publisher(订阅)/subscriber(发布),一般需要数据的人订阅消息,提供数据的人发布消息 这个技术非常简单容易上手,主要有以下两步 1 订阅…

Java集合之ArrayList详解

Java集合之ArrayList 一、ArrayList类的继承关系1. 基类功能说明1.1. Iterator:提供了一种方便、安全、高效的遍历方式。1.2. Collection:为了使ArrayList具有集合的基本特性和操作。1.3. AbstractCollection:提供了一些通用的集合操作。1.4.…

Vue-动画效果

vue动画效果 vue中动画效果是很简单的一个东西,vue帮助我们做了一些动画封装,同时也支持自定义动画,过度,第三方库,这些方式都可以实现,我们一一举例说明 注意:下面的相关截图,由于…

55 KVM工具使用指南-LibcarePlus概述

文章目录 55 KVM工具使用指南-LibcarePlus概述55.1 概述55.2 软硬件要求55.3 注意事项和约束 55 KVM工具使用指南-LibcarePlus概述 55.1 概述 LibcarePlus 是一个用户态进程热补丁框架,可以在不重启进程的情况下对 Linux 系统上运行的目标进程进行热补丁操作。热补…

语音合成 - TTS-VUE 学习

今天给小伙伴测试了一款人工智能文字合成语音的工具,测试中发现应该是某位大神开发的开源工具,经过一下午的测试,发现有可学习之处,有兴趣的小伙伴可以一起来学习下。 一、简单介绍 微软的语音合成助手利用强大的微软AI语音库&am…

牛云企业官网小程序,外卖cps权益变现,uniCloud云开发无需购买服务器和域名,助力每一位创业者。

技术优势 基于 uniapp uniCloud 研发,无需购买服务器和域名,uniCloud 是 DCloud 联合阿里云、腾讯云 serverless 构建。从此不用关心服务器运维、弹性扩容、大并发承载、防DDoS攻击等,轻松应对高并发应用, 上图 小程序页面 体…

一种新颖的智能优化算法-蝠鲼优化算法(MRFO)

目录 一、MRFO数学模型 1.1 链式觅食 1.2 旋风式觅食 1.3 翻筋斗式觅食 二、MRFO伪代码 2019年提出一种新的仿生优化技术称为魔鬼鱼觅食优化算法,旨在提供一种替代优化 解决实际工程问题的方法。该算法的灵感是基于智能算法魔鬼鱼的行为。这项工作模拟了魔鬼…

轻量应用服务器性能如何?CPU带宽流量系统盘测评

轻量应用服务器性能如何?腾讯云轻量应用服务器是一种轻量级搭建小型网站和应用的服务器,相对于其他更高性能配置的服务器CVM,性价比更高。虽然其性能不如高性能云服务器CVM,但对于小型网站和应用来说,能够提供基本的计…

JDK1.8 lambda_函数式编程_stream流

一、 lambda表达式 jdk 1.8 引入了 lambda表达式 能够我们 编写代码时更加简洁,也为函数式编程提供了支持 lambda表达式 作用 简化匿名实现类的书写,实现接口抽象方法; (参数类型 参数名1,参数类型 参数名2,……参数类型 参数名n)->{ //方法体 } …

【工具】搜狗输入法常用配置(持续更新)

▒ 目录 ▒ 🛫 问题描述环境 1️⃣ 按键相关通用快捷键系统快捷键辅助输入快捷键 2️⃣ 其它自定义语句关闭自动更新 🛬 结论 🛫 问题 描述 作为输入法的常青树,重装系统后经常第一步就是装输入法,由于以下原因&#…

开发框架前后端分离的好处是什么

关于将前端和后端保持在一起或分开,存在广泛的意见分歧。唯一重要的是,这两个组件对于开发成熟的应用程序都是必需的。 考虑:紧密耦合的前端和后端 许多人认为后端和前端的分离是一个坏主意,这两个角色之间没有太大区别。 以下…

多旋翼无人机振动分析与减振方法

多旋翼无人机振动分析与减振方法 振动分析无人机减振设计机械减振数字滤波减振 振动分析 振动机制包括: 激励(振动源)系统响应 无人机振动机制: 激励 —— 动力系统(旋翼电机)系统 —— 机架响应 —— …

《产品思维》 要点

“一切以用户价值为依归”的价值观,落地下来就是从用户中来,到用户中去。 认知用户 用户画像 用户是一切产品的源头 用户不是理性人 我们的用户到底是谁、究 竟在哪里。这个“到底是谁”“究竟在哪里”。 用户生活工作的环境,是他们日常的…

【机器学习】机器故障的二元分类模型-Kaggle竞赛

竞赛介绍 数据集描述 本次竞赛的数据集(训练和测试)是从根据机器故障预测训练的深度学习模型生成的。特征分布与原始分布接近,但不完全相同。随意使用原始数据集作为本次竞赛的一部分,既可以探索差异,也可以了解在训…

[RockertMQ] Broker启动加载消息文件以及恢复数据源码 (三)

Broker的启动过程中, 在DefaultMessageStore实例化后, 会调用load方法将磁盘中的commitLog、ConsumeQueue、IndexFile文件的数据加载到内存中, 还有数据恢复的操作。 调用isTempFileExist方法判断上次broker是否是正常退出, 如果是正常退出不会保留abort文件, 异常退出则会。 …

【MySQL】关于自增id、雪花id还是uuid作为MySQL主键

在MySQL中设计表的时候,MySQL官方推荐不要使用uuid或者不连续不重复的雪花id(long型且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment。那么为什么不使用雪花id或者uuid呢?让我们来探讨分析一下这个问题的原因。 关于…

【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)

零基础带你进军人工智能领域的全流程技术体系和实战指南(机器学习基础知识) 前言专栏介绍专栏说明学习大纲前提条件面向读者学习目标核心内容机器学习的概念定义回顾人工智能机器学习概念国外知名学者对机器学习的定义中文翻译 机器学习发展历程机器学习…