【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(7 月 26 日论文合集)

news2024/11/17 5:54:37

文章目录

  • 一、分割|语义相关(7篇)
    • 1.1 Learning Transferable Object-Centric Diffeomorphic Transformations for Data Augmentation in Medical Image Segmentation
    • 1.2 Optical Flow boosts Unsupervised Localization and Segmentation
    • 1.3 Spectrum-guided Multi-granularity Referring Video Object Segmentation
    • 1.4 Unmasking Anomalies in Road-Scene Segmentation
    • 1.5 GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers
    • 1.6 Image Segmentation Keras : Implementation of Segnet, FCN, UNet, PSPNet and other models in Keras
    • 1.7 Towards Unifying Anatomy Segmentation: Automated Generation of a Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines

一、分割|语义相关(7篇)

1.1 Learning Transferable Object-Centric Diffeomorphic Transformations for Data Augmentation in Medical Image Segmentation

用于医学图像分割数据增强的可转移对象中心微分变换学习

https://arxiv.org/abs/2307.13645

在这里插入图片描述
由于需要专家进行像素级注释,因此在医学图像分割中获得标记数据具有挑战性。最近的工作已经表明,用可变形变换增强感兴趣的对象可以帮助减轻这一挑战。然而,这些变换已经被全局地学习用于图像,限制了它们在数据集之间的可转移性或在图像对准困难的问题中的适用性。虽然以对象为中心的增强提供了一个很好的机会来克服这些问题,现有的作品只集中在位置和随机变换,而不考虑对象的形状变化。为此,我们提出了一种新的以对象为中心的数据增强模型,能够学习感兴趣的对象的形状变化,并在不修改图像的其余部分的情况下增强对象。我们证明了它在改善肾脏肿瘤分割时,利用从同一数据集内学习的形状变化和从外部数据集转移。

1.2 Optical Flow boosts Unsupervised Localization and Segmentation

光流增强无监督定位和分割

https://arxiv.org/abs/2307.13640

在这里插入图片描述
无监督定位和分割是长期存在的机器人视觉挑战,描述了自主机器人学习将图像分解为没有标记数据的单个对象的关键能力。这些任务是重要的,因为有限的可用性密集的图像手动注释和有前途的愿景,适应不断变化的一组对象类别在终身学习。最近的方法集中在使用视觉外观的连续性作为对象线索的空间聚类功能获得自监督Vision Transformers(ViT)。在这项工作中,我们利用运动线索,灵感来自共同的命运原则,共享类似的运动的像素往往属于同一个对象。我们提出了一个新的损失项公式,使用光流在未标记的视频,鼓励自我监督的ViT功能变得更接近对方,如果他们相应的空间位置共享类似的运动,反之亦然。我们使用所提出的损失函数来微调最初在静态图像上训练的Vision Transformers。我们的微调过程优于最先进的技术,通过线性探测无监督语义分割,而不使用任何标记的数据。该过程还证明了在无监督对象定位和语义分割基准上,原始ViT网络的性能有所提高。

1.3 Spectrum-guided Multi-granularity Referring Video Object Segmentation

基于频谱制导的多粒度参考视频对象分割

https://arxiv.org/abs/2307.13537

在这里插入图片描述
当前的参考视频对象分割(R-VOS)技术从编码的(低分辨率)视觉语言特征提取条件核以分割解码的高分辨率特征。我们发现,这会导致显著的特征漂移,分割内核在前向计算期间难以感知。这对分割核的能力产生负面影响。为了解决漂移问题,我们提出了一个频谱引导的多粒度(SgMg)的方法,该方法对编码的功能进行直接分割,并采用视觉细节,以进一步优化掩模。此外,我们提出了光谱引导的跨模态融合(SCF)执行帧内的全球交互在光谱域有效的多模态表示。最后,我们扩展SgMg执行多对象R-VOS,一个新的范例,使视频中的多个参考对象的同时分割。这不仅使R-VOS更快,而且更实用。大量的实验表明,SgMg在四个视频基准数据集上实现了最先进的性能,在Ref-YouTube-VOS上的表现超过了最接近的竞争对手2.8%。我们的扩展SgMg使多对象R-VOS,运行速度约3倍,同时保持令人满意的性能。代码可在https://github.com/bo-miao/SgMg上获得。

1.4 Unmasking Anomalies in Road-Scene Segmentation

道路场景分割中的去掩蔽异常

https://arxiv.org/abs/2307.13316

在这里插入图片描述
异常分割是驱动应用程序的一项关键任务,传统上将其视为逐像素分类问题。然而,在不考虑其上下文语义的情况下单独地推理每个像素会导致对象边界周围的高度不确定性和许多误报。我们提出了一个范式的变化,从每像素分类转移到掩模分类。我们的面具为基础的方法,Mask 2Anomaly,证明了在一个面具分类架构的异常检测方法集成的可行性。Mask 2Anomaly包括几项旨在改善掩模异常检测的技术创新:i)全局掩蔽注意力模块,用于单独地聚焦在前景和背景区域上; ii)最大化异常和已知类别之间的裕度的掩模对比学习;以及iii)用于减少假阳性的掩模细化解决方案。Mask 2Anomaly在一系列基准测试中获得了新的最先进的结果,包括每像素和组件级评估。特别是,Mask 2Anomaly将平均误报率降低了60%。Github页面:https://github.com/shyam671/Mask2Anomaly-Unmasking-Anomalies-in-Road-Scene-Segmentation。

1.5 GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers

GaPro:基于高斯过程的盒式监督三维点云实例分割

https://arxiv.org/abs/2307.13251

在这里插入图片描述
3D点云(3DIS)上的实例分割是计算机视觉中的一个长期挑战,其中最先进的方法主要基于完全监督。由于注释地面实况密集实例掩码是繁琐且昂贵的,解决具有弱监督的3DIS变得更加实际。在本文中,我们提出了GaPro,一个新的实例分割三维点云使用轴对齐的三维包围盒监督。我们的两步方法涉及从框注释生成伪标签,并使用所得标签训练3DIS网络。此外,我们采用自我训练策略,以进一步提高我们的方法的性能。我们设计了一个有效的高斯过程,从边界框生成伪实例掩码,并在它们重叠时解决歧义,从而产生具有不确定性值的伪实例掩码。我们的实验表明,GaPro优于以前的弱监督3D实例分割方法,并具有竞争力的性能相比,最先进的完全监督的。此外,我们证明了我们的方法的鲁棒性,我们可以通过使用我们的伪标签进行训练,使各种最先进的完全监督方法适应弱监督任务。源代码和训练模型可在https://github.com/VinAIResearch/GaPro获得。

1.6 Image Segmentation Keras : Implementation of Segnet, FCN, UNet, PSPNet and other models in Keras

图像分割KERAS:SegNet、FCN、UNET、PSPNet等模型在KERS中的实现

https://arxiv.org/abs/2307.13215

在这里插入图片描述
语义分割在计算机视觉任务中起着至关重要的作用,可以对图像进行精确的像素级理解。在本文中,我们提出了一个全面的语义分割库,其中包含流行的分割模型,如SegNet,FCN,UNet和PSPNet的实现。我们还在多个数据集上评估和比较了这些模型,为研究人员和从业人员提供了一个强大的工具集来应对各种分割挑战。

1.7 Towards Unifying Anatomy Segmentation: Automated Generation of a Full-body CT Dataset via Knowledge Aggregation and Anatomical Guidelines

走向统一的解剖分割:通过知识聚合和解剖学指南自动生成全身CT数据集

https://arxiv.org/abs/2307.13375

在这里插入图片描述
在这项研究中,我们提出了一种用于生成自动解剖分割数据集的方法,使用一个顺序过程,涉及nnU-Net为基础的伪标签和解剖引导的伪标签细化。通过结合各种碎片化的知识库,我们生成了一个数据集的全身CT扫描与142 $体素级标签为533卷提供全面的解剖覆盖,专家已经批准。我们提出的程序不依赖于人工注释在标签聚合阶段。我们使用三个补充检查来检查其合理性和有用性:人类专家评估批准了数据集,BTCV数据集上的深度学习有用性基准,其中我们在不使用其训练数据集的情况下获得了85%的骰子分数,以及医疗有效性检查。该评估程序将可扩展的自动化检查与劳动密集型的高质量专家检查相结合。除了数据集之外,我们还发布了经过训练的统一解剖分割模型,能够预测CT数据上的142 $解剖结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/807361.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

latex论文----写作代码

一般来说论文机构会给定latex模板代码,我们只需要知道怎么写就行,格式机构都给你调好了 1 各类标题 section是最大的标题,后边每一级小标题,都在前边加个sub就行 \section{Method} \subsection{Dataset} \subsubsection{Dataset…

2014年全国硕士研究生入学统一考试管理类专业学位联考写作试题——解析版

2014年1月真题: 四、写作:第56~57小题,共65分。其中论证有效性分析30 分,论说文35分。 56.论证有效性分析: 分析下述论证中存在的缺陷和漏洞,选择若干要点,写一篇600字左右的文章,对该论证的有效性进行分析和评论。…

error: cannot call member function ‘void me::sendMessage()‘ without object

error: cannot call member function void me::sendMessage&#xff08;&#xff09; without object 原因分析解决方案 原因分析 在connect中&#xff0c;传递函数地址不用带括号。&#xff08;参考函数指针的赋值&#xff09; #include <iostream> // 包含头…

redis线程模型

文章目录 一、redis单线程模型1.1 为什么redis命令处理是单线程&#xff0c;而不采用多线程1.2 单线程的局限及redis的优化方式 二、redis单线程为什么这么快2.1 采用的机制2.2 优化的措施 三、redis的IO多线程模型3.1 redis 为什么引入IO多线程模型3.2 配置io-threads-do-read…

安全测试国家标准解读——数据库管理和文件管理

下面的系列文章主要围绕《GB/T 38674—2020 信息安全技术 应用软件安全编程指南》进行讲解&#xff0c;该标准是2020年4月28日&#xff0c;由国家市场监督管理总局、国家标准化管理委员会发布&#xff0c;2020年11月01日开始实施。我们对该标准中一些常见的漏洞进行了梳理&…

SQL-每日一题【1045.买下所有产品的客户】

题目 Customer 表&#xff1a; Product 表&#xff1a; 写一条 SQL 查询语句&#xff0c;从 Customer 表中查询购买了 Product 表中所有产品的客户的 id。 示例&#xff1a; 解题思路 1.题目要求我们 从 Customer 表中查询购买了 Product 表中所有产品的客户的 id。我们可以先…

Memcached服务分布式集群如何实现?

Memcached服务分布式集群如何实现? 在分布式系统中&#xff0c;为了提高可用性、性能和扩展性&#xff0c;通常会使用多台服务器来构建一个Memcached集群。Memcached是一个高性能的分布式内存缓存系统&#xff0c;可以用于缓存数据以减轻数据库或其他后端存储的负载。 以下我们…

网络防御之防病毒网关

1. 什么是恶意软件&#xff1f; 恶意软件是任何软件故意设计造成损害计算机、服务器、客户端或计算机网络&#xff08;相比之下&#xff0c;软件导致无意的伤害由于一些缺陷通常被描述为一个软件错误&#xff09;。各种各样的类型的恶意软件存在的&#xff0c;包括计算机病毒、…

一次性彻底讲透Python中pd.concat与pd.merge

目录 数据拼接&#xff1a;pd.concat数据关联:pd.merge两者区别 数据的合并与关联是数据处理过程中经常遇到的问题&#xff0c;在SQL、HQL中大家可能都有用到 join、uion all 等 &#xff0c;在 Pandas 中也有同样的功能&#xff0c;来满足数据处理需求&#xff0c;个人感觉 …

感谢@中原一点红提供的华为OD机试真题2023Q1 100分“座位调整”,一看nike标志,就稳了

目录 专栏导读一、鸣谢二、题目描述三、输入描述四、输出描述五、思路分析解题思路 六、Java算法源码七、效果展示1、输入2、输出 华为OD机试 2023B卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&#xff08;A卷…

【动态规划part12】| 309.买卖股票的最佳时机含冷冻期、714.买卖股票的最佳时机含手续费

目录 &#x1f388;LeetCode309.最佳买卖股票时机含冷冻期 &#x1f388;LeetCode714.买卖股票的最佳时机含手续费 &#x1f388;LeetCode309.最佳买卖股票时机含冷冻期 给定一个整数数组prices&#xff0c;其中第 prices[i] 表示第 i 天的股票价格 。​ 设计一个算法计…

【Mysql】万字长文带你快速掌握数据库基础概念及SQL基本操作

文章目录 前言一、数据库相关概念1. 什么是数据库2. 数据库的种类3. Mysql 简介4. SQL简介5. 数据库中常见的数据类型 二、SQL基础1. SQL通用语法2. SQL的主要分类3. DDL&#xff08;数据库&#xff0c;表&#xff0c;索引&#xff0c;视图&#xff09;4. DML&#xff08;数据的…

无涯教程-jQuery - Explode方法函数

爆炸效果可以与show/hide/toggle一起使用。这会将元素爆炸或分解为许多碎片。 Explode - 语法 selector.hide|show|toggle( "explode", {arguments}, speed ); 这是所有参数的描述- pieces - exploded/imploded次数。model - 动画的模式。可以设置为"…

需求分析案例:消息配置中心

本文介绍了一个很常见的消息推送需求&#xff0c;在系统需要短信、微信、邮件之类的消息推送时&#xff0c;边界如何划分和如何设计技术方案。 1、需求 一个系统&#xff0c;一般会区分多个业务模块&#xff0c;并拆分成不同的业务系统&#xff0c;例如一个商城的架构如下&am…

FreeRTOS之计数型信号量

什么是计数型信号量&#xff1f; 计数型信号量相当于队列长度大于1 的队列&#xff0c;因此计数型信号量能够容纳多个资源&#xff0c;这在计数型 信号量被创建的时候确定的。 计数型信号量相关 API SemaphoreHandle_t xSemaphoreCreateCounting( UBaseType_t uxMaxCount, U…

iOS开发-下拉刷新动画CAShapeLayer的strokeStart与strokeEnd指示器动画效果

iOS开发-下拉刷新动画CAShapeLayer的strokeStart与strokeEnd刷新指示器效果 之前开发中实现下拉刷新动画CAShapeLayer的strokeStart与strokeEnd指示器动画效果 一、效果图 二、基础动画 CABasicAnimation类的使用方式就是基本的关键帧动画。 所谓关键帧动画&#xff0c;就是…

Determinantal Point Process:机器学习中行列式的妙用

©PaperWeekly 原创 作者 | Yunpeng Tai 主页 | https://yunpengtai.top/ 在机器学习中&#xff0c;我们通常会面临一个问题&#xff1a;给定一个集合 &#xff0c;从中寻找 个样本构成子集 &#xff0c;尽量使得子集的质量高同时多样性好。比如在推荐系统中&#xff0c;…

AI绘画StableDiffusion实操教程:可爱头像奶茶小女孩(附高清图片)

本教程收集于&#xff1a;AIGC从入门到精通教程汇总 今天继续分享AI绘画实操教程&#xff0c;如何用lora包生成超可爱头像奶茶小女孩 放大高清图已放到教程包内&#xff0c;需要的可以自取。 欢迎来到我们这篇特别的文章——《AI绘画StableDiffusion实操教程&#xff1a;可爱…

element 时间插件 placement 报错

只需一个简单配置一下 align"center" 就不会再报错了&#xff0c;不需要升级element的版本

Vue 常用指令 v-on 自定义参数,事件修饰符

自定义参数就是可以在触发事件的时候传入自定义的值。 文本框&#xff0c;绑定了一个按钮事件&#xff0c;对应的逻辑是sayhi&#xff0c;现在无论按下什么按钮都会触发这个sayhi。但是实际上不是所有的按钮都会触发&#xff0c;只会限定某一些按钮&#xff0c;最常见的按钮就…