【论文速递】IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割

news2024/10/5 4:08:26

【论文速递】IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割

【论文原文】:CRCNet: Few-shot Segmentation with Cross-Reference and Region-Global Conditional Networks

获取地址:https://link.springer.com/article/10.1007/s11263-022-01677-7

博主关键词: 小样本学习,语义分割,孪生网络

推荐相关论文:

- 无

摘要:

小样本分割的目的是学习一种只需要少量训练图像就可以推广到新类的分割模型。在本文中,我们提出了一种用于小样本分割的交叉参考和局部全局条件网络(CRCNet)。与以往只预测查询图像掩码的工作不同,我们提出的模型同时对支持图像和查询图像进行预测。 我们的网络通过交叉引用机制可以更好地找到两幅图像中同时出现的物体,从而帮助完成小样本分割任务。为了进一步改进特征比较,我们开发了一个局部-全局条件模块来捕获全局和局部关系。此外,我们还开发了掩码优化模块,对前景区域进行循环优化预测。在PASCAL VOC 2012、MS COCO和FSS-1000数据集上的实验表明,我们的网络达到了最新的性能。

关键词 -小样本学习,图像分割。

简介:

自ImageNet分类挑战[8]取得巨大成功以来,深度神经网络已广泛应用于视觉理解任务,如图像分类[14,22]、目标检测[43]、语义分割[26]和图像字幕。由于大规模标记数据集的数据驱动特性,经常需要训练深度模型。然而,在具有像素级注释的任务(如语义分割、实例分割和视频分割)中,收集标记数据可能是非常昂贵的。此外,数据收集通常是针对一组特定的类别。以前课上学到的知识很难直接转移到看不见的课上。直接微调训练模型仍然需要大量新的标记数据。另一方面,为了解决这一问题,提出了小样本学习。本文的目标是少量图像分割。小样本分割的目的是寻找类别的前景区域与提供的支持图像相同,只看到少数标记的例子。

许多文献[9,24,62,63]将小样本分割任务表述为引导分割任务。引导信息从查询图像中前景预测的标记支持集中提取,通常采用不对称的双分支网络结构实现。以查询真值掩码为监督,对模型进行优化。但是,这种不对称结构只是利用支持图像来引导查询图像,并没有充分利用支持图像和查询图像信息。我们的工作认为,查询集和支持集的角色可以在小样本分割模型中切换。 具体来说,支持图像可以指导查询集的预测,相反,查询图像也可以帮助对支持集进行预测。受图像共分割文献[3,12,20,39,51]的启发,我们提出了一个对称的交叉参考网络,两个头部同时对查询图像和支持图像进行预测。 网络设计与以往作品的差异如图1所示。我们的网络设计的关键组件是交叉引用模块,它通过比较两张图像的共现特征来生成增强的特征表示。在两幅图像中,对下游前景进行了增强表示。同时,交叉引用模块还对两幅图像中同时存在的物体进行了预测。该子任务在训练阶段提供了一个辅助损耗,以方便交叉引用模块的训练。
在这里插入图片描述

度量学习已广泛应用于小样本学习[49,63];然而,在所有像素对之间进行比较是一个巨大的时间成本。为了解决这一问题,我们利用前景平均池化操作从支持图像集中捕获全局表示,检索查询图像中的类别信息。特别地,我们融合目标类别的特征来生成类别相关向量。 由于小样本分割的目标只是找到所分配对象类别的前景掩码,因此任务相关向量作为分割目标类别的条件。

仅将支持映像的全局表示与查询映像合并将导致一些限制。它将忽略对象部分之间的局部相似性。由于遮挡、视点变化和其他原因,一个物体可能只与同一类别的其他物体部分相似——只有部分相似。全局特征可能无法捕获这种部分级的相似性关系。为了减轻这些限制,我们研究了查询图像和支持图像之间的区域级比较,以进一步增强条件模块。 受[62]的启发,我们开发了一个局部-全局条件模块,以有效地将全局信息和局部信息合并到比较模块中。

由于物体外观存在着巨大的差异,因此在图像中挖掘前景区域可以分为多个步骤。我们开发了一个有效的掩码优化模块来迭代优化我们的预测。在最初的预测中,网络被期望定位高置信度的种子区域。然后将置信度映射保存为模块中的缓存,并用于以后的预测。每次做出新的预测时,我们都会更新缓存。在运行掩膜优化模块后,我们的模型可以更好地预测前景区域。我们通过经验验证了这种轻量级模块可以显著提高性能。

在提供多张支持图像的k-shot图像分割中,以往的方法[9,24,63]通常使用1-shot模型对每一张支持图像单独进行预测,并融合其特征或预测掩码。在我们的论文中,我们建议使用标记的支持示例对我们的网络的部分进行微调。 由于网络可以对两个图像输入进行预测,我们最多可以使用k^2个图像对来微调我们的网络。我们基于微调的方法的一个优点是,它可以受益于增加支持图像和持续提高精度。相比之下,当提供更多的支持图像时,基于融合的方法可以快速饱和。在我们的实验中,我们在1shot、5shot和10shot的设置中验证了我们的模型。

本文的主要贡献如下:

  • 我们提出了一种新的交叉参考网络,它可以同时对小样本图像分割任务中的查询集和支持集进行预测。通过挖掘两幅图像的共现特征,我们提出的网络可以有效地改善结果。
  • 我们开发了一个掩码优化模块,该模块具有置信度缓存,能够周期性地优化预测结果。
  • 我们提出了一种k-shot学习的微调方案,该方案是处理多幅支持图像的有效解决方案。
  • 我们开发了一个局部全局条件模块,它捕获查询图像和支持图像之间的局部和全局关系,以获得进一步的改进。

本文的部分结果发表在会议版[35]上。本文从几个重要方面扩展了我们早期的工作:

  • 我们扩展了提出的CRNet[35]算法与局部-全局条件模块,以有效地结合全局和局部信息查询图像掩码预测。
  • 我们在FSS-1000(表15)和MS COCO(表11,表12和表13)上进行了新的实验,以进一步评估我们的算法。
  • 我们在**few-shot弱监督分割任务** 上进行了一个新的实验。实验表明,我们的新算法在Pascal VOC和FSS-1000数据集上都达到了新的境界(表14)。
  • 我们进行了全面的消融研究和分析,如Sigmoid在交叉参考模块中的有效性分析(表6),支持掩码在局部条件模块中的有效性实验(表7),PFENet的微调方案有效性实验(表5),Pascal VOC的更多消融研究(表8)和MS COCO(表12),以调查我们网络的各个组成部分。

在这里插入图片描述

Fig. 2. 我们网络架构的pipeline。我们的网络主要由一个孪生编码器、一个交叉引用模块、一个条件模块和一个掩码细化模块组成。我们的网络采用对称设计。孪生编码器将查询和支持图像映射为特征表示。交叉引用模块挖掘两个图像中的共现特征以生成增强表示。条件模块将与类别相关的特征向量融合成特征映射,以强调目标类别。掩码优化模块将最后一次预测的置信度映射保存到缓存中,并循环优化预测的掩码。

【社区访问】

img 【论文速递 | 精选】

img阅读原文访问社区

https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/173637.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

BACnet协议详解——应用层说明一

文章目录写在前面1. 应用层模型1.1 需确认的应用层服务1.2 无需确认的应用层服务2 BACnet报文的分段2.1 报文分段规则2.1.1 APDU数据流的分段规则2.1.2 APDU最大长度的确定2.1.3 可接受的最大分段数2.2 分段协议控制信息(PCI)写在前面 年关将至&#xf…

分享77个PHP源码,总有一款适合您

PHP源码 分享77个PHP源码,总有一款适合您 下面是文件的名字,我放了一些图片,文章里不是所有的图主要是放不下..., 77个PHP源码下载链接:https://pan.baidu.com/s/12hh-lhIVPL1bZw-d2sfVlQ?pwdvhqj 提取码&#xff…

selenium 操作已经打开的浏览器

有时通过selenium打开网站时,发现有些网站需要扫码登录,就很头疼,导致爬虫进展不下去。 如果继续想使用selenium进行数据抓取,下一步应该怎么办呢? 步骤一:创建文件夹 在电脑的D盘或者F盘或者合适的盘创建…

《Python数据分析基础教程:NumPy学习指南:第二版》读书笔记

内容 主要介绍了NumPy库中的函数。 组成方式 用非常零散的知识点串联成章节。 内容摘要 极简地展示了章节中所运用的函数。 第一章 arrange函数创建NumPy数组。 第二章 NumPy特性 在NumPy中,复数的虚部是用j表示的。如果数组中包含复数元素,则…

VMware vSphere 中 Clone 与 Template 的区别

VMware vSphere 中 Clone 与 Template 的区别 Clone(克隆)Template(模板)克隆在克隆过程中为正在运行的虚拟机创建一个精确的副本模板作为具有根据组织标准预先定义的配置的虚拟机的基线映像。克隆虚拟机使用相同的配置和安装的软…

【C语言初阶】指针

文章目录1.指针是什么2.指针和指针类型2.1指针的解引用2.1指针类型的意义3.野指针3.1野指针成因3.2如何规避野指针4.指针运算4.1指针-整数4.2指针-指针4.3指针的关系运算5.指针和数组6.二级指针7.指针数组1.指针是什么 指针理解的2个要点: 指针是内存中一个最小单元…

【GD32F427开发板试用】+使用USBFS轻松实现HID键盘应用

本篇文章来自极术社区与兆易创新组织的GD32F427开发板评测活动,更多开发板试用活动请关注极术社区网站。作者:不锈钢铁侠 前言 最近有项目需要用到键盘自动输入功能,提升工作效率。故使用该开发板实现自定义输入内容并通过按键控制自动通过u…

STM32——外部中断

目录 外部中断简述 什么是外部中断 传统单片机与新型单片机外部中断区别 STM32外部中断请求 STM32中断线与IO口的对应 STM32 中断服务函数 外部中断与中断服务函数的对应 中断服务函数列表 STM32外部中断程序编写 常用的库函数 外部中断的一般配置步骤 外部中断简…

【ArcGIS微课1000例】0058:波段合成(CompositeBands)工具的使用

波段合成工具常见于遥感软件,例如Envi和Erdas等,用于将多个单波段数据合成为一个多波段数据集,在ArcGIS中也提供了波段合成的工具,使用灵活方便。 文章目录 一、波段合成工具介绍二、波段合成工具案例1. 输出Esri Grid格式2. 输出tif格式3. 输出jgp格式4. 输出其它格式一、…

sqlite 使用distinct时组合索引可能不是你想的那样

目录先来唠唠嗑吧~那一探究竟吧!表结构及索引信息我的查询场景到底命中什么索引了?简单小结下~先来唠唠嗑吧~ 在使用sqlite作为词条数据库查询数据,发现有的sql执行很快,有的sql执行很慢,你以为是没有走索引吗&#x…

深入浅出进程控制

文章目录进程控制浅谈fork写时拷贝fork调用失败的原因进程终止进程退出的场景进程常见退出方法查看进程退出码echo $? :查看进程退出码exit和_exit进程等待进程等待的方法waitwaitpid获取子进程status宏定义查看进程是否正常退出,查看退出码再谈僵尸进程浅谈阻塞等…

基于.Net Core开发的支付SDK,简化支付功能开发

更多开源项目请查看:一个专注推荐.Net开源项目的榜单 在我们做项目中,不管是电商系统、外卖系统、还是上门维修系统等等,都需要支付功能,这就需要我们与第三方支付平台进行对接,但是第三方平台文档,往往都存…

05语法分析——自下而上分析

文章目录一、自下而上分析基本问题二、算符优先分析构造FIRSTVT(P)的算法构造LASTVT(P)的算法构造优先表的算法三、LR分析法1.LR(0)构造LR(0)项目集规范族构造识别活前缀的DFA构造LR(0)分析表2.SLRSLR解决冲突办法SLR(1)分析表的构造算法3.LR(1)【规范LR】LR(1)项目集I的闭包状…

【MySQL基础】运算符及相关函数详解

序号系列文章3【MySQL基础】MySQL基本数据类型4【MySQL基础】MySQL表的七大约束5【MySQL基础】字符集与校对集详解6【MySQL基础】MySQL单表操作详解文章目录前言MySQL运算符1,算术运算符1.1,算术运算符的基本使用1.2,常用数学函数的基本使用2…

iOS:OpenGLES 实验室之2D篇 第一弹 の 智能弹幕

本文字数:3046字预计阅读时间:15 分钟iOS:OpenGLES 实验室之2D篇 第一弹 の 智能弹幕笔者之前发表的音视频文章,有图像的处理,音频的重采样等等,都属于入门级别。通过阅读它们,读者能对音视频有…

【复习 自用】JavaScript知识汇总(DOM)

注:之前学过JavaScript,本贴仅用于复习(自用),建议没基础的朋友先学基础。会混入typescript! 更新中~~~~~ Dom核心内容 创建节点 ① document.write() 是直接将内容写入页面的内容流,但是文档流执行完毕&#xff0c…

云原生技能树-docker caontainer 操作

运行 一个Docker镜像(image)运行后,就是一个容器实例,称为container 以镜像hello-world为例,启动容器: docker container run -it hello-world 可以看到输出了Hello World 信息: 以下描述错误的是? 答…

数字逻辑理论——从卡诺图到门电路

卡诺图化简 卡诺图化简 第一步:在卡诺图中圈出相邻为1的小方格(方格的个数为2m2^{m}2m),圈里面的1越多越好,并且这个小方格可以重复使用。 第二步:上一步中的方格或者圈出来的方框——每一个都代表一个与…

Linux软件安装及管理程序

Linux安装及管理程序Linux软件安装及管理程序一、Linux应用程序基础二、RPM软件包管理工具2.1、RPM介绍2.2、RPM命令三、源码编译安装四、yum安装Linux软件安装及管理程序 一、Linux应用程序基础 应用程序与系统命令的关系 角色系统命令应用程序文件位置般在/bin和/sbin目录…

linux系统中实现智能家居的基本方法

大家好,今天主要和大家分享一下,智能家居物联网的基本实现与操作方法。 目录 第一:智能家居基本简介 第二:测试WIFI模块功能 第三:智能家居物联UI界面开发 第四:核心代码的具体实现 第五:最…