【论文速递】TNNLS2022 - 一种用于小样本分割的互监督图注意网络_充分利用有限样本的视角

news2024/11/20 9:27:35

【论文速递】TNNLS2022 - 一种用于小样本分割的互监督图注意网络_充分利用有限样本的视角

【论文原文】:A Mutually Supervised Graph Attention Network for Few-Shot Segmentation: The Perspective of Fully Utilizing Limited Samples

获取地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9733415
CSDN下载:https://download.csdn.net/download/qq_36396104/87379693

博主关键词: 小样本学习,语义分割,图注意力网络,互监督

摘要:

全监督语义分割在许多计算机视觉任务中表现良好。然而,这是耗时的,因为训练一个模型需要大量的像素级注释样本。小样本分割最近成为解决这个问题的一种流行方法,因为它只需要少量带注释的样本就可以推广到新的类别。然而,如何充分利用有限的样本仍然是一个悬而未决的问题。因此,本文提出了一种相互监督的小样本分割网络。首先,对中间卷积层的特征映射进行融合,增强特征表示能力;其次,将支持图像和查询图像组合成二部图,采用图注意网络避免空间信息丢失,增加支持图像像素数,指导查询图像分割;第三,利用查询图像的注意图作为先验信息,增强支持图像分割,形成相互监督的机制。最后,将中间层的注意图进行融合,送入图推理层进行像素类别推断 。在PASCAL VOC-5i数据集和FSS-1000数据集上进行了实验,结果表明了该方法的有效性和性能优于其他基线方法。

关键词 -小样本学习,图注意网络,图推理,图像分割,相互监督体制(MSR)。

简介:

DEEP神经网络在目标检测、语义分割和自动字幕等计算机视觉任务中取得了显著的成功。这些方法依赖于大规模的人类标注数据集的可用性,例如PASCAL VOC [1], ImageNet[2]和COCO[3]。然而,注释这些数据集非常耗时、繁琐且容易出错。语义分割已应用于许多计算机视觉任务,如自动驾驶[4]、人机交互[5]、图像搜索引擎[6]、手术用医疗设备[7]。由于密集的像素级预测问题,用于语义分割任务的标注需要更多的劳动。近年来,基于全卷积网络(FCN)[8]的最先进的语义分割框架取得了显著的进展;然而,缺乏注解良好的数据集阻碍了实际应用中的性能改进。为了降低标注成本,提出了一些带有粗标注的弱监督方法;这些方法包括边界框[9]、涂鸦[10]、点[11]和图像级别标签[12]。虽然这些方法确实降低了数据注释的难度,但训练数据集仍然需要额外的处理,而且这些模型不能适应新的类别。例如,自动驾驶模型无法适应不同国家的驾驶规则,计算机辅助诊断算法无法准确诊断新的疾病类别,网络异常检测算法无法发现新的安全漏洞类型。对于新的类别,网络必须重新训练。然而,当只有少数新样本可用时,网络容易过拟合。随着元学习技术的发展,在仅有少量标注样本的情况下,如何取得满意的分割结果已成为研究的热点。元学习的目标是学会学习,它模仿人类从少数甚至一个样本中识别新类别的能力。小样本学习是将元学习应用于监督范式,主要用于图像分类。 从另一个角度来看,语义分割可以看作是一个像素级的分类问题。Shaban et al.[14]提出了一种单shot语义分割方法,仅使用一张图像及其对应的像素级注释即可获得像素级分割掩码。这可能是第一次将小样本方法应用于分割任务。Rakelly等人[15]提出了Co-FCN方法,仅使用密集和稀疏注释实现少镜头分割。这些方法将支持图像的特征压缩成一个向量,通过掩码平均池化操作来指导分割。然而,掩码平均池化操作不可避免地会丢失支持图像中的空间信息。考虑到在小样本学习范式中样本有限,充分利用上下文信息并快速聚焦于关键对象特征是很重要的。 Zhang等[16]整合了中间层的信息,增强了特征的多样性。近年来,注意力机制被广泛应用于分割任务中,用于聚焦关键目标区域。Hu等人[17]提出了一种基于注意的小样本语义分割方法,该方法将注意机制应用于支持分支和查询分支之间的多尺度特征。Wang等[18]用图形注意取代了传统的注意。他们发现,激活的像素往往只集中在支持图像的一个非常小的区域。因此,只使用少量像素来指导查询图像分割,这对分割性能产生了不利影响。因此,作者在训练过程中调整激活区域,以利用支持图像中更多的前景对象像素。他们认为高权重像素应该被抑制,低权重像素应该被加强。但是,它们的权重调整策略并不合理,会引入噪声像素,导致查询图像分割不正确。支持图像的非判别区域容易导致查询图像的语义混叠。 例如,背景像素被错误地分割为前景像素。

在这里插入图片描述

Fig. 1. Overview of graph attention.

为了克服这些缺点,我们设计了一个小样本学习框架。在我们提出的方法中使用了典型的双分支结构,其中每个分支充当一个特征提取器网络。在该方法中,特征提取器网络被划分为几个中间层,以获得多尺度特征。从不同中间层获得的特征图被发送到图注意模块(GAM)。GAM旨在鼓励更多的前景像素来指导分割,如图1所示。提取器网络生成的特征向量被映射到图的节点上。我们定义了两种不同类型的边来构造图:图内边和图间边。图内边通过邻居创建机制生成,图内边连接在支持图的标记节点和查询图的所有节点之间。支持图像和查询图像的图结构共同构建二部图,将网格数据转换为图数据。然后,利用基于空间信息的图卷积网络来表示图数据。节点通过聚合自己的特征和邻居的特征来表示。通过计算图的边权值,将标签从支持图像传播到查询图像。这样做有利于充分利用有限的样本,同时避免空间信息的丢失。 然后,为了避免引入不正确的分割,提出了一种创新的权值调整方法,鼓励支持图像中有更多的标注像素来指导查询图像的分割过程。 然后,在每个中间层上引入双分支互监督网络。在将支持图像发送到GAM之前,使用支持掩码丢弃支持图像的背景。然后,利用该结果指导查询图像的分割。同样,生成的查询图像注意图用于删除查询图像的背景。从而形成一个相互监督的区域(MSR),并通过逐步迭代得到多层前景注意图。MSR打破了传统的仅使用支持图像来指导分割的方法。 查询图像参与网络训练,提高分割性能,有利于充分利用有限的样本。此外,采用混合损失函数加快了网络的收敛速度。最后,融合来自不同中间层的注意图,并将其发送到图推理层(GRLs)来推断像素类别。我们的主要贡献总结如下。

1)利用支持图像和查询图像的特征映射构造二部图,并设计GAM计算它们之间的边权值。然后,根据边缘权值将标签从支持图像传播到查询图像。此外,我们提出了一种权重调整策略,以鼓励更多的前景像素参与分割过程。

2)采用MSR充分利用中间层的多层信息,鼓励支持图像和查询图像相互学习。最后,对两个损失进行了相加,加快了小样本学习网络的收敛速度。

3)我们在Pascal VOC-5i和FSS-1000数据集上演示了我们的方法的有效性,并实现了最先进的性能。

本文其余部分的组织如下。第二部分介绍了相关技术和最新进展。第三节详细说明了拟议的网络。第四部分报告实验设置和结果。第五节讨论了结果并提出了今后的工作建议。

在这里插入图片描述

Fig. 2. Detailed design of our proposed method with three parts: 1) two feature extractor branches; 2) the GAM; and 3) the GRL.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/156820.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java设计模式-组合模式Composite

介绍 组合模式(Composite Pattern),又叫部分整体模式,它创建了对象组的树形结构,将对象组合成树状结构以表示“整体-部分”的层次关系。组合模式依据树形结构来组合对象,用来表示部分以及整体层次。这种类…

【Nginx】Nginx的常用命令和配置文件

1. 常用命令 1. 查看版本2. 查看 Nginx 配置语法的正确性3. 为Nginx指定一个配置文件4. 启动 Nginx 服务5. 开机自启动6. 重启 Nginx 服务7. 查看 Nginx 服务状态8. 重载 Nginx 服务9. 停止 Nginx 服务10. 查看命令帮助 2. 配置文件 第一部分:全局块第二部分&#x…

RT-Thread系列--内存池MEMPOOL源码分析

一、目的嵌入式RTOS中最重要也是最容易被忽略的一个组件就是内存管理,像FreeRTOS单单内存管理组件就提供了heap_1/2/3/4/5这五种方案,每种方案都有其特点和应用场景。一般情况下小系统所运行的芯片平台本身内存就很少,有些时候内存空间还不连…

libdrm-2.4.112

编译 这个版本使用了meson进行构建、ninja进行编译 ; 安装meson 编译 报错如上,查看meson.build文件, 我们的meson版本不正确, 查阅发现apt安装的版本过低; 安装meson sudo apt-get install python3 python3-pip …

LeetCode 111. 二叉树的最小深度

🌈🌈😄😄 欢迎来到茶色岛独家岛屿,本期将为大家揭晓LeetCode 111. 二叉树的最小深度,做好准备了么,那么开始吧。 🌲🌲🐴🐴 一、题目名称 二、…

程序的编译与链接——ARM可执行文件ELF

读书《嵌入式C语言自我修养》笔记 目录 读书《嵌入式C语言自我修养》笔记 ARM编译工具 使用readelf命令查看ELF Header 使用readelf命令查看ELF section header 程序编译 预处理器 编译器 (1)词法分析。 (2)语法分析。 …

班级人员可视化项目

页面分布文件分布index.html(搭建页面)index.css (修饰页面)fonts (放图标)images (放图片)jsjquery.js (调整页面的js)flexible.js (尺寸大小的js)echarts.min.js (charts图表的js)chinaMap…

论文投稿指南——中文核心期刊推荐(中国医学 2)

【前言】 🚀 想发论文怎么办?手把手教你论文如何投稿!那么,首先要搞懂投稿目标——论文期刊 🎄 在期刊论文的分布中,存在一种普遍现象:即对于某一特定的学科或专业来说,少数期刊所含…

普元PAS部署springboot项目访问500

背景 项目需要从东方通部署迁移到普元PAS部署。记录一下遇到的问题 问题一 WebSocket启动异常: Error creating bean with name ‘serverEndpoint’ defined in class path resource 因为SpringBoot默认使用的容器是tomcat 对应的Websocket实现 PAS中直接使用ServerEndpoin…

虹科新品丨什么是光纤微动开关?(下)

HK-Micronor光纤微动开关 HK-MR386光纤微动开关和HK-MR380系列控制器搭配使用,提供了一种全新的创新型信号解决方案,可以长距离部署在困难和危险环境中。该开关传感器采用光中断的方法,通过双工62.5/125μm光纤链路,进行可靠的信号…

虹科方案|使用直接连接的阵列创建 SAN

一、引言通过将直连环境转换为共享存储,用户可以体验到物理主机之间或主机与存储之间更快的数据传输,从而使vMotion 实时迁移等 VMware 功能能 够在更短的时间内完成。二、关于VMWARE VSPHEREvSphere 平台是您的应用程序、云和业务 的最佳基础。 vSphere…

C语言_字符串旋转结果_C语言字符串旋转结果

上一篇博文讲了字符串左旋http://t.csdn.cn/8zbRf 这篇文章将讲解判断一个字符串是不是逆序过。 目录 一、问题描述 二、设计与分析 三、代码实现 一、问题描述 写一个函数,判断一个字符串是否为另外一个字符串旋转之后的字符串。 例如:给定s1 AAB…

【零基础】学python数据结构与算法笔记9

文章目录前言53.栈和队列的应用:迷宫问题54.使用栈解决迷宫问题55.使用队列进行迷宫问题:介绍56.使用队列进行迷宫问题:实现:总结前言 学习python数据结构与算法,学习常用的算法, b站学习链接 53.栈和队列…

【学习笔记之Linux】工具之vim配置

配置文件的位置: 在目录/etc/下面有一个名为vimrc的文件,这是系统中公共的vim配置文件,对所有用户都有效;   每个用户可以在自己的主目录下创建一个私有的配置文件,命名为“.vimrc”,这个配置只对自己有效…

如何利用MOS管实现双向电平转换

前面讲过的三极管和MOS管电平转换电路都是单向的,就是信号只能是从A输出到B输入。其实单个MOS管也能实现双向电平转换,即信号即能从A输出到B输入,也能从B输出到A输入。实际电路就是这个,包含一个MOS管和两个电阻,芯片1…

自定义启动器

🍁博客主页:👉不会压弯的小飞侠 ✨欢迎关注:👉点赞👍收藏⭐留言✒ ✨系列专栏:👉SpringBoot专栏 🔥欢迎大佬指正,一起学习!一起加油! …

D. Meta-set(组合数学)

Problem - D - Codeforces 你喜欢纸牌棋盘游戏“集合”。每张牌包含k个特征,每个特征都等于集合{0,1,2}中的一个值。这副牌包含所有可能的纸牌变体,也就是说,总共有3k张不同的纸牌。 如果三张牌的某个特征与这三张牌相同或两两不同&#xff0…

[LeetCode算法->双指针]

在算法中,双指针的问题较为常见,应用也比较广泛,双指针问题能够降低时间复杂度和空间复杂度,有必要掌握这一内容。下面通过LeetCode的题目来说明双指针。1.给你一个按 非递减顺序 排序的整数数组 nums,返回 每个数字的…

Minecraft 1.19.2 Fabric模组开发 03.动画生物实体

我们本次尝试在1.19.2 Fabric中添加一个能够具有各种动画效果动作的生物实体。 效果展示效果展示效果展示 1.首先,为了实现这些动画效果,我们需要首先使用到一个模组:geckolib(下载地址) 找到项目的build.gradle文件,在repositories和depen…

vue实现网页端企业微信扫码登录功能(前端部分)

时至今日,企业微信在企业日常工作中的使用越来越频繁也越来越重要,不少企业已使用企业微信进行着日常的工作安排管理。在这种背景下,各类系统和企业微信对接的需求也不断增加,今天要说的就是一个比较常见的需求:在网页…