【论文速递】CVPR2022 - 泛化的小样本语义分割

news2025/1/19 22:58:29

【论文速递】CVPR2022 - 泛化的小样本语义分割

【论文原文】:Generalized Few-shot Semantic Segmentation

获取地址:https://openaccess.thecvf.com/content/CVPR2022/papers/Tian_Generalized_Few-Shot_Semantic_Segmentation_CVPR_2022_paper.pdf

博主关键词: 小样本学习,语义分割,原型学习

推荐相关论文:

【论文速递】ACM2022 - 基于嵌入自适应更新和超类表示的增量小样本语义分割
- https://phoenixash.blog.csdn.net/article/details/128676817

摘要:

语义分割模型的训练需要大量精细标注的数据,很难快速适应不满足这一条件的新类。小样本分割(FS-Seg)通过许多约束来解决这个问题。在本文中,我们引入了一种新的基准,称为泛化的小样本语义分割(GFSSeg),以分析同时分割具有很少示例的新类别和具有足够示例的基本类别的泛化能力。 这是首次研究表明,以往最先进的代表性FS-Seg方法在GFS-Seg中存在不足,其性能差异主要来自FS-Seg的约束设置。为了使GFS-Seg易于处理,我们设置了一个GFS-Seg基线,该基线在原始模型上没有结构更改的情况下实现了良好的性能。 然后,由于上下文对语义分割至关重要,我们提出了上下文感知的原型学习(CAPL),通过以下方式显著提高性能:1)利用来自支持样本的共现先验知识,2)动态丰富分类器的上下文信息,以每个查询图像的内容为条件。这两项贡献都在实验上证明了它们的实际价值。 在Pascal-VOC和COCO上的大量实验也表明,CAPL通过实现具有竞争力的性能,可以很好地推广到FS-Seg。代码可从https://github.com/dvlabresearch/GFS-Seg获得。

简介:

深度学习的发展为语义分割任务带来了显著的性能提升。有代表性的语义分割方法[5,64]在机器人、自动驾驶、医学成像等领域有广泛的应用。然而,一旦这些框架经过训练,如果没有足够的完全标记的数据,它们就无法处理新应用程序中未见的类。即使新类所需的数据已经准备好,微调也会花费额外的时间和资源。

为了快速适应只有有限标记数据的新类,在标记良好的基类上训练小样本分割(FSSeg)[31]模型,并在以前未见过的新类上进行测试。在训练过程中,FS-Seg将数据分为支持集和查询集。支持集样本旨在为FS-Seg模型提供目标分类信息,以识别查询样本中的目标区域,目的是模拟只有少数新类的标记数据可用的情况。训练后,支持和查询样本都被发送到FS-Seg模型,以根据支持信息对以前未见过的类产生查询预测。

在这里插入图片描述

Fig. 1. GFS-Seg和FS-Seg的管道插图。(a) GFSSeg有一个额外的新类注册阶段,将新信息注册到新的分类器中,因此,在最后一个评估阶段,GFS-Seg方法能够对所有可能的基类和新类进行预测,以测试正常的分割模型,而无需转发额外的支持样本,提供目标类的先验知识。相反,(b)评估阶段的FSSeg模型需要支持图像/标签提供每个查询图像中准确包含的目标类信息。

FS-Seg的局限性。 但是,FS-Seg要求支持样例包含查询样例中存在的类。在许多情况下,拥有这种先验知识可能会过于强大,因为在相同的类中提供支持样本需要繁琐的手动选择。此外,FS-Seg只评估新类,而正常语义分割的测试样本也可能包含基类。实验表明,由于这些限制,FS-Seg模型不能很好地解决基础类和新类评价的实际情况。

新benchmark和我们的解决方案。基于这些事实,我们建立了一个新的任务,命名为泛化的小样本语义分割(GFS-Seg)。 如图1所示,典型的GFS-Seg方法有三个阶段:1)基类学习阶段,2)新类注册阶段(包含新类的支持样本较少),3)基类和新类的评估阶段。GFS-Seg与FS-Seg的区别在于,在评估时,GFS-Seg不需要转发测试(查询)样本中包含相同目标类的支持样本来进行预测,因为GFS-Seg应该分别在基类学习阶段和新类注册阶段获得基类和新类的信息。 GFS-Seg在不预先知道查询图像中包含哪些类的情况下,同时对新类进行预测时,在不牺牲基类的准确性的情况下,在新类上表现良好,实现了在更具挑战性的情况下实际使用语义分割的基本步骤。

受[12,26]的启发,我们设计了一个性能不错的GFS-Seg基线 。考虑到上下文关系对于语义分割至关重要,我们提出了上下文感知原型学习(CAPL) ,通过使用适应的特征更新基本原型的权重,为基线提供了显著的性能提升。CAPL不仅利用来自支持样本的基本共现信息,而且还使模型适应查询图像的各种上下文。基线方法和提出的CAPL可以应用于正常的语义分割模型,如FCN[32]、PSPNet[64]和DeepLab[5]。此外,CAPL通过大幅提高基线,达到最先进的性能,证明了其在FS-Seg设置中的有效性。我们的总体贡献如下。

  • 我们扩展了经典的小样本分割(FSSeg),并提出了一个更实用的设置-泛化的少镜头语义分割(GFS-Seg)。
  • 基于我们的实验结果,我们分析了FS-Seg和GFS-Seg之间存在的性能差距,以及最近流行的FS-Seg模型不能很好地处理的情况。
  • 我们提出了情境感知原型学习(CAPL),它在GFS-Seg和FS-Seg的两种设置中都比基线模型产生了显著的性能提升。它适用于各种正常的语义分割模型,没有特定的结构约束。

在这里插入图片描述

Fig 2. (a)经典小样本分割(FS-Seg)和(b)泛化的小样本语义分割(GFS-Seg)的插图。“Dist”可以是测量每个特征和原型之间的距离/相似性的任何方法,并基于该距离/相似性进行预测。FS-Seg模型只预测支持集提供的新类,而GFS-Seg模型同时预测基本类和新类,不受冗余类的影响。此外,在评估过程中,GFS-Seg模型不需要查询图像中存在哪些目标类的先验知识,通过注册新类,对所有测试图像形成一次新的分类器((b)中的蓝色区域表示新类注册阶段)。

【社区访问】

img 【论文速递 | 精选】

img

https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/161393.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ROS2 入门】Jeston TX1 JetPack_4.6.3环境 ubuntu 18.04 ROS2 安装

大家好,我是虎哥,从今天开始,我将花一段时间,开始将自己从ROS1切换到ROS2,在上一篇中,我们再虚拟机环境中安装了 ROS2 eloquent版本,并完成了初步的验证,但是做为一个偏硬件的博主&a…

nginx禁止外网访问

1、安装 libmaxminddb 库 apt updateapt install libmaxminddb0 libmaxminddb-dev mmdb-bin上面安装的软件包是: libmaxminddb0 libmaxminddb-dev 是MaxMind地理定位数据库mmdb-bin – 二进制。 从命令行调用的程序。 使用此命令手动定位 IP 安装参考 2、下载geoi…

node学习笔记

阶段一 1 初始Node.js javascript 运行环境 1.2 Node.js中的javacript 运行环境 1.3 Node.js环境安装 百度 1.4 node.js 执行javaScript 代码 2 fs文件系统模块 2.1 fs文件系统模块概念 导入文件系统模块: const fs require(fs)fs.readFile() // 1 导入fs文件…

【进阶C语言】通讯录(后期会升级)

文章目录一.基本框架与功能二.头文件的详细内容三.函数的实现1.打印菜单2.初始化通讯录3.添加联系人信息4.打印联系人信息5.查找名字6.删除联系人信息7.查找联系人8.修改联系人信息9.排序联系人(按照名字)四.总结1.test.c2.contact.c3.contact.h一.基本框…

智能电风扇(stm32f103c8t6)(直流电机,热敏传感器)(TIM,ADC)

前言 我的毕业论文的课题 提示:以下是本篇文章正文内容,下面案例可供参考 一、热敏传感器计算温度(ADC采样单通道) #include "stm32f10x.h" // Device header#define T25 298.15 #define B 3…

看完这篇 教你玩转渗透测试靶机vulnhub——MONEYBOX: 1

Vulnhub靶机MONEYBOX: 1渗透测试详解Vulnhub靶机介绍:Vulnhub靶机下载:Vulnhub靶机安装:Vulnhub靶机漏洞详解:①:信息收集:②:FTP匿名登入:③:SSH暴力破解④:…

Java操作Word模板产生全新内容Word

1. spire.doc的jar引用 首先我们需要用到国产word处理工具jar包spire.doc,可以通过maven仓库寻找,然后在pom文件中直接引用。 此处需要注意,我们需要使用的是spire.doc.free(免费版的),切勿使用spire.doc&a…

c++ - 第23节 - C++的类型转换

1.C语言中的类型转换 在C语言中,如果赋值运算符左右两侧类型不同,或者形参与实参类型不匹配,或者返回值类型与接收返回值类型不一致时,就需要发生类型转化,C语言中总共有两种形式的类型转换:隐式类型转换和…

业务安全情报 | 数十万元的数据报告,竟被50元批量转售

近期监测到某咨询公司针数据报告大量泄漏事件,该机构历年的数据报告以及近期更新的针对VIP会员的付费报告均在电商等渠道可以低价获取。 BSL-2022-a3c28号情报文件显示黑灰产通过作弊方式获取查看、下载权限,绕过限制将报告数据大量下载,并通…

javaEE初阶 — 认识文件

文章目录认识文件1. 树型结构组织和目录2. 文件路径(Path)2.1 绝对路径2.2 相对路径3. 文件的类型认识文件 文件分为 狭义 和 广义 两种 狭义的文件:指的是硬盘上的 文件 和 目录 广义的文件: 泛指计算机中很多的软硬件资源。操…

2022(一等奖)D926刘家峡库区潜在滑坡InSAR识别与分析

作品介绍 1 应用背景 滑坡是普遍存在于世界各地山区的主要灾害之一,严重威胁着人类的生命财产安全和自然环境。滑坡不但会直接破坏人类生命财产安全和建筑物,而且还会造成堰塞湖等次生灾害,进而对人类的生命财产安全和基础设施等造成二次破坏…

暴力破解 SSH

Kali 的 MSF 终端,对渗透目标主机 的 SSH 服务进行暴力破解。 破解的是否成功取决于字典和目标是否使用弱密码。 一,实验环境 分别是攻击机和靶机(也可是其他目标服务器) 二、利用 SSH 弱密码进行暴力破解 暴力破解最重要的要…

100 道 Linux 笔试题,能拿 80 分就算大神!

本套笔试题共100题,每题1分,共100分。(参考答案在文章末尾) 1.cron 后台常驻程序 (daemon) 用于: A. 负责文件在网络中的共享 B. 管理打印子系统 C. 跟踪管理系统信息和错误 D. 管理系统日常任务的调度 2.在大多数Li…

如何使用无标签数据进行预训练?

一、直观解释 简单来说就是“造目标”。也即人为地去构造一些子任务(论文里的protext task),或者利用一些最基本的公理性常识,去设计“类似监督”的任务。所不同的是,我们引入的“类似监督”的任务通常是用来完成表征…

day13|559.n叉树的最大深度、222.完全二叉树的节点个数

559.n叉树的最大深度 给定一个 N 叉树,找到其最大深度。最大深度是指从根节点到最远叶子节点的最长路径上的节点总数。N 叉树输入按层序遍历序列化表示,每组子节点由空值分隔(请参见示例)。 示例 1: 输入:r…

基于opencv的图像:边缘检测 (完整代码+详细教程)

给出“离散拉普拉斯算子”一般形式的数学推导 离散值的导数使用差分代替: 所以: 以(x, y)为中心点,在水平和垂直方向上应用拉普拉斯算子,滤波器(对应a=1的情况)为:

广告归因-让你彻底弄归因架构实现

这里会引用神策数据很多的介绍,然后进行总结 归因方法 自归因 渠道商帮我们做归因,有的是每个用户打开 app 都回传给渠道商,渠道商自己归因有的如华为是从应用商店安装时,应用商店把归因信息写入到 app, 然后首次安装启动时能从本…

【信息学CSP-J近16年历年真题64题】真题练习与解析 第12题之加工零件

加工零件 描述 凯凯的工厂正在有条不紊地生产一种神奇的零件,神奇的零件的生产过程自然也很神奇。工厂里有 𝑛 位工人,工人们从 1~𝑛编号。某些工人之间存在双向的零件传送带。保证每两名工人之间最多只存在一条传送带。 如果 𝑥 号工人想生产一个被加工到第 𝐿(…

回溯法--旅行售货员问题--排列树

回溯法有点类似于暴力枚举的搜索过程,回溯法的基本思想是按照深度优先搜索的策略,从根节点出发深度搜索解空间树,当搜索到某一节点时,如果该节点可能包含问题的解,则继续向下搜索;反之回溯到其祖先节点&…

【学习笔记】【Pytorch】六、nn.Module的使用

【学习笔记】【Pytorch】六、nn.Module的使用学习地址主要内容一、torch.nn模块概述二、nn.Module类的使用1.使用说明2.代码实现学习地址 PyTorch深度学习快速入门教程【小土堆】. 主要内容 一、torch.nn模块概述 概述:帮助程序员方便执行与神经网络相关的行为。…