【论文速递】ACM2022 - 基于嵌入自适应更新和超类表示的增量小样本语义分割

news2025/1/19 17:07:51

【论文速递】ACM2022 - 基于嵌入自适应更新和超类表示的增量小样本语义分割

【论文原文】:Incremental Few-Shot Semantic Segmentation via Embedding Adaptive-Update and Hyper-class Representation

获取地址:https://arxiv.org/pdf/2207.12964.pdf

博主关键词: 小样本学习,语义分割,自适应,超类表示,增量学习

推荐相关论文:

【论文速递】CVPR2022 - 泛化的小样本语义分割
- https://phoenixash.blog.csdn.net/article/details/128675973

摘要:

增量小样本语义分割(IFSS)的目标是逐步扩展模型的能力,以分割只有少量样本监督的新类别图像。然而,在旧类上学习到的特征可能会显著漂移,导致灾难性的遗忘。此外,在新类上进行像素级分割的样本很少,导致每个学习会话中都存在臭名昭著的过拟合问题。在本文中,我们将基于类的知识显式表示为类别嵌入和超类嵌入,其中类别嵌入描述独占语义属性,超类嵌入表示类共享语义属性。针对IFSS问题,从两个方面提出了嵌入自适应更新网络和超类表示网络。 首先,我们提出了一种嵌入自适应更新策略以避免特征漂移,该策略通过超类表示来维护旧知识,并使用类注意方案自适应更新类别嵌入以涉及在单个会话中学习的新类。其次,为了克服训练样本少导致的过拟合问题,通过聚类所有类别嵌入进行初始化,并与新类的类别嵌入对齐进行增强,学习的知识有助于学习新知识,从而减轻性能对训练数据规模的依赖。值得注意的是,这两种设计为具有足够语义和有限偏差的类提供了表示能力,能够执行需要高度语义依赖的分割任务。在PASCAL-5𝑖和COCO数据集上的实验表明,EHNet以显著的优势达到了最新的性能。

**关键词:**增量学习,小样本学习,语义分割,自适应更新,超类表示

简介:

小样本语义分割[21,28,40]解决了用较少样本分割新类别的图像,降低了昂贵的像素级注释的成本。在现实场景中,我们期望训练过的模型在不忘记从旧类中学习到的知识的情况下分割新的类,这对人类来说是一个自然的任务。然而,对新类样本较少的部署模型进行微调,会导致严重的灾难性遗忘问题[31],因为模型在面对新老类表示冲突时,往往会忘记旧类的知识 ,如图1(a)所示。人类和机器学习模型之间的差距启发了研究人员促进增量小样本分割(IFSS),其目的是在只有少量新样本的情况下学习新旧类的分割模型。

IFSS的主要挑战是对已经获得的知识的灾难性遗忘和对新类别的少数样本的过度拟合网络。目前大多数增量方法[7,11,24,49]都是从认知启发的角度使用参数或嵌入向量来表示类别知识,通过新类更新方案的知识表示来解决灾难性遗忘问题。但是,旧类的表示误差会在迭代中不断累积,如图1(b)所示,在每次更新迭代中,旧类的知识学习和表示都是耦合在一起的,这就不可避免地影响了从旧类中学习到的知识的有用性和一致性

在这里插入图片描述

Fig. 1.(a)在小样本语义分割中,基类𝐶_{𝑏𝑎𝑠𝑒}和新类𝐶_{𝑛𝑒𝑤}的知识表示经常发生冲突,导致灾难性遗忘问题。(b)由于知识学习和表示之间的耦合,特征嵌入会漂移到不匹配基类的真实分布。(c)为了抵抗特征漂移,EAUS维护超类嵌入𝐸_ℎ以表示存储旧知识,并自适应地更新类别嵌入𝐸_𝑐以组合新类。(d)超类嵌入𝐸_ℎ^{𝑛𝑒𝑤}是先聚类基类对应的类别嵌入(蓝色部分),再对准新类𝐸_𝑐^{𝑛𝑒𝑤}的类别嵌入生成的。

在本文中,我们提出了EHNet,即为IFSS嵌入自适应更新和超类表示网络,以解决灾难性遗忘和过拟合的问题。我们从一个新类的少量样本中学习到两种嵌入向量,即类别嵌入和超类嵌入,前者描述独占的语义属性,后者将超类知识表示为类共享的语义属性。 这种知识表示的一个关键好处是用固定长度语义嵌入的预测取代了新参数训练的要求,从而避免了在学习新类时从头开始训练。

为了减轻灾难性遗忘,我们提出了一 种嵌入自适应更新策略(EAUS) ,如图1©所示,其中类别嵌入使用注意方案进行自适应调整,超类嵌入保持不变。通过这种方式,构建了一个良好分离的类表示,其中旧的知识在内存功能设计中得到了很好的维护,即超类。EAUS将知识学习与表示解耦,通过选择性更新解决特征漂移问题,并通过保留旧知识减轻对新类样本数的要求。类别嵌入更新的核心是类注意方案,它通过对所有类的表示进行上下文化单个类的权重,为每个类计算一个安全的位移向量。这种改进的类注意方案不仅突出了基本类和新类之间的区别表示,从而在所有涉及的类上生成更好的决策边界,而且还指出了在增量学习过程中实现语义偏差较小的良好分离表示的方向。

对语义分割的观察证明了用知识分割不可见的类,其中新发现的样本可能与已学习的类共享“毛发”和“四足动物”等语义属性。因此,超类被表述为包含类似类的语义属性的抽象表示,这能够通过在学习会话期间共享语义知识来减少数据规模依赖和过拟合。超类嵌入通过聚类所有类的类别嵌入进行初始化,并与新类类别嵌入对齐进行增强,如图1(d)所示 。一方面,将聚类算法应用于所有类别嵌入集合,生成原始超类嵌入,从而提取相似的语义表示作为新的超类知识;另一方面,我们将生成的超类嵌入与新类类别嵌入对齐,以增强相关语义信息,消除不相关语义信息。

值得注意的是,EAUS构建了具有很少语义偏差的良好分离表示。同时,超类知识补充和增强了语义信息。 这两种设计为类提供了足够语义且偏差有限的表示,从而能够很好地完成需要高度语义依赖的图像分割任务。

综上所述,本文的贡献有:

  • 我们提出了一种嵌入自适应更新策略来避免灾难性遗忘,其中超类嵌入保持固定以维护旧知识,类别嵌入使用类注意方案进行自适应更新,结合在增量会话中学习的新类。
  • 为了抵抗训练样本少导致的过拟合,首先通过聚类类别嵌入学习超类,然后与新类类别嵌入对齐进行相关性增强,从而减轻了性能对训练数据规模的依赖。
  • 实验结果表明,EHNet达到了最先进的性能,具有显著的优势。

在这里插入图片描述

Fig. 2. EHNet的设计。(a)在增量小样本学习阶段,支持图像表示为超类嵌入𝐸_ℎ和类别嵌入𝐸_𝑐。𝐸_ℎ和𝐸_𝑐存储在内存池中,自适应更新所有类的类别嵌入以获得良好分离的表示。(b)在分割阶段,根据对应的𝐸_ℎ和𝐸_𝑐对每个类的对象进行分割。通过非最大抑制(non-maximum suppression, NMS)对分割结果进行整合,得到最终的分割结果。

【社区访问】

img 【论文速递 | 精选】

img阅读原文访问社区

https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/161559.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

靶机测试djinn笔记

靶机地址https://www.vulnhub.com/entry/djinn-1,397/靶机测试信息收集nmap扫描nmap -p- -A 192.168.1.106 -oA dj 通过 nmap 扫描得到21 端口 可以匿名访问22 端口 ssh 但是被过滤了 1337 是一个游戏端口7331 是 python web测试 1337 端口访问端口nc -vv 192.168.0.177 1337这…

智慧工地安全帽智能识别检测 yolov5

智慧工地安全帽智能识别检测通过yolov5opencv深度学习技术,可自动对现场画面检测识别人员有没有戴安全帽。OpenCV基于C实现,同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API,结合了OpenCV CAPI和Python语言的最…

【Spring(六)】彻底搞懂Spring的依赖注入

文章目录前言依赖注入setter注入构造器注入自动装配集合注入总结前言 在核心容器这一部分bean相关的操作,我们已经学完了,接下来我们就要进入到第二个大的模块,与我们的DI,也就是依赖注入相关知识的学习了,那我们先来学习第一个内…

ChatGPT!我是你的破壁人;比尔·盖茨不看好Web3与元宇宙;FIFA押中4届世界杯冠军;GitHub今日热榜 | ShowMeAI资讯日报

👀日报合辑 | 🎡AI应用与工具大全 | 🔔公众号资料下载 | 🍩韩信子 🎡 『GPTZero』用 ChatGPT 写论文糊弄老师?已经不灵了~ 语言生成模型的诞生与优化,给教育和学术界带来了不少困扰。继纽约教育…

前端工程化解决方案-Webpack编程

文章目录1. 前端工程化目前主流的前端工程化解决方案2.webpack2.1 主要供能2.2 webpack与webpack-cli的使用2.2.1 初始化项目2.2.2 安装2.2.3 配置2.2.3.1 webpack.config.js2.2.3.2 package.json2.2.3.3 打包构建2.2.3.4 项目中引入 dist/bundle.js2.3 动态部署2.3.1 webpack-…

微服务架构概述

微服务架构概述一、架构演变1.1 单体架构1.2 分布式架构1.3 微服务二、SpringCloud2.1 简介3.2 痛点三、SpringCloud Alibaba3.1 简介3.2 优点3.3 主要组件3.4 版本对应一、架构演变 1.1 单体架构 讲业务的所有功能集中在一个项目中开发,打成一个包部署。 优点&am…

SaaS架构实现理论(四)可伸缩多租户

目录1.伸缩性(Scalable)的概念2.应用服务器层的水平扩展2.1基于Session复制的水平扩展方式2.2基于Session Sticky的水平扩展方式2.3基于Cache的集中式Session实现水平扩展2.4三种水平扩展方式的比较3.数据库的水平扩展3.1数据库的垂直切分3.2数据库的读写…

ArcGIS基础实验操作100例--实验93插值模型的精度分析

本实验专栏参考自汤国安教授《地理信息系统基础实验操作100例》一书 实验平台:ArcGIS 10.6 实验数据:请访问实验1(传送门) 空间分析篇--实验93 插值模型的精度分析 目录 一、实验背景 二、实验数据 三、实验步骤 (…

ESP-IDF:使用基本类型,指针,引用,指针的指针,指针的引用作为函数参数的几个例程

1.例程: /下面是使用基本类型,指针,引用,指针的指针,指针的引用作为函数参数的几个例程/ // 值拷贝 int add10(int a) { a 10; return a; } // 指针传参,是一种地址拷贝 void add101(int *a) { // int *…

(11)QWidget的使用(two)

目录 设置窗口图标和标题 设置窗口图标以及获取图标 设置窗口标题以及获取标题 窗口标题的特殊操作 设置窗口的状态 设置窗口的不透明度 设置窗口的状态 使用封装好的函数显示窗口 设置窗口标志 窗口标志简介 设置窗口图标和标题 设置窗口图标以及获取图标 void se…

Java在远程方法调用中运用反射机制

本案例将介绍反射机制在网络编程中的应用,实现如何在客户端通过远程方法调用服务器端的方法。 假定在服务器端有一个 HelloService 接口,该接口具有 getTime() 和 echo() 方法,具体代码如下: import java.util.Date; public int…

【C语言航路】第十一站:字符串、字符和内存函数

目录 一、字符串函数 1.strlen (1)strlen的库函数文档 (2)strlen的模拟实现 (3)strlen的注意事项 2.strcpy (1)strcpy的库函数文档 (2)strcpy的使用以…

如何使用机器学习进行图像识别|数据标注

什么是图像识别?图像识别是一种用于识别图像中的对象并将其分类为特定类别的机制,基于人类识别不同图像集中对象的方式。图像识别如何为人类工作?当我们看到一个物体或图像时,作为人类,我们能够立即准确地知道它是什么…

浅谈STL——适配器

一、适配器(Adapters) 它是一种设计模式,为STL中能够将一个类的接口转化为用户更加想要使用的接口,适配器就扮演者轴承、转换器的功能 就是一个wrapper的模式,将要修饰的接口进行二次包装,展露出可以更容…

紧急事故的流程管理

嵌套式职责分离 在事故处理中,让:每个人清楚自己的职责是非常重要的。有点反直觉的是,明嘶职费反而能够使每个人可以更独立自主地解决问题,因为他们不用怀疑和担心他们的同事都在干什么。 如果一个人目前要处理的事情大多了&…

[TPAMI 2022] 用深度神经网络解决欠定问题——考虑鲁棒性?

Solving Inverse Problems With Deep Neural Networks – Robustness Included?https://ieeexplore.ieee.org/abstract/document/9705105摘要在过去的五年中,深度学习方法已经成为解决各种反问题的最先进方法。在此类方法可以应用于安全关键领域之前,必…

2022年度总结和展望2023年

文章目录 前言 2022年的成就总结 2023年的行动目标 如何完成这些目标? 前言 从2018年更新CSDN第一篇的博文,我就和CSDN产生联系。当时想法很纯粹,就是将积累的知识写成文章,无论去到哪里都能查到,所以前面三年都是…

Python实现预测客户是否会购买房车险源码+数据集,基于伯努利朴素贝叶斯预测客户购买房车险源码,Python预测客户购买房车险

伯努利朴素贝叶斯预测客户购买房车险 根据2000年数据挑战赛保险公司的客户特征数据,预测客户是否会购买房车险。 使用伯努利朴素贝叶斯模型,我获得了更好的预测效果 完整代码下载地址:Python实现预测客户是否会购买房车险源码数据集 数据集…

中国化工发展的新态势

顺势而为的企业才可能有好的未来,在一年之初,回顾总结一下中国化工行业的发展态势,对企业认清形势,确定企业的行业发展方向和发展战略至关重要。 自2022年以来,中国快速增长的化工行业按收入计算一直是世界上最大的&am…

【Java、Redis】通过中心经纬度与半径获取范围内的结果集(类似附近的人)

文章目录需求解决方案什么是Redis GeoHashJava实现InitEquLongLatTask.javaControllerservicexml sql语句引用的pom依赖需求 通过百度地图的覆盖物功能,用户在页面上画圈选定某个区域,前端传输中心点经纬度与半径给后端,后端需要返回位置在圈…