连续语义分割(CSS)24种最新经典方法汇总,包含数据回放、自监督、正则化等5个细分方向

news2024/11/18 13:45:16

连续语义分割(CSS)是计算机视觉中的一个新兴领域,其基本任务是在某一时刻学习预测特定类别的图像分割,并在随后需要的时候连续增加学习类别的数量,同时保持对已有类别的分割能力。这个过程中需要解决的主要挑战包括灾难性遗忘和语义漂移。

为解决以上问题,我们根据是否需要存储旧数据,将当前的CSS分为基于回放的方法和不依赖旧数据的方法2大类。我这次就从这两类入手,帮同学们整理了24种连续语义分割方法,并且细分了5个小方向,包含数据回放、自监督、正则化等。

每种方法的论文原文以及代码都附上了,另外我还整理一部分连续语义分割通用数据集需要的同学看文末

基于回放的方法

代表性数据回放

1.Ssul: Semantic segmentation with unknown label for exemplar-based class-incremental learning

基于样例的类增量学习的未知标签语义分割

「方法简述:」论文提出了一个针对类增量语义分割问题的新方法SSUL-M。该方法旨在解决导致灾难性遗忘的关键挑战,包括背景类的语义漂移和多标签预测问题,主要有三个贡献:1) 在背景类中定义未知类以帮助学习未来类;2) 通过冻结主干网络和过去的分类器,克服灾难性遗忘;3) 在CISS中首次利用小型样例内存,提高可塑性和稳定性。实验表明,该方法在标准基准数据集上取得了显著优于最新最先进基线的性能。

2.Continual semantic segmentation with automatic memory sample selection

自动记忆样本选择的连续语义分割

「方法简述:」CSS通过逐步引入新类别来持续改善模型性能,为了缓解灾难性遗忘问题,作者提出了一种新的记忆样本选择机制,自动选择信息丰富的样本进行有效的重放。该方法考虑了全面的因素,包括样本多样性和类别表现等,并通过学习最佳选择策略来最大化验证性能奖励集。在Pascal-VOC 2012和ADE 20K数据集上进行的实验表明,该方法具有最先进的性能,比第二名高出12.54%。

3.Rethinking exemplars for continual semantic segmentation in endoscopy scenes: Entropy-based mini-batch pseudo-replay

4.Improving replay-based continual semantic segmentation with smart data selection

5.Pin the memory: Learning to generalize semantic segmentation

生成式回放

1.Recall: Replay-based continual learning in semantic segmentation

基于回放的连续语义分割方法

「方法简述:」Deep networks在语义分割任务中表现优异,但需要大量数据进行一次性训练。连续学习设置(新类别以增量步骤学习,先前的训练数据不再可用)具有挑战性,因为存在灾难性遗忘现象。现有的方法通常无法处理多个增量步骤或背景类别分布转移的情况。作者提出了一种名为RECALL的方法,通过重新创建旧类别的数据和使用网络爬行数据来获取重放数据,解决了这些问题。

2.Prototype-guided continual adaptation for class-incremental unsupervised domain adaptation

类增量无监督域适应的原型引导连续适应

「方法简述:」本文研究了一个新问题:类增量无监督域适应(CI-UDA),即源域包含所有类别,但目标域中的类别是顺序增加的。由于源和目标标签集不一致,以及对之前知识的遗忘,该问题具有挑战性。为此,作者提出了一种新的ProCA方法,包括标签原型识别和基于原型的对齐和回放。通过这两种策略,ProCA能够有效地将源模型适应于类增量无标签的目标域。

3.Alife: Adaptive logit regularizer and feature replay for incremental semantic segmentation

4.Diffusepast: Diffusion-based generative replay for class incremental semantic segmentation

5.Dynamic prototype convolution network for few-shot semantic segmentation

不依赖旧数据的方法

基于自监督

1.Continual semantic segmentation via repulsion-attraction of sparse and disentangled latent representations

通过稀疏和松散的潜在表示的排斥-吸引实现连续语义分割

「方法简述:」论文研究了在语义分割中进行类别增量连续学习的问题,即在不保留先前训练数据的情况下,随时间提供新的类别。所提出的连续学习方案通过整形潜在空间来减少遗忘并提高对新类别的识别。该方法包括三个新颖组件:原型匹配、特征稀疏化和对比学习。这些组件可以很容易地结合到现有技术中。实验结果表明,该方法在Pascal VOC2012和ADE20K数据集上非常有效,比现有方法表现更好。

2.Uncertainty-aware contrastive distillation for incremental semantic segmentation

用于增量语义分割的不确定性感知对比蒸馏方法

「方法简述:」论文介绍了一个解决深度学习中灾难性遗忘问题的新方法,称为不确定性感知对比蒸馏。该方法通过引入新的蒸馏损失,强制相同类别的像素特征相似,并使不同类别的像素特征分离。此外,新模型的特性与前一个增量步骤中学到的冻结模型的特性进行对比,以缓解灾难性遗忘。实验表明,该方法可以提高在增量语义分割基准上的性能。

3.Sats: Self-attention transfer for continual semantic segmentation

4.Prototype-based Incremental Few-Shot Semantic Segmentation

5.A contrastive distillation approach for incremental semantic segmentation in aerial images

基于正则化

1.Modeling the background for incremental learning in semantic segmentation

语义分割中增量学习的背景建模

「方法简述:」论文针对语义分割中的灾难性遗忘问题提出了一种新的基于蒸馏的方法。该方法考虑了背景类的特殊性质,通过显式地考虑语义分布的转移来提高增量学习的效果。同时,作者还提出了一种初始化分类器参数的策略,以防止对背景类的有偏预测。在Pascal-VOC 2012和ADE20K数据集上的实验表明,该方法比现有的增量学习方法表现更好。

2.Plop: Learning without forgetting for continual semantic segmentation

用于连续语义分割的无遗忘学习

「方法简述:」本文提出了一种名为Local POD的多尺度池化蒸馏方案,用于解决语义分割中的连续学习问题。该方法通过保留特征层面上的长范围和短范围空间关系来防止灾难性遗忘。此外,作者还设计了一种基于熵的背景伪标签生成方法,以处理背景转移并避免旧类别的灾难性遗忘。该方法被称为PLOP,在现有的CSS场景中以及新提出的具有挑战性的基准测试中表现出色,优于现有的最佳方法。

3.Representation compensation networks for continual semantic segmentation

4.Inherit with distillation and evolve with contrast: Exploring class incremental semantic segmentation without exemplar memory

5.Advancing incremental few-shot semantic segmentation via semantic-guided relation alignment and adaptation

基于动态结构

1.Decomposed knowledge distillation for class-incremental semantic segmentation

分解知识蒸馏用于类增量语义分割

「方法简述:」论文提出了一种名为分解的知识蒸馏(DKD)的框架,用于类增量语义分割。该方法通过将分类器的logit分解为两个项来减轻遗忘问题,并有效地学习新类别。该框架还引入了一种新颖的初始化方法,用于训练新分类器以识别新类别。此外,该方法使用辅助分类器将负面样本知识逐步转移到分类器中,以解决新类别数量不足的问题。在标准CISS基准测试上的实验结果表明,该方法非常有效。

2.Attribution-aware weight transfer: A warm-start initialization for class-incremental semantic segmentation

3.Dynamic extension nets for few-shot semantic segmentation

4.Deep model reassembly

通用数据集

1.The pascal visual object classes challenge: A retrospective

PASCAL视觉对象类挑战赛

「简述:」Pascal视觉对象类(VOC)挑战赛是一个包括公开可用的图像数据集、真实标注和标准化评估软件的比赛和研讨会。挑战赛有五个方面:分类、检测、分割、动作分类和人物布局。本文回顾了2008年至2012年的挑战赛,并介绍了几种新颖的评估方法来分析提交算法在VOC数据集上的性能。

2.Scene parsing through ade20k dataset

通过ADE20K数据集进行场景解析

「简述:」本文介绍了一个名为ADE20K的图像数据集,该数据集包含各种场景、物体和物体部分的详细注释。基于ADE20K数据集,作者构建了一个包含150个物体和物体部分类别的场景解析基准测试,并评估了几种分割基线模型。作者提出了一种名为级联分割模块的新网络设计,用于将场景解析为物体、物体部分和物体部分。进一步展示了训练好的场景解析网络可以应用于图像内容去除和场景合成等应用。

3.Playing for data: Ground truth from computer games

4.The synthia dataset: A large collection of synthetic images for semantic segmentation of urban scenes

5.The cityscapes dataset for semantic urban scene understanding

6.Semantickitti: A dataset for semantic scene understanding of lidar sequences

7.Isprs test project on urban classification and 3d building reconstruction

8.Multimodal remote sensing benchmark datasets for land cover classification with a shared and specific feature learning model

9.Mcanet: A joint semantic segmentation framework of optical and sar images for land use classification

关注下方《学姐带你玩AI》🚀🚀🚀

回复“连续语义分割”获取论文+代码+数据集

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1338409.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java虚拟机知识点总结

总结黑马程序员笔记 Java运行时数据区域 可以分成线程私有的和线程共享的区域。 线程私有的区域有:虚拟机栈,本地方法栈,程序计数器 线程共享的区域有:堆,方法区(在JDK1.8中,方法区放在了本…

【验证概括 SV的数据类型_2023.12.18】

验证概括 验证的过程是保证芯片实现符合规格说明书(Specification,spec)的过程 验证的两项任务: RTL sim:前仿真,验证功能 GLS-Gate (Level Simulation):后仿真,验证功能和时序 验…

JDK 14全景透视:每个Java开发者必知的新特性

欢迎来到我的博客,代码的世界里,每一行都是一个故事 JDK 14全景透视:每个Java开发者必知的新特性 前言:switch表达式标准化Switch表达式成为正式特性的意义:如何使用Switch表达式:注意事项: ins…

【PostGIS】在Java中操作postgis——使用springboot+Maven+mybatis框架

前言: PostgreSQL15对应PostGIS安装教程及空间数据可视化 空间数据库-常用空间函数 完成PostGIS的安装与配置后,让我们来写一个Java操作postgis数据库的demo吧~ 使用工具: NavicatIDEA 一、PostGIS数据库准备 在Navicat中新建一个postgr…

前端Vue进阶

Vue进阶 当你熟悉了Vue.js的基本概念和用法后,可以继续深入学习Vue.js的进阶内容。以下是一些Vue.js的进阶主题,可以帮助你更好地理解和应用Vue.js。 组件通信 Vue.js提供了多种方式来实现组件之间的通信。除了父子组件之间的通信,还有兄弟…

python降低图像的空间分辨率——冈萨雷斯数字图像处理

原理: 降低图像的空间分辨率意味着减少图像中可见的细节,使图像变得模糊或粗糙。这可以通过减少图像的像素数量或改变像素的排列来实现。以下是一些降低图像空间分辨率的常见原理和方法: 下采样(Subsampling)&#xf…

多功能演示工具ProVideoPlayer2 mac特色介绍

ProVideoPlayer2 mac是用于大多数任何生产的首选多功能演示工具。ProVideoPlayer 2是一种动态视频播放和处理媒体服务器,可将视频映射(包括播放和实时视频输入)实时控制到一个或多个输出。包括实时效果,调度,网络同步和…

Spring中常见的Bean后处理器

Bean后处理器的作用:为Bean生命周期各个阶段提供扩展。接下来我们查看一个案例 public class TestBeanPostProcessor {public static void main(String[] args) {//该容器不存在任何Spring中的bean对象,是一个干净的容器,且提供了正常容器中…

<JavaEE> 协议格式 -- 传输层协议 TCP

目录 一、TCP协议格式长啥样? 二、TCP协议属性解释 1)源端口号/目的端口号 2)序号/确认序号 3)TCP报头长度 4)保留位 5)标志位 6)窗口大小 7)校验和 8)紧急指针…

Oracle查询重复数据取第二行,好用来删除重复数据

Oracle查询重复数据取第二行,好用来删除重复数据 SELECT * FROM ( SELECT e.* , ROW_NUMBER() over(PARTITION BY product_category_id,model_size_id ORDER BY product_category_id,model_size_id) rn FROM equ_check_rules e ) s WHERE rn 2;

OSPF单区域配置-新版(11)

目录 整体拓扑 操作步骤 1.基本配置 1.1 配置R1的IP 1.2 配置R2的IP 1.3 配置R3的IP 1.4 配置PC-1的IP地址 1.5 配置PC-2的IP地址 1.6 配置PC-3的IP地址 1.7 检测R1直连链路连通性 1.8 检测R3直连链路连通性 1.9 检测R2直连链路连通性 2. 部署单区域OSPF网络 2.1…

php 不加后缀访问

实现不带后缀访问php文件的方法:首先在htaccess文件中加入内容“RewriteRule ^(api/token) token.php [L]”;然后通过根目录下的“token.php”来接受“api/token”;最后修改配置文件。 考虑的做法有: HTTP重写技术,让…

初探大模型微调

目标:低成本微调大模型,拥有属于自己的AI助手。 一切的一切,都得益于LoRA、QLoRA微调方法,没有A100一样可以微调大模型(用3090 24G显存微调70亿参数的baichuan绰绰有余,甚至参数量小一点的模型3060也能跑&a…

基于电商场景的高并发RocketMQ实战-Broker写入读取流程性能优化总结、Broker基于Pull模式的主从复制原理

🌈🌈🌈🌈🌈🌈🌈🌈 【11来了】文章导读地址:点击查看文章导读! 🍁🍁🍁🍁🍁🍁&#x1f3…

Windows实现MySQL5.7主从复制(详细版)

使用免安装版本(官网下载地址) 在Windows上安装两种MySQL服务并同时开启服务 1.下载配置 打开解压文件所在位置,就新建一个配置文件my.ini。 2.主库安装 主库的my.ini配置文件如下: [mysqld] #设置主库端口,注意须是…

UDP信号多个电脑的信息传输测试、配置指南

最近要做一个东西,关于一个软件上得到的信号,如何通过连接的局域网,将数据传输出去。我没做过相关的东西,但是我想应该和软件连接数据库的过程大致是差不多的,就一个ip和一个端口号啥的。 一.问题思路 多个设备同时连…

释放创造力的终极工具——Adobe Photoshop 2022 Mac/win

作为全球最受欢迎的图像处理软件,Adobe Photoshop一直是专业设计师和摄影师的首选工具。而最新推出的Adobe Photoshop 2022更是在功能和性能上迈出了重要的一步,为用户提供了更强大、更便捷的创作体验。 首先,Adobe Photoshop 2022引入了许多…

html table可编辑表格数据实现删除

这里教大家使用纯html和js脚本结合实现删除表格数据 <!DOCTYPE html> <html> <head><style>table {border-collapse: collapse;width: 100%;}th, td {border: 1px solid black;padding: 8px;text-align: left;}</style> </head> <body…

5G阅信应用场景有哪些?

5G阅信的应用场景非常广泛&#xff0c;以下是一些常见的应用场景&#xff1a; 1.工业自动化&#xff1a;5G阅信可以连接各种工业设备和传感器&#xff0c;实现设备之间的实时通信和控制&#xff0c;提高生产效率和自动化水平。 2.物联网和智能家居&#xff1a;5G阅信可以连接各…

【每日一题】LeetCode206.反转链表

个人主页&#xff1a;白日依山璟 专栏&#xff1a;Java|数据结构与算法|每日一题 文章目录 1. 题目描述示例1示例2示例3提示 2. 思路3.代码 1. 题目描述 给你单链表的头节点 head &#xff0c;请你反转链表&#xff0c;并返回反转后的链表。 示例1 输入&#xff1a;head [1…