CVPR 2023 | UniMatch: 重新审视半监督语义分割中的强弱一致性

news2024/11/27 4:34:44

在这里和大家分享一下我们被CVPR 2023录用的工作"Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic Segmentation"。在本工作中,我们重新审视了半监督语义分割中的“强弱一致性”方法。我们首先发现,最基本的约束强弱一致性的方法FixMatch[1](proposed three years ago in 2020)即可取得与当前SOTA相当的性能。受此启发,我们进一步拓展了FixMatch的扰动空间,以及利用双路扰动更充分地探索原扰动空间。

我们最终的方法UniMatch十分简单有效,在自然图像 (Pascal VOC, Cityscapes, COCO),遥感影像变化检测 (WHU-CD, LEVIR-CD),以及医学影像 (ACDC)上均取得了远远优于以往方法的结果。我们开源了所有场景下的代码和训练日志,以方便大家更好的复现,也希望能作为大家的baseline。
在这里插入图片描述
文章链接(此为CVPR camera-ready版本,和arXiv-V1相比,我们增加并更新了部分实验结果):

https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2208.09910

代码及实验日志链接:

https://link.zhihu.com/?target=https%3A//github.com/LiheYoung/UniMatch

我们也整理了一份半监督语义分割的awesome list:

https://link.zhihu.com/?target=https%3A//github.com/LiheYoung/UniMatch/blob/main/docs/SemiSeg.md

Background

半监督语义分割希望利用尽可能少的有标注图像以及大量的无标注图像来学得一个较好的分割模型。其中,对有标注图像的学习一般类似于全监督语义分割(计算预测结果与人工标注之间的交叉熵损失),问题的关键在于如何利用无标注图像。

在这里插入图片描述

Observations

当把上述十分简单的FixMatch复现到半监督语义分割中时,我们发现在多个settings上,FixMatch都可以取得和当前的SOTA方法接近甚至明显更优的结果,对比结果如下:
在这里插入图片描述
于是我们进一步对FixMatch的核心模块,即强扰动部分,进行了消融实验,如下表所示。我们发现在半监督语义分割任务中,强扰动对于FixMatch也至关重要。我们默认采用的强扰动包括color jitter, blur, grayscale以及CutMix,当移除所有的这些强扰动时 (w/o any SP),FixMatch性能变得极差;此外,之前的一些方法如CPS[3]仅采用CutMix这单一的强扰动策略,然而我们发现当只用CutMix时 (w/ CutMix),相比于用全部的强扰动 (w/ whole SP),性能也有明显的下降。

FixMatch中强扰动 (Strong Perturbations, SP)的重要性
在这里插入图片描述

Our UniMatch

Unified Perturbations (UniPerb)
根据上述结果,强扰动可以带来极大的性能增益。然而,FixMatch只在输入空间(图像)上进行了强扰动,因此我们提出进一步去扩展FixMatch的扰动空间,增加了一个训练分支来进行特征空间上的强扰动,如下图(a)所示。
在这里插入图片描述
需要说明的是,也有一些工作如PS-MT[4]同时进行了图像和特征上的强扰动,然而他们将这些强扰动施加在了同一个分支中,导致学习的难度过大;而我们将不同性质的强扰动分离到不同的分支分别进行学习,我们在消融实验中说明了这种做法的优越性。此外我们也展示了相比于一些特征扰动的工作如VAT[5],我们的特征Dropout策略更简单有效。

Dual-stream Perturbations (DusPerb)

在这里插入图片描述

Overall UniMatch

在这里插入图片描述

Experiments

与SOTA方法的比较:Pascal VOC 2012
Pascal VOC 2012中一共包括10,582张训练图像,覆盖21个类别。其中有1,464张图像的标注质量比较高。因此有三种不同的选择标注图像的策略:(1)从1,464张精标注图像中选择;(2)从10,582张图像中随机选择;(3)优先从1,464张精标注中选择,如果需要更多的有标注图像,则从剩余的粗标注图像中选择。结果如下所示,在各种选择策略、数据划分、backbone下,我们的方法均取得了最优的性能。

第一种数据划分下的结果:

在这里插入图片描述
第二种(w/o )、第三种(w/ )数据划分下的结果:
在这里插入图片描述
与SOTA方法的比较:Cityscapes
Cityscapes中一共包含2,975张训练图像,覆盖19个类别。
在这里插入图片描述
与SOTA方法的比较:COCO
遵循已有工作PseudoSeg[8],我们这里采用的是COCO-Things数据集(不包含Stuff类别),一共包含81个类别,118,287张训练图像。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1028946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

docker部署nginx下日志自动切割方法

前言:nginx采用docker部署,简单方便,但出现一个问题,就是日志没有自动切割,导致access.log 无限增大。如果非docker安装,则nginx的日志默认有切割的,那docker为何没有呢,最后发现&am…

科普:什么是视频监控平台?如何应用在场景中?

随着科技的发展,监控无处不在,就像一张密不透风的网,将生活中的角角落落都编织在一起。可是,你真的知道什么是安防视频监控平台吗?它可不止是一个简单的通电摄像头,如今的视频监控平台,涵盖了无…

挂件板死机刷固件

用ESP32-DevKitC_V4刷固件的工具flash_download_tool_3.9.5.exe 挂件板子端口接线依次为V(接3V3)、R(接TXD)、T(接RXD)、G(接GND)、L(悬空) 1.选择ESP8266&…

C# ORM框架,freesql,mysql数据库

使用C# freesql技术查询mysql数据库环境搭建 开发环境:vs2022 .NET框架:.NET4.0(winform) 开发环境搭建步骤: 1.在nuget包中搜索:FreeSql.Provider.MySql,并点击安装 2.在后台编写连接数据库…

【UE 粒子练习】07——创建动画拖尾类型粒子

效果 步骤 1. 将动画序列“Idle_ModifyBones”添加到场景中 2. 新建一个材质,命名为“Mat_AnimTrails” 材质混合模式设置为半透明,着色模型设置为无光照,设置材质为双面 材质节点如下 3. 新建一个粒子系统,命名为“P_AnimTrail”…

ChatGLM 大模型炼丹手册-参数微调

序言 回顾上一篇( 大模型炼丹手册-理论篇)的内容,大模型的整个训练流程,分为预炼、精炼和强炼三个阶段,并具有以下特点: 预炼:需要海量灵材、真火,炼制时间长,非豪门巨富难以承受;精炼:仅需少量灵材、真火即可完成,炼制时间短,性价比高;强炼:炼制过程复杂、炼制…

《Linux操作系统实战》| 面试了两个实习生,Linux 基本命令都不会(一)

😄作者简介: 小曾同学.com,一个致力于测试开发的博主⛽️,主要职责:测试开发、CI/CD 如果文章知识点有错误的地方,还请大家指正,让我们一起学习,一起进步。😊 座右铭:不想…

ITIL是什么?

ITIL是什么? 1. ITIL是什么?2. ITIL 4个版本2.1 ITIL V1 - 关注IT基础架构的管理2.2 ITIL V2 - 以流程为核心(5个服务支持流程和5个服务交付流程)2.3 ITIL V3 - 服务生命周期2.4 ITIL 4 - 最新版本,强调价值创造2.5 IT…

Spring Cloud Alibaba Nacos 2.2.3 (3) - 集群 部署

1,根据 [下载与数据库配置] 配置好数据源(https://blog.csdn.net/ai_lian_shuo/article/details/133130249) 2,复制安装包多份,由于Nacos 服务之间通过 Raft 算法保证一致性,所以 Nacos 部署的节点数最好设置为>3 的奇数 3&a…

用于准确量化颅面对称性和面部生长的 3D 头影测量方案(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

面试第一个进去会不会当炮灰?

首先要说的就是,面试时第一个进入房间并不一定会成为“炮灰”,因为面试官会对你的面试表现进行综合评估,而不仅仅是因为你比其他面试者更早进入房间。因为在面试过后都会给上一个求职者打分,所以不存在说前面进去的就会被面试官打…

Kafka-UI

有多款kafka管理应用,目前选择的是github上star最多的UI for Apache Kafka。 关于 To run UI for Apache Kafka, you can use either a pre-built Docker image or build it (or a jar file) yourself. UI for Apache Kafka is a versatile, fast, and lightweight…

Tungsten Fabric Rabbitmq故障处理

开源SDN软件Tungsten Fabric(以下简称TF)有时莫名其妙出现服务宕机情况。 使用TF自带工具contrail-status排查,多数时候是rabbitmq出现宕机,或者某个组件连接rabbitmq出错。 本次仅排查、处理rabbitmq问题。 1. 查rabbitmq日志发…

python进程和线程(05)

python进程和线程(05) 文章目录 python进程和线程(05)1 python进程和线程1.1 进程和线程概念1.2 并行执行1.3 核心使用语法_threading模块1.4 多线程编程1.4.1 案例单线程不能满足情况如下:1.4.2 多线程1.4.2.1 多线程创建语句1.4.2.2 案例 1.4.2 多线程传参使用1.4…

电影格式怎么转换mp4?电影格式转换教程

电影格式怎么转换mp4?平时喜欢看电影的小伙伴都知道,平时我们下载到的电影文件格式可谓是五花八门,如Mp4、Flv、AVI、WMV、MKV、MOV等。然而,相较于其他常用格式,MP4是一种使用最为广泛的视频格式,并且文件…

echarts另外存为图片

今天同事画了个Echarts,我看了下居然有下载功能!!!!(之前一直不知道) 这是原图,右上角有个下载功能, 下载后是这样的 貌似是没有了y轴的参数和x轴的参数,估计是可以配置的…

解决报错:Error:digital envelope routines::unsupported

antDesignPro版本:5.2.0 包管理工具:pnpm 本地pnpm dev(用的node版本为18,18.15.0)运行AntDesignPro后台项目时,控制台报错,截图如下。 解决方法:使用的node版本过高导致&#xff0…

ChatGPT批量写作文章软件

什么是ChatGPT批量写作文章。简单来说,它是一种使用ChatGPT技术的方法,可以帮助您批量生成各种类型的文章和内容。无论您是需要新闻报道、博客文章、产品描述、社交媒体帖子还是其他类型的内容,ChatGPT都能满足您的需求。它可以在极短的时间内…

利用亚马逊 云服务器 EC2 和S3免费套餐搭建私人网盘

网盘是一种在线存储服务,提供文件存储,访问,备份,贡献等功能,是我们日常中不可或缺的一种服务。很多互联网公司都为个人和企业提供免费的网盘服务。但这些免费服务都有一些限制,比如限制下载速度&#xff0…

微信成绩查询

在现代教育中,教师经常需要发布学生成绩,并方便学生查询。为了提高效率和便利性,开发一个微信学生成绩查询发布系统是一种不错的选择。本文将介绍如何开发这样一个系统,使教师能够轻松管理学生成绩,并让学生方便地查询…