【论文速递】WACV2022 - 从边界框标注学习小样本分割

news2025/1/13 22:10:49

【论文速递】WACV2022 - 从边界框标注学习小样本分割

【论文原文】:Learning Few-shot Segmentation from Bounding Box Annotations

获取地址:https://openaccess.thecvf.com/content/WACV2023/papers/Han_Learning_Few-Shot_Segmentation_From_Bounding_Box_Annotations_WACV_2023_paper.pdf

博主关键词: 小样本学习,语义分割,弱监督,原型学习

推荐相关论文:

- 无

摘要:

**我们提出了一种新的弱监督小样本语义分割设置和一种元学习方法来应对新的挑战。**与现有设置不同,我们利用边界框标注作为元训练阶段的弱监督信号,即更有效的标签。包围框提供了比分割掩码更有效的标签表示,但包含感兴趣的对象和令人不安的背景。我们首先表明,使用包围框的元训练降低了最近的few-shot语义分割方法,这些方法通常是具有完整语义分割监督的元训练。我们假设这种挑战源于边界框表示的不纯信息。我们提出了一个伪三分图估计器和基于三分图注意的原型学习,以从包围框中提取更清晰的监督信号。这些发展增强和推广了我们的方法抵抗测试时支持掩模的噪声。我们的经验表明,我们的方法不断提高性能。在Pascal-5i上的1-way 5-shot设置下,我们的方法在完全测试监督情况下和弱测试监督情况下分别比其他方法获得1.4%和3.6%的平均iou提升。

简介:

语义分割任务的目的是根据语义相似度对图像中的像素区域进行聚类。它是计算机视觉及其应用中的一项基本的视觉场景理解技术。由于卷积神经网络的发展,相对于手工设计[23],语义分割的性能有了明显的提高。尽管如此,在实现场景理解的终极通用智能方面仍然存在两个挑战。首先,神经网络需要大量数据。此外,获得高质量的分割标记的成本远高于图像级注释其次,标准的语义分割任务只处理预定义的类,即闭集问题。然而,在现实场景中有许多看不见或不确定的对象类,这些可能会更严重地影响系统在场景理解之后的成功。用高质量的分割标签来增加类的多样性不是一个解决方案,而且根本不可能,因为现实世界中有无限数量的语义类[30]。

few-shot学习(FSL)技术的发展可以应对这些挑战。FSL努力训练或适应模型的目标任务,例如,分类和分割,只有几个样本。为了推广到具有新类的小样本测试,小样本学习者通常通过解决合成的小样本测试集来进行元训练,即情景学习[32]。许多小样本分割[8,22,34,36]也遵循相同的方案。在以前的作品中,一个集是由支持集和查询集以及这些分割注释组成的。然后,在给定支持集的情况下,训练小样本分割方法对查询集进行分割。然而,从注释效率的角度来看,短语“少数”可能具有误导性。虽然在测试期间,小样本分割确实需要一些{图像,分割掩码}对,但在元训练期间,仍然需要相同级别的大规模完整分割注释来模拟测试时间片段。这很难减少昂贵的注释的必要性。

基于上述观察,在这项工作中,**我们提出了一种新的弱监督元训练方法,用于从边界框注释中进行小样本语义分割,这在以前没有得到充分的研究。最近,不同的弱监督小样本语义分割任务被提出[27,30,34,39]。他们在推理阶段使用弱标签,但在元训练阶段仍然使用大量的分割掩码。相反,我们专注于解决大规模弱监督数据集元训练期间的过多的标签成本。**元训练阶段比推理阶段需要更多的分割掩码。由于分割标签注释成本特别高,在元训练中用弱的分割标签替换分割注释可以显著降低注释成本。因此,在注释负载方面,这比现有技术实现了低成本的学习。

特别是,我们利用边界框作为元训练中的弱监督。在弱监督领域中,常用的弱标签是图像级标签。然而,最近的研究[6]指出了基于弱监管的本地化问题的病态性。在没有定位信息的情况下,如果类信息与背景信息的相关性大于感兴趣的对象,神经网络很可能会关注背景信息,从而导致定位失败。也就是说,图像级标签可能不足以获得足够的监督信号,特别是在具有挑战性的小样本学习设置中。与分割掩码相比,包围框的注释工作量要小得多,并且包含语义分割[15]所必需的本地化信息;因此是图像级和分割标签之间的一个很好的折衷。

然而,直接利用边界框会干扰小样本分割的学习。我们实验表明,在元训练期间,在带有边界盒的原型学习场景中,对新类的分割性能下降。我们假设性能下降的原因源于包含在边界框中的背景像素。**受污染的信息通过支持原型和查询标签传播,导致性能下降。为此,我们提出了伪三分图估计器和基于三分图注意的原型学习,将边界盒内的不确定区域排除在学习之外,以处理元训练过程中边界盒注入的噪声。**通过大量的实验,我们发现我们的方法在各种设置下一致地提高了小样本语义分割的性能。这证明了我们的方法可以有效地净化边界框,并在元训练中学习更准确的原型。此外,由于我们的方法提出了一个弱监督的元训练方案,我们的模型可以适应完全监督和弱监督的测试设置。

在这里插入图片描述

Fig. 1. 我们模型的概述。我们的目标是从边界框注释中学习小样本语义分割。在每个训练集中,支持掩码和查询标签都被包围框取代。提出了伪三分图估计器和三分图注意模块,从不纯信息中获得鲁棒原型,并排除损失计算中的不确定区域。

【社区访问】

img 【论文速递 | 精选】

img阅读原文访问社区

https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/171626.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Word文档和PDF文件如何互相转换?

工作中,有时候我们需要把Word转换成PDF格式,转换后不但更美观、专业,也可以防止文档被修改。 那Word文档如何转换成PDF文件呢?其实在Word里面就可以直接转换。 文档编辑好后,在菜单中点击【文件】选项,然…

搭建 Go 语言的开发环境(文末附视频讲解)

从本小节开始,我们就要正式动手实践了。 类比现实生活,我们若要钉钉子,就需要准备锤子;想要烧菜,就需要准备灶具和食材…… 类似地,若要在电脑上编写 Go 语言程序,便要先配置开发环境。 下载和…

干货 | 互联网广告数据的匿名化方案研究

以下内容整理自清华大学《数智安全与标准化》课程大作业期末报告同学的汇报内容。第一部分:背景介绍一、匿名化必要性互联网广告具有非常重要的商业价值,同时也是涉及数据处理十分密集的行业,出现了操作规范化、个人信息保护和商业数据安全等…

[GXYCTF2019]禁止套娃(无参数RCE)

目录 信息收集 知识讲解 涉及函数 PHP的正则表达式 无参rce 用到的函数 思路分析 方法一 方法二 信息收集 拿到这道题,抓包看了看,啥也没有,用dirsearch爆破目录发现.git目录,猜测存在.git源码泄露,用githac…

Web Spider XHR断点 堆栈跟值 逆向案例(四)

声明 此次案例只为学习交流使用,抓包内容、敏感网址、数据接口均已做脱敏处理,切勿用于其他非法用途; 文章目录声明前言一、任务说明二、网站分析三、XHR断点调试,扣JS加密代码四、代码实现1、JS加密代码:encode.js2、…

安卓逆向:基础入门(一)

前言随着app的广泛应用,使用过程中,难免会遇到些很不友好的功能,比如:游戏充值、间断性弹窗广告、续费解锁下一回等等。而随之会产生如何将这些功能取消掉,而Android逆向就可以做到,纵向丝滑。当然这只是安…

Kinect与TOF、双目、结构光相机比较相机国产、非国产统计参数对比分析

Kinect与TOF、双目、结构光相机比较相机国产、非国产统计参数对比分析 Kinect v1和Kinect v2之间的参数比较 从图中可以看出,Kinect v2的表现比Kinect v1要好得多:首先最令人印象深刻的是分辨率的提高,v2达到了1080p,甚至视野也大…

JavaWeb | JDBC概述及IDEA连接MySQL

本专栏主要是记录学习完JavaSE后学习JavaWeb部分的一些知识点总结以及遇到的一些问题等,如果刚开始学习Java的小伙伴可以点击下方连接查看专栏 本专栏地址:🔥JavaWeb Java入门篇: 🔥Java基础学习篇 文章目录一、前言二…

java基础学习 day36(字符串相关类的底层原理)

字符串存储的内存原理 直接赋值会复用字符串常量池中已有的new出来的不会复用,而是开辟一个新的空间来创建 “”号比较的到底是什么 基本数据类型比较数据值引用数据类型比较地址值 PS. 所以以后对引用数据类型,不要用“”,改用.equals()…

RS485接线方式小科普

欢迎来到东用知识小课堂!RS-485采用平衡发送和差分接收方式实现通信:发送端将串行口的ttl电平信号转换成差分信号a,b两路输出,经过线缆传输之后在接收端将差分信号还原成ttl电平信号。RS-485总线网络拓扑一般采用终端匹配的总线型…

【Linux】基于 Pintos 实现新的用户级程序的系统调用 | 冯诺依曼架构

💭 写在前面:本章我们首先会明确冯诺依曼体系结构的概念,旨在帮助大家理解体系结构在硬件角度去理解数据流走向的问题。理解完之后我们再去谈操作系统,这个在之前的章节已经有所铺垫,当时我们只讲解了操作系统是什么&a…

车载以太网 - 车辆信息和车辆声明 - 09

到今天这一篇,对于ISO 13400 - 2的DoIP协议介绍就完事了,对DoIP协议的规范介绍基本已经全部包括了,无论是我们作为软件开发人员还是测试人员,了解这部分内容基本就能够满足这块基础的开发要求,大家如果在研究或者学习这块内容的时候有什么问题欢迎私聊;并且在本篇文章结束…

Nginx使用(四)动静分离实例

一、简介Nginx动静分离简单来说就是把动态跟静态请求分开,不能理解成只是单纯的把动态页面和静态页面物理分离。严格意义上说应该是动态请求和静态请求分开,可以理解成使用Nginx处理静态页面,Tomcat处理动态页面,动静分离从目前实…

Linux系统安装Redis

我这里以CentOS7为例 VMware安装完centOS7之后 1.首先开启网络: 查看ip的命令不是传统的ifconfig或者ipconfig而是ip address 刚安装完使用ip address查看的时候会发现没有ip地址,这里需要修改设置启动网卡 vi /etc/sysconfig/network-scripts/ifcf…

英语学习打卡day1

2023.1.19 重点单词 1.speculation n.推测,投机 speculate v. speculative adj. spectate v.看 spectator inspect 检查(往里看) aspect 外观(看一眼) 2.literally adv.(强调事实可能令人惊讶)真正地,…

5.JAVA基础入门必备

文章目录前言一、数据类型二、标识符三、键盘录入四、IDEA中的第一个代码五、IDEA中的设置六、IDEA的项目和模块操作总结前言 一、数据类型 重点记忆byte的取值范围!! 不同类型数据的打印: public class VariableDemo3{//主入口public static void main(String[] args){//byt…

FrameBuffer 应用

1.Frame 是帧的意思, buffer 是缓冲的意思,所以 Framebuffer 就是帧缓冲。Framebuffer 就是一块内存,里面保存着一帧图像。帧缓冲(framebuffer)是 Linux 系统中的一种显示驱动接口,它将显示设备&#xff08…

技术写作指南。 坚持不下去,怎么办?(文末附视频)

“坚持不下去,怎么办?”这是很多人会遇到的问题,不仅仅是技术写作,任何需要耗费额外精气神的事情都无法长期坚持,例如运动健身、专业学习等。 这里分享一点自己的经验与看法,希望可以对大家的学习有所帮助…

Y9000P Ubuntu/Windows 双系统安装

一:配置介绍 Y9000P默认系统Win11,系统盘500G,从盘2T,内存32G,显卡3060 二:Windows系统分盘 系统盘(磁盘1)建议通过压缩卷分出300M作为Ubuntu的引导分区。 从盘(磁盘2…

23种设计模式(十一)——生成器模式【对象创建】

文章目录 意图什么时候使用生成器真实世界类比生成器模式的实现生成器模式的优缺点亦称:建造者模式、Builder 意图 生成器模式是将一个复杂对象的构建与它的表示分离,使得同样的构建过程可以创建不同的表示。 换成大白话理解就是:一个复杂的对象,它的创建过程和使用过程要…