基于自适应高斯混合的稀疏注释语义分割

news2025/2/13 18:26:32

文章目录

  • Sparsely Annotated Semantic Segmentation with Adaptive Gaussian Mixtures
    • 摘要
    • 本文方法
      • GMM Formulation
      • Training with AGMM
    • 实验结果

Sparsely Annotated Semantic Segmentation with Adaptive Gaussian Mixtures

摘要

稀疏注释语义分割(SASS)旨在通过具有稀疏标签(即点或涂鸦)的图像来学习分割模型。现有的方法主要侧重于引入低水平的亲和性或生成伪标签来加强监督,而在很大程度上忽略了标记像素和未标记像素之间的内在关系。我们观察到,在特征空间中彼此靠近的像素更有可能共享同一类。
本文方法

  1. 提出了一种新的SASS框架,该框架配备了自适应高斯混合模型(AGMM)。
  2. AGMM可以根据标记和未标记像素的分布,有效地为未标记像素提供可靠的监督。
  3. 首先使用标记像素及其相对相似的未标记像素构建高斯混合,其中标记像素充当质心,用于对每个类别的特征分布进行建模
  4. 然后,我们利用来自标记像素的可靠信息和自适应生成的GMM预测来监督未标记像素的训练,实现在线、动态和稳健的自我监督。
  5. 此外,通过捕获分类高斯混合,AGMM鼓励模型以端到端的对比学习方式学习判别类决策边界。
    代码地址
    在这里插入图片描述
    图1:
    (a) SASS任务说明。
    (b) 与现有的SASS框架不同,我们的AGMM利用标记像素的可靠信息,生成用于动态在线监督的GMM预测。f表示模型,P和G分别表示分割和GMM预测。实线和虚线分别表示模型传播和监督。
    在这里插入图片描述
    图2:
    (a) 观察标记像素和未标记像素之间的固有关系
    (b) PASCAL VOC 2012数据集的分类性能。黑线、蓝条和橙条分别表示所有未标记像素、与标记像素相似的未标记像素和与标记像素不同的未标记的像素的IoU

本文方法

在这里插入图片描述
AGMM的总体框架:
AGMM包含一个主分割分支和一个GMM分支。
给定输入图像x,分割分支直接输出分割预测P
在训练期间,提取的深度特征f(x)被馈送到GMM分支中,以根据等式生成软GMM预测G
使用分割预测P和GMM预测G进行在线自我监督
在测试过程中,GMM分支被丢弃,因为稀疏标签在推理过程中不可用

GMM Formulation

在这里插入图片描述
给定具有K个注释类的输入图像,我们构建具有K个高斯混合分量的GMM。对于第i个高斯混合分量,我们首先计算属于第i类的标记像素xli的平均特征作为平均值µi:
在这里插入图片描述
其中f(x)是像素x的深层特征,其由分割模型的分类层之前的特征产生。一旦获得µi,第i个分量的方差σi可以计算为:

在这里插入图片描述
其中Pi表示第i个类别的分割预测分数,d公式化为:
在这里插入图片描述
其测量标记的像素和未标记的像素之间的距离。类似于等式1和2,然后我们构建GMM来对标记和未标记像素的特征分布进行建模。使用GMM,我们生成GMM预测G,如下所示:
在这里插入图片描述
与典型GMM相比,我们放弃了正则化项1√2πσ2。这样,我们可以保证对于每个类,GMM预测得分gi在0到1的范围内,使我们能够对分割预测P进行自我监督。这些GMM预测G是软得分的形式,表示每个像素x属于哪个类别的高斯混合。

Training with AGMM

给定GMM预测G,我们将它们分配给具有分割预测P的自监督。我们采用交叉熵形式来公式化自我监督损失函数Lself如下:
在这里插入图片描述
然后,我们还分配稀疏标签yl来监督G,如下所示:
在这里插入图片描述
此外,为了学习判别性高斯混合,我们提出了一个对比损失Lcon来扩大不同高斯混合质心之间的距离,如下所示:
在这里插入图片描述
有了这些损失函数,我们使用GMM预测G和分割预测P来相互监督。用于GMM预测G的总损失函数LGM M可以总结如下:
在这里插入图片描述
因此,我们的GMM-SASS框架中的总体损失函数L公式如下:
在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/645474.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

给图片添加水印的最简单方法

给图片添加水印的最简单方法在数字化时代,图片广泛应用于社交媒体、网站、电商平台等各种场景中。然而,由于互联网分享的便捷性,图片的盗用问题也越来越严重。为了保护图片版权,给图片添加水印已经成为一个非常必要和重要的步骤。…

参与赢大奖!阿里云机器学习平台PAI助力开发者激发AIGC潜能

近年来,随着海量多模态数据在互联网的爆炸性增长和训练深度学习大模型的算力大幅提升,助力开发者一站式快速搭建文生图、对话等热门场景应用,阿里云机器学习平台PAI特推出AIGC加油包,为广大开发者加油助力激发AIGC潜能&#xff0c…

OJ管理员如何进行添加题目

OJ系统简介 Online Judge系统(简称OJ)是一个在线的判题系统。用户可以在线提交程序多种程序(如C、C) 源代码,系统对源代码进行编译和执行,并通过预先设计的测试数据来检验程序源代码的正确性。 一个用户提…

手把手教你进行Mysql条件查询操作

关注“Java架构栈”微信公众号,回复暗号【Java面试题】即可获取大厂面试题 从今天开始,健哥会带各位小伙伴开始学习数据库技术,这是Java开发中必不可少的一部分内容,也是非常重要的技术。本系列教程由浅入深,全面讲解数…

CentOS 停服倒计时,如何打造安全好用的 Linux 系统?

导读近年来,操作系统在国内的讨论极其热烈,也备受各方关注,操作系统在开发者圈中的重要性越来越高。毋庸置疑,对于众多的开发者来说,选择合适的操作系统对于开发效率、代码质量和个人发展都有着非常重要的影响。CSDN 作…

【Protobuf速成指南】oneof类型的使用

文章目录 2.3 oneof 类型一、基本认识二、 3.2 oneof相关函数三、Contact2.3 改写 2.3 oneof 类型 本系列文章将通过对通讯录项目的不断完善,带大家由浅入深的学习Protobuf的使用。这是Contacts的2.3版本,在这篇文章中将带大家学习Protobuf的 oneof 语关…

医院监控4大难点如何破解?这个方法太顶了

在医院环境中,许多重要的设备对于病人的诊断、治疗和监护至关重要。为了确保这些设备的正常运行和安全性,动环监控系统可以发挥关键作用。 客户案例 四川某大型综合医院引入了动环监控系统来监控其重要设备,如手术室设备、监护设备和医疗影像…

【Android自动化测试】Ui Automator技术(以对QQ软件自动发说说为例)

文章目录 一、引言二、了解(Android官方文档)1、UiDevice 类2、UI Automator API3、UI Automator 查看器 三、使用1、依赖2、代码 一、引言 描述:UI Automator 是一个界面测试框架,适用于整个系统上以及多个已安装应用间的跨应用…

使用Unity开发一个游戏类型的区块链 [独立区块链]

Arouse Blockchain [Unity独立区块链] 这是一个学习性质的项目,使用了Unity进行独立区块链游戏的开发。使用此项目,将默认你有一定的Unity基础,如果你是Unity小白,可以先学习Unity,B站有大量的教材。 内容列表 项目的状…

【RV1126】按键中断--使用输入子系统事件方式

文章目录 选择GPIO修改设备树修改驱动源码probe:增加外部中断以及定时器服务函数。命令行测试中断确定按键的输入子系统的event使用hexdump命令测试按键实际效果 测试应用程序完整的驱动代码 我使用的是荣品的pro-rv1126。 选择GPIO 结合原理图 决定使用UART1接口 …

SIFT算法分析

引言 尺度不变特征变换(SITF)是传统机器学习算法当中比较难的一个算法,步骤也相对其它传统机器学习算法要更多一些。 使用场景 以上是一个图像拼接的过程,两张图像拼接成一张图,有时候由于镜头限制,不能一…

基于Google breakpad编译构建和使用案例

Googlepad是一款用于程序崩溃时自动生成转储文件(.dmp)的可跨平台开源库。 1.Googlepad代码下载地址: git clone https://chromium.googlesource.com/breakpad/breakpad 如果翻不了墙可以在gitee上下载breakpad模块。 2.Googlepad采用gyp来…

C语言之实用调试技巧(2)

如何写出好(易于调试)的代码 优秀的代码: 1. 代码运行正常 2. bug很少 3. 效率高 4. 可读性高 5. 可维护性高 6. 注释清晰 7. 文档齐全 常见的 coding 技巧: 1. 使用assert 2. 尽量使用const 3. 养成良好的编码风格 4. …

Linux防火墙学习笔记14

firewalld是什么? Firewalld属于动态防火墙,是CentOS7系统中用于对netfilter内核模块用户空间管理工具。 Firewalld仅仅代替了iptables service部分,其底层还是使用iptables作为防火墙规则管理工具。 Firewalld中zone概念及作用&#xff1…

盖茨预言AI助理成标配,AI+RPA打破AI准入高门槛!

根据微软联合创始人比尔盖茨的预测,未来顶级的人工智能公司将会开发一种全新的“个人AI助理”。比尔盖茨表示,“个人AI助理”将会具有出色的功能,可以改变人们的生活方式以及工作方式。无论哪一家公司能够赢得AI助理竞争先机,都会…

耗时半月,终于把CSDN上的Java面试八股文整理成了PDF合集(Java基础+Redis+MySQL+多线程与高并发+JVM+分布式+Spring+微服务)

大家好,最近有不少小伙伴在后台留言,近期的面试越来越难了,要背的八股文越来越多了,考察得越来越细,越来越底层,明摆着就是想让我们徒手造航母嘛!实在是太为难我们这些程序员了。 这不&#xf…

Android:OKHttp

特点 支持HTTP2/SPDYSocket自动选择最好路线,并支持自动重连拥有自动维护的Socket连接池,减少握手次数拥有队列线程池,轻松写并发拥有Interceptors轻松处理请求与响应(比如透明GZIP压缩)实现基于Headers的缓存策略 基…

JDBC Apache—DBUtils 详解(通俗易懂)

目录 一、前言 二、Apache—DBUtils的引入 1.传统使用ResultSet的缺点 : 2.改进方法 : 3.改进方法的模拟实现 : 三、Apache—DBUtils的使用 1.基本介绍 : 2.准备工作 : 3.DBUtils查询(DQL) : 4.query方法源码分析 : 5.DBUtils处理(DML) : 四、总结 一、前言 第六节…

Web3下的去中心化契约

随着Web3的兴起,智能合约成为了这一新兴领域中最为重要的概念之一。智能合约是一种在区块链上执行的可编程代码,其作用类似于传统世界中的合约,但具有更多的灵活性和安全性。本文将介绍智能合约的基本概念、工作原理以及在Web3下的应用场景。…

如何提取视频里面的音频?简单三个方法即可完成!

分享3个简单易上手的视频提取音频方法,这些方法可以帮助你单独提取保存视频中的人物对话音频内容和背景音乐,并且提取成功的音频文件还可用于其他视频创作。 方法一:PR提取音频 Adobe Premiere Pro(简称PR)不仅可以用…