利用隐藏的正例进行无监督的语义分割

news2024/11/18 7:27:01

文章目录

Leveraging Hidden Positives for Unsupervised Semantic Segmentation

摘要

对标记像素级注释的人力的巨大需求引发了无监督语义分割的出现。尽管最近使用视觉转换器(ViT)主干的工作显示出了卓越的性能,但仍然缺乏对特定任务的训练指导和局部语义一致性的考虑。
本文方法

  1. 通过挖掘隐藏的正例因素来利用对比学习来学习丰富的语义关系,并确保局部区域的语义一致性。
  2. 首先基于固定的预训练主干和训练中的分割头分别定义的特征相似性,为每个锚点发现两种类型的全局隐藏正例因素,即任务无关和任务特定。后者的贡献逐渐增加,导致模型捕捉特定于任务的语义特征
  3. 引入了一种梯度传播策略来学习相邻patch之间的语义一致性,前提是相邻补丁极有可能拥有相同的语义。
  4. 具体来说,我们将传播到局部隐藏阳性、语义相似的附近补丁的损失与预定义的相似性分数成比例。
    代码地址
    在这里插入图片描述
    假设一个小批量包括(a)中所示的两个图像,我们描述了两种类型的隐藏正例因素,以用于对比学习。
    (a) 通过在(b)和(c)中引入两种类型的隐藏积极因素,我们提供了一个例子,说明我们的训练方案如何提供更精确和一致的语义。(b) (顶部)整个小批量中语义相似的补丁被选为全局隐藏正例。(底部)每个锚点的数据驱动标准是为可靠的正向收集而设计的。根据该标准,所选正例如(b顶部)所示。
    (c) (顶部)我们将每个锚点的局部隐藏正例定义为具有高语义一致性的相邻补丁,即蓝框。(底部)来自预训练的转换器架构的相邻patch的平均注意力得分。蓝线表示局部隐藏正例的注意力得分,而红线表示与锚相邻但语义一致性低的补丁。

本文方法

在这里插入图片描述
图2:global hidden positive(GHP)选择过程的说明。
我们的GHP可以分为两个子集:任务不可知论和任务特定论。
任务不可知GHP的Pag的索引集包括在任务不可知参考池Qag内发现的阳性的索引。
注意,Qag由特征提取器F提取的随机采样特征组成。
一旦锚特征fi被投影到zi,如果小批量中的其他patch与锚特征的相似性超过了锚与Qag中最相似特征之间的相似性,则它们被收集为阳性。
另一方面,以类似的方式发现了任务特定的GHP,但具有任务特定的参考池Qsp,该参考池不断用动量分割头S的特征更新。
尽管任务不可知的GHP集合只对初始训练有贡献,但特定任务的GHP集逐渐取代任务不可知集合的部分,直到训练结束。

一旦收集了参考池,对于每个补丁特征fi,我们定义了一个依赖于锚的相似性标准ci以收集阳性,作为到参考池内最近的特征的距离Qag乘以余弦相似度:
在这里插入图片描述
对于每个锚特征fi,如果fi和fj之间的相似性大于ci,我们基本上将小批量fj中的另一个特征视为正特征。尽管一个补丁特征可能是另一个的正样本,但它可能并不相互支持。这是因为ci的标准是锚定的。为了在训练中赋予一致性,我们使GHP选择对称,以防止两个补丁之间的关系不明确。因此,每个第i个锚特征fi的GHP P ag i的索引集定义如下:
在这里插入图片描述
然而,尽管建立在无监督预训练网络特征基础上的参考库可以作为积极性的适当基础,但它可能是不够的,因为它缺乏任务特异性。我们认为,来自分割头部的特征比来自预训练主干的特征更具任务特异性。因此,除了由P ag选择的GHP之外,我们还利用分割头的特征构建了额外的任务专用GHP。

在这里插入图片描述

目标函数

为了与挖掘的GHP形成对比目标,我们还需要负面特征。当我们在整个小批量中收集积极因素时,对比学习的实现将利用除了小批量中选择的积极因素之外的所有特征作为消极因素。然而,由于负集大小的过度增加可能会干扰模型训练,我们通过为每个第i个锚随机选择剩余补丁的ρ%来形成负集Ni。
我们对每个第i个锚的对比损失更像是监督目标,因为我们得到了多个正例:
在这里插入图片描述

Gradient Propagation to Local Hidden Positives

除了全局考虑语义相似的特征外,常见的假设是附近的像素极有可能属于同一语义类。为此,我们通过将损失梯度传播到锚的周围特征来考虑局部性的性质。尽管如此,传播应该谨慎设计,因为没有给出相邻补丁的语义标签;相邻补丁之间的语义一致性大多成立,但有时不成立(即,在对象边界)。因此,为了决定附近的语义一致的补丁,我们利用来自无监督预训练的ViT主干F的注意力得分。
在这里插入图片描述
梯度传播策略以保持局部语义一致性。对于每个锚,利用其周围的补丁Isurr和来自特征提取器F的相应注意力分数,基于阈值Avg(~T)指定局部隐藏阳性(LHP)Ilocal(等式7)。在前向传递中,根据注意力得分T,通过加权平均混合LHP G(等式8)的特征,以计算目标函数Ψ。以这种方式,损失梯度在后向通路中与T成比例地向LHP传播。

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/641840.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CancelToken中断请求

使用场景&#xff1a;页面切换时&#xff0c;主动取消掉未调用完成的接口 注意&#xff1a;因为测试&#xff0c;连续调用5次请求&#xff0c;正常情况下只用一次 <script> import axios from axios; //这里采用传递executor函数到CancelToken的构造函数来创建cancel to…

python使用 flask+vue 制作前后端分离图书信息管理系统

前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 制作前后端分离图书信息管理系统的思路&#xff1a; 前端部分 首先&#xff0c;我们可以使用 VueJS 作为前端框架&#xff0c;并通过 Vue CLI 工具进行创建和管理项目。 后端部分 后端部分我们可以采用 Python Flask 框架,这…

访问学者去日本需要做什么准备?

作为访问学者前往日本需要做一些准备工作&#xff0c;确保顺利进行研究和交流。以下是知识人网的一些建议&#xff1a; 1. 签证&#xff1a;在计划出国前&#xff0c;你需要办理日本的访问学者签证。了解签证类型和所需材料&#xff0c;并提前准备好申请所需的文件。 2. 研究计…

农村饮水安全政策要求与解决措施

农村饮水安全&#xff0c;是指农村居民能够及时、方便地获得足量、洁净、负担得起的生活饮用水。农村饮水安全包括水质、水量、用水方便程度和供水保证率4项评价指标。 一、农村饮水安全问题 农村饮水安全问题一直是农村发展的重要问题。在过去&#xff0c;由于农村供水设施落…

杰林码在荧光细胞识别中的应用(一)

一、杰林码轮廓预测算法 本算法是基于我的《一种全新的图像变换理论的实验》系列博客中的算法构造的轮廓预测算法&#xff0c;能有效的进行细胞轮廓预测&#xff0c;而且从前景到背景支持50个深度层次的轮廓预测。优点&#xff1a; 1、支持各种清晰度和分辨率&#xff0c;通过…

this关键字

1. 关键字&#xff1a;this 1.1 this 是什么&#xff1f; 首先。this在Java中是一个关键字&#xff0c;this 指代的是本类的引用对象 1.2 什么时候使用 this 1.2.1 实例方法或构造器中使用当前对象的成员 1、在实例方法或构造器中&#xff0c;我们在使用get和set方法中使用…

年化33.8%,夏普1.22:lightGBM在ETF行业模动上小试牛刀(附代码下载)。

原创文章第240篇&#xff0c;专注“个人成长与财富自由、世界运作的逻辑与投资"。 今天做排序学习算法在ETF行业轮动上的策略&#xff0c;我们选用的DBDT框架是lightGBM&#xff0c;它的优点就是快且效果不错。 我们的候选集是29个行业ETF&#xff1a; etfs [159870.S…

Python编程:标准库logging使用

Python编程&#xff1a;标准库logging使用 一、 基础使用 1.1 logging使用场景 ​ 日志是什么&#xff1f;这个不用多解释。百分之九十的程序都需要提供日志功能。Python内置的logging模块&#xff0c;为我们提供了现成的高效好用的日志解决方案。但是&#xff0c;不是所有的…

python爬虫——怎么抓取职位信息

目录 背景 为什么要抓取职位信息 怎么抓取职位信息 代码示例 被反爬怎么办 使用代理IP进行爬取 总结 背景 高考刚结束&#xff0c;马上又到了大学生毕业的时候了&#xff0c;各大厂也开始了一波招工潮了&#xff0c;想知道大厂或竞争对手都招些什么人&#xff0c;有什么…

来了解一下这几个网络设备日志级别分别都适用在何种场景?

在华为设备中&#xff0c;涉及到日志的&#xff0c;我们经常会在日志级别上迷糊&#xff0c;本文就给大家介绍8种日志级别以及每个级别适用的场景。 1. Emergency&#xff08;紧急&#xff09; 紧急级别的日志是指最高级别的日志&#xff0c;表示系统遇到了严重的错误或故障&…

JMeter+Ant+jenkins搭建接口自动化测试环境

目录 前言&#xff1a; 1.ant简介 2. 构建ant环境 3.JMeter与Ant集成 4. 报告优化 5.jenkins持续集成 前言&#xff1a; JMeter是一个开源的性能测试工具&#xff0c;可以用于测试Web应用程序或API接口的性能&#xff0c;支持多种通信协议和数据格式。Ant是一个构建工具&…

ui自动化 SeleniumBase

目录 前言&#xff1a; git克隆 校验邮件的案例: 注意事项: 前言&#xff1a; SeleniumBase是一个基于Selenium WebDriver的Python框架&#xff0c;用于UI自动化测试。它具有简单易用的API接口&#xff0c;可轻松编写测试脚本以及管理测试用例。SeleniumBase不仅提供了Web…

【LeetCode】HOT 100(10)

题单介绍&#xff1a; 精选 100 道力扣&#xff08;LeetCode&#xff09;上最热门的题目&#xff0c;适合初识算法与数据结构的新手和想要在短时间内高效提升的人&#xff0c;熟练掌握这 100 道题&#xff0c;你就已经具备了在代码世界通行的基本能力。 目录 题单介绍&#…

5月总共面试31次,我人麻了....

3年测试经验原来什么都不是&#xff0c;只是给你的简历上画了一笔&#xff0c;一直觉得经验多&#xff0c;无论在哪都能找到满意的工作&#xff0c;但是现实却是给我打了一个大巴掌&#xff01;事后也不会给糖的那种... 先说一下自己的个人情况&#xff0c;普通二本计算机专业…

华为OD机试真题 JavaScript 实现【寻找密码】【2023Q1 100分】,附详细解题思路

一、题目描述 小王在进行游戏大闯关&#xff0c;有一个关卡需要输入一个密码才能通过&#xff0c;密码获得的条件如下&#xff1a; 在一个密码本中&#xff0c;每一页都有一个由 26 个小写字母组成的若干位密码&#xff0c;从它的末尾开始依次去掉一位得到的新密码也在密码本…

母线保护(4)

4、母联死区保护 在各种母差保护中&#xff0c;存在一个共同的问题&#xff0c;就是死区问题。 如图&#xff0c;在母联合位时&#xff0c;当故障发生在母联断路器与母联CT之间时&#xff0c;故障电流由II母流向I母&#xff0c;I母小差有差流&#xff0c;判断为I母故障&#x…

yum安装nginx

Nginx介绍 Nginx是一款轻量级的Web服务器/反向代理服务器及电子邮件&#xff08;IMAP/POP3&#xff09;代理服务器&#xff0c;并在一个BSD-like 协议下发行。其特点是占有内存少&#xff0c;并发能力强&#xff0c;事实上Nginx的并发能力确实在同类型的网页服务器中表现较好&…

电脑提示由于找不到vcomp140.dll无法继续执行代码怎么修复呢?这个三个方法可以帮到你

在我们打开游戏或者获取软件的时候&#xff0c;点击电脑提示由于找不到vcomp140.dll无法继续执行代码需要怎么办呢&#xff1f;vcomp140.dll是什么呢&#xff1f;相信困扰着不少小伙伴&#xff0c;vcomp140.dll是Microsoft Visual C Redistributable中的一个动态链接库文件&…

牛客网Java面试题及答案整理(2023年秋招最新版,持续更新)

学习如逆水行舟&#xff0c;尤其是 IT 行业有着日新月异的节奏&#xff0c;我们更要抓紧每一次可以学习和进步的机会。所以&#xff0c;没有撤退可言。 即使是面试跳槽&#xff0c;那也是一个学习的过程。只有全面的复习&#xff0c;才能让我们更好的充实自己&#xff0c;武装…

基于Java高校专业信息管理系统设计与实现(源码+lw+部署文档+讲解等)

博主介绍&#xff1a; ✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战 ✌ &#x1f345; 文末获取源码联系 &#x1f345; &#x1f447;&#x1f3fb; 精…