实例明确的和模型自适应监督的半监督语义分割

news2024/9/24 21:26:42

文章目录

  • Instance-specific and Model-adaptive Supervision for Semi-supervised Semantic Segmentation
    • 摘要
    • 本文方法
      • Quantitative hardness analysis
      • Model-adaptive supervision
        • Intensity-based augmentations
        • CutMix-based augmentations
        • Model-adaptive unsupervised loss
    • 实验结果

Instance-specific and Model-adaptive Supervision for Semi-supervised Semantic Segmentation

摘要

最近,半监督语义分割在少量标记数据的情况下取得了很好的性能。然而,大多数现有研究对所有未标记的数据一视同仁,几乎没有考虑未标记实例之间的差异和训练困难。区分未标记实例可以促进实例特定监督动态适应模型的演化。
本文方法

  1. 强调了实例差异的关键性,并提出了一种用于半监督语义分割的实例专用和模型自适应监督,称为iMAS
  2. 根据模型的性能,iMAS采用类加权对称交集-联合来评估每个未标记实例的定量硬度,并以模型自适应的方式监督对未标记数据的训练。
  3. iMAS通过根据评估的硬度权衡其相应的一致性损失,逐步从未标记的实例中学习
  4. iMAS动态调整每个实例的扩充,使得扩充实例的失真度适应模型在整个训练过程中的泛化能力。
  5. 在不集成额外损失和训练过程的情况下,iMAS可以在不同的半监督分割协议下,在分割基准上获得与当前最先进方法相比的显著性能增益
    代码地址

本文方法

在这里插入图片描述
提出的iMAS示意图。在师生框架中,通过最小化监督损失Lx,使用标记数据(x,y)来训练由θs参数化的学生模型。
未标记的数据u,由Aw(·)弱增广,首先被输入到学生和教师模型中,以分别获得预测ps和pt。
通过策略ξ(pt,ps)对每个未标记的实例进行定量硬度评估。这样的硬度信息随后可以被利用:
1)在未标记的数据上应用自适应增强,用As(·)表示,以获得学生模型的预测;
2) 以特定实例的方式对无监督损失Lu进行权衡。教师模型的权重θt由指数移动平均值(EMA)更新。
在这里插入图片描述
弱扩充Aw包括标准的调整大小、裁剪和翻转操作。重要的是,利用未标记数据的方法是半监督学习的关键,也是将我们的方法与其他方法区分开来的关键部分。

Quantitative hardness analysis

在半监督分割中,在1)缺乏准确的基本事实标签和2)与模型性能密切相关的动态变化的情况下,评估未标记数据的硬度是具有挑战性的。随着模型的发展,“硬”样本可能会变得更容易,但如果没有准确的标签信息,就无法轻易识别这种动态。

本文在学生和教师模型的分割结果之间设计了一个对称的类加权IoU来评估瞬时硬度。类加权设计用于缓解分割任务中的类不平衡问题。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Model-adaptive supervision

在这里插入图片描述
最近的半监督分割研究中流行的强增强主要由两种不同类型组成:基于强度的增强和CutMix,如表1所示。在iMAS中,我们将特定于实例的调整应用于这两种类型的增强

Intensity-based augmentations

标准的基于强度的数据增强从增强池中随机选择两种图像操作,并将它们应用于弱增强实例。
然而,强增强可能会损害数据分布并降低分割性能,尤其是在早期训练阶段。
与特定于分布的设计不同,我们只是通过混合其强增强和弱增强输出来调整未标记实例的增强程度。
形式上,第i个未标记实例的最终扩充输出AIs(ui)可以通过以下方式获得:
在这里插入图片描述
其中由基于强度的强增强引起的失真被相应的弱增强输出成比例地削弱。通过这种方式,硬度较大的较难实例不会受到显著干扰,因此模型不会在潜在的分布外情况下受到挑战。另一方面,模型很好地拟合了γ值较低的更容易的实例,可以从它们的强强化变体中进一步学习。这种模型自适应增强可以更好地适应模型的泛化能力

CutMix-based augmentations

通过模型自适应设计改进了标准CutMix,这在两个方面是不同的:1)平均硬度决定了CutMix在小批量上增加的触发概率,而不是使用预定义的超参数;2) 复制和粘贴对专门分配在硬样本和易样本之间。根据实例硬度,我们分别按升序和降序对小批量的未标记样本进行排序,得到两个序列。然后,我们逐个元素地聚合两个序列,以生成难易对。形式上,给定一个特定的hardeasy对(um,un),模型自适应CutMix可以表示为,
在这里插入图片描述
其中Mm和Mn分别表示um和un的随机生成的区域掩模。此外,在应用CutMix数据增强,获得pt′m和pt′n后,需要对伪标签进行相应的修改。这种相互增强是在伯努利过程之后应用的,即只有当均匀随机概率高于平均硬度时才触发

Model-adaptive unsupervised loss

优先考虑简单样本的训练,而不是困难样本的训练。准确地说,我们通过乘以1−γ来评估每个实例的无监督损失的相应易失性。结合模型自适应增强,我们可以通过
在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/610949.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第四章 Electron|Node 使用SQLite3数据库

一、SQLite是什么 👇 👇 👇 SQLite是一种嵌入式关系型数据库管理系统,是一个零配置、无服务器的、自给自足的、事务性的SQL数据库引擎。SQLite是一个轻量级的数据库,可以在各种操作系统上使用,并且支持SQL…

网络名词术语解析 | 路由、交换机、集线器、半/全双工、DNS、LAN、WAN、端口、MTU

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和…

Python 数据可视化

Python 数据可视化 Python提供了多个用于数据可视化的工具和库。其中最常用的包括: 1. Matplotlib:Matplotlib 是一个用于绘制二维图形的 Python 库。它提供了广泛的绘图选项,可以帮助您创建线图、散点图、柱状图、饼图、等高线图、3D 图形…

linuxOPS基础_linux网络配置

ifconfig查看网络信息 命令:ifconfig 作用:获取网卡的相关信息 语法:# ifconfig 示例1 查看网络信息 案例1使用ifconfig查看linux网络配置 ifconfig注意,我们发现当前ens33看不到IP地址信息,那是因为网卡默认不启…

如何为您的企业培养社交媒体粉丝(16种方式)

增加社交媒体关注度似乎很困难,但这对各种规模的企业来说都是一项重要任务。通过正确的方法,可以吸引忠实的追随者并在社交媒体上建立强大的影响力。在本文中,我们将探讨 16 种有效的方法来增加您的社交媒体粉丝并与您的受众互动。 目录 为…

Java实现LL1语法分析器【编译原理】

java通过预测分析法实现语法分析程序【编译原理】 前言推荐实验要求需知LL1工作原理 Java实现LL1语法分析器0实验步骤LL1.javaGrammar.javaLeftRecursion.javaFirstAndFollow.javaAnalyzeTable.javaLL1Stack.java实验结果 Java实现LL1语法分析器1Grammar.javaProduction.javaFi…

Three.js——九、纹理贴图、纹理对象阵列、地面网格辅助观察、UV坐标以及动画

创建纹理贴图 const geometry new THREE.PlaneGeometry(100, 100); //纹理贴图加载器TextureLoader const texLoader new THREE.TextureLoader(); // .load()方法加载图像,返回一个纹理对象Texture const texture texLoader.load(new URL(../assets/img/zhizhen…

IRIS75 DM蓝牙5.2双模热插拔PCB

键盘使用说明索引(均为出厂默认值) 软件支持(驱动的详细使用帮助)一些常见问题解答(FAQ)首次使用步骤蓝牙配对规则(重要)蓝牙和USB切换键盘默认层默认触发层0的FN键配置的功能默认功…

B站恰饭视频汇总,如何查找不同行业的品牌商单和恰饭视频?

随着“短视频时代”来临,广告主都在重点布局短视频平台,尝试用长短视频平台协同投放的方式来提高广告点击率。B站作为短视频产出的高质量平台,也是许多年轻人活跃的聚焦地,拥有很强的用户粘性和无限的商业潜力,是广告主…

港联证券|如何抓住牛股?股票为什么能够连续涨停?

牛股是指在股票市场中表现出色、股价涨幅较大的个股,对于投资者来说,抓住牛股是实现投资目标的关键之一。那么如何抓住牛股?股票为什么能够连续涨停?港联证券也为大家准备了相关内容,以供参考。 如何抓住牛股&#xff…

迅为RK3568开发板Buildroot 系统设置屏幕旋转

迅为支持的触摸屏幕有四种: MIPI 7 寸屏幕(默认物理屏幕为竖屏) LVDS 7 寸屏幕(默认物理屏幕为竖屏) LVDS 10.1 寸 1024*600 屏幕(默认物理屏幕为横屏) LVDS 10.1 寸 1280*800 屏幕&#xf…

代码随想录二刷 day13 | 栈与队列 之 239. 滑动窗口最大值 347.前 K 个高频元素

day13 239. 滑动窗口最大值347.前 K 个高频元素 239. 滑动窗口最大值 题目链接 解题思路: 设计单调队列的时候,pop和push操作要保持如下规则: pop(value):如果窗口移除的元素value等于单调队列的出口元素,那么队列弹…

拜登签字了

* * * 原创:刘教链 * * * 号外:今天在“刘教链Pro”发表了一篇《对PoS的链重建攻击》,总结了一下最近关于PoW和PoS安全性的碰撞,抛砖引玉,欢迎关注“刘教链Pro”并阅读。 * * * 隔夜比特币仍在27k上方盘旋。盘旋之中微…

数据万象 | AIGC 存储内容安全解决方案

AIGC(人工智能生产内容) 已经成为与PGC(专业生产内容)、UGC(用户生产内容)并驾齐驱的内容生产方式。由于 AI 的特性,AIGC在创意、个性化、生产效率等方面具有独特的优势,这些优势可以…

Hadoop中MapReduce概述

MapReduce概述 MapReduce定义MapReduce优缺点MapReduce核心思想MapReduce进程MapReduce编程规范MapTask并行度决定机制ReduceTask并行度决定机制mapreduce中job的提交流程MapReduce工作流程shuffle机制分区partition数据清洗(ETL)进一步分析MapTask和Red…

项目经理如何制定工作计划?做到这3点就够了

工作计划的重要性在于明确目标和实现具体步骤,协调大家一致行动,增强工作的主动性,减少工作的盲目性,让工作有条不紊地进行。同时,制定计划也可以对工作进度和质量有个保证和标准,对大家的工作有约束和督促…

Android Native crash问题分析

1、准备材料 android-ndk-r21b工具:addr2line和objdump工具。 .so库:crash对应的带符号表的共享库 源代码code:crash对应的源码文件 tombstone:Android系统产生的墓碑文件 2、 tombstone墓碑文件分析 关键信息: c…

前端div水平居中的几种实现方式

借助display布局 父元素开启display:flex布局,并设置justify-content:center主轴的空隙分布 因为是单行,所以使用align-items:center设置侧轴上的对其方式 <body><style>.a{width: 200px;height: 200px;background-color: red;display: flex;justify-content: c…

JS新标签页打开,让你的网站访问更加便捷

前言 大家在浏览网页时&#xff0c;常常需要在新的标签页中打开链接&#xff0c;以便在不离开当前页面的情况下查看其他内容。其中&#xff0c;JS 打开新标签页作为一种常用的功能之一&#xff0c;既可以方便用户快速访问相关链接&#xff0c;又能有效提升网站的用户体验。在本…

【Python 二进制和十六进制】零基础也能轻松掌握的学习路线与参考资料

1.了解二进制和十六进制的基本概念和用途 在计算机中&#xff0c;二进制和十六进制是两种常用的表示数据的方式。二进制只有两个数字0和1&#xff0c;表示一个比特&#xff08;bit&#xff09;&#xff0c;在实际的计算机程序中&#xff0c;常用八个比特表示一个字节&#xff…