用于语义图像分割的弱监督和半监督学习:弱监督期望最大化方法

news2025/1/11 6:12:53

这时一篇2015年的论文,但是他却是最早提出在语义分割中使用弱监督和半监督的方法,SAM的火爆证明了弱监督和半监督的学习方法也可以用在分割上。

这篇论文只有图像级标签或边界框标签作为弱/半监督学习的输入。使用期望最大化(EM)方法,用于弱/半监督下的语义分割模型训练。

背景知识

1、符号定义

X是图像。Y是分割映射。其中,ym∈{0,…,L}是位置m∈{1,…,m}处的像素标签,假设我们有背景和L个可能的前景标签,m是像素个数。

2、 有监督学习的流程

在上述完全监督情况下,目标函数为:

这里的θ为模型参数向量。每个像素的标签分布计算如下:

其中fm(ym|x,θ)为模型在像素m处的输出。J(θ)采用小批量SGD优化。

弱监督方法(图像级标注)

当只有图像级标注时,可以观察到的是图像值x和图像级标签z,但像素级分割y是潜在变量。那么我们有如下的概率图形模型:

给定之前的参数估计θ ',期望的完整数据对数似然为:

其中可以采用em近似,在算法的e步中估计潜在分割:

论文对EM进行了修改,增加了偏差Bias

在这种变体中,假设log P(z|y)对像素位置进行因式分解为:

这样可以在每个像素上分别估计e步分割:

参数bl=bfg,如果l > 0, b0=bbg,且bfg > bbg > 0。

可以简单的解释为:鼓励将一个像素分配给图像级标签之一。bfg > bbg比背景更能增强当前景类,鼓励完整的对象覆盖并避免退化的解决方案。

论文的参数是:BFG = 5, BBG = 3,除此以外,论文还使用了自适应的值:

EM-Adapt没有在EM-Fixed中使用固定值,而是鼓励至少将图像区域的ρl部分分配给类l(如果zl = 1),并强制不将像素分配给类l(如果zl = 0),这样EM-Adapt可以自适应地设置图像和类相关的偏差bl。ρfg = 20%, ρbg = 40%。

弱监督方法(边界框标注)

Bbox-Rect方法相当于简单地将边界框内的每个像素视为各自对象类的正面示例。通过将属于多个边界框的像素分配给具有最小面积的边界框来解决歧义。虽然边界框完全包围了对象,但也包含背景像素,这些像素是假阳性示例污染训练集。

为了过滤掉这些背景,论文还使用了DeepLab中使用的CRF。边界框的中心区域(框内像素的%)被约束为前景。用hold -out集估计CRF参数。

论文的方法Bbox-EM-Fixed:该方法是前面提到的EM-Fixed算法的一种变体,其中仅提升当前前景目标在边界框区域内的分数。

半监督方法(混合标注)

在混合标注的情况下,就变成了一种半监督的情况。在深度CNN模型的SGD训练中,每个mini-batch具有固定比例的强/弱标注图像,并使用论文提出的EM算法在每次迭代中估计弱标注图像的潜在语义分割。

结果

在EM-Fixed半监督设置中使用1464个像素级和9118个图像级注释,性能显著提高了,达到64.6%,接近完全监督67.6%。

在半监督设置中使用2.9k像素级注释和9k图像级注释,得到68.5%,接近完全监督70.3%。

Bbox-Seg比Bbox-Rect提高了8.1%,并且在像素级标注结果的7.0%以内。1464个像素级标注与弱边界框标注相结合,得到的结果为65.1%,仅比像素级标注差2.5%。

Bbox-EM-Fixed在添加更多标注时比Bbox-Seg有所改进,当在添加2.9k标注时,它的性能提高了1.0% (69.0% vs 68.0%)。

可以说的EM算法的e步比前景-背景分割预处理步骤能更好地估计目标掩模。

总结

这虽然是一篇很老的论文,但是它提出的思想到现在还是可用的,这对于我们了解现在的弱监督和半监督的学习方法也是非常有帮助的,所以推荐对于研究SAM方向的小伙伴都阅读一下,论文地址:

https://avoid.overfit.cn/post/36b0fbd642d640ceab41d0dfb885a95d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/707138.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

rain-nowcasting-using-deep-learning github:使用深度学习进行临近降水预报

来源 github地址 是什么 本资料库旨在阐述 "在应用于降雨预报的深度学习模型中合并雷达雨量图像和风速预测 "( “Merging radar rain images and wind predictions in a deep learning model applied to rain nowcasting”)一文中提出的深度…

下拉表格多选sql批量插入以身份证号自动加载年龄性别生日

目录 一、layui下拉表格多选1、引入js2、html3、js代码①非动态数据②动态数据 4、运行效果 二、sql server批量插入三、根据身份证号动态填写出生日期年龄性别 一、layui下拉表格多选 1、引入js 2、html <div class"layui-input-inline"><input type&quo…

安装 Grafana 及 windows_exporter 配置 dubbo 配置 及报告示例

目录 安装部署 官网下载 配置中文 启动 访问 账户密码 界面效果 图表操作 新建添加仪表 添加 Prometheus 数据源 导入已有报告示例 下载 windows_exporter Grafana 的图表模板 node_exporter 中文版&#xff1a;windows_exporter for Prometheus Dashboard CN v2…

element框架select值更新页面不回显的问题,动态表单props绑定问题

1、页面中使用form表单&#xff0c;引入select组件 当data中默认没有定义form.region的值时&#xff0c;会出现选择select后input没有回显选择数据值&#xff1b;所以使用select时&#xff0c;必须定义默认值 <el-form ref"form" :model"form" label-…

常见面试题之线程中并发锁(二)

1. 什么是AQS&#xff1f; 1.1. 概述 全称是AbstractQueuedSynchronizer&#xff0c;是阻塞式锁和相关的同步器工具的框架&#xff0c;它是构建锁或者其他同步组件的基础框架 AQS与Synchronized的区别 synchronizedAQS关键字&#xff0c;c语言实现java语言实现悲观锁&#…

CISSP证书考试难度大吗?本文教你如何轻松拿下CISSP

主题&#xff1a;CISSP含金量、CISSP考试经验、CISSP备考、CISSP考试大纲 CISSP含金量高 CISSP注册信息系统安全师认证是信息安全领域被全球广泛认可的IT安全认证&#xff0c;一直以来被誉为业界的“金牌标准”。CISSP认证不仅是对个人信息安全专业知识的客观评估&#xff0c…

给若依添加单元测试(一)

给若依添加单元测试 方案二&#xff08;异常困难但企业开发一般用这个&#xff09; 方案一&#xff08;简单&#xff09; 在 admin 模块中添加单元测试 S1.在 src 目录下创建 test.java.MapperTests 文件 S2.将以下内容复制进去 import com.ruoyi.RuoYiApplication; imp…

初学mybatis(六)动态sql

学习回顾&#xff1a;初学mybatis&#xff08;五&#xff09; 一、动态SQL 介绍 什么是动态SQL&#xff1a;动态SQL指的是根据不同的查询条件 , 生成不同的Sql语句. 官网描述&#xff1a; MyBatis 的强大特性之一便是它的动态 SQL。如果你有使用 JDBC 或其它类似框架的经验&…

小研究 - Java 指针分析综述(三)

近年来静态程序分析已成为保障软件可靠性、安全性和高效性的关键技术之一. 指针分析作为基 础程序分析技术为静态程序分析提供关于程序的一系列基础信息&#xff0c;例如程序任意变量的指向关系、变量 间的别名关系、程序调用图、堆对象的可达性等. 介绍了 Java 指针分析的重要…

微信小程序:实名认证登录 [2018年]

1、[微信开发社区]微信支付实名信息小程序授权接口能力&#xff08;用户获取用户真实姓名&#xff0c;身份证号码&#xff09; 微信开放社区 2、注意事项 四、接口文档 略。

English Learning - L3 纠音 W8 Lesson7 Ted Living Beyond Limits 2023.06.27 周二

朗读内容&#xff1a; Lesson 7 Day 47 - 51 句子 Ted Living Beyond Limits 3-22

GPT-4 参加2023年高考数学,人工智能对话机器人和人类对决,快谁速度快

ChatGPT从入门到精通&#xff0c;一站式掌握办公自动化/爬虫/数据分析和可视化图表制作 全面AI时代就在转角 道路已经铺好了 “局外人”or“先行者” 就在此刻 等你决定 让ChatGPT帮你高效实现职场办公&#xff01;行动起来吧。 【点击查看更多知识】ChatGPT从入门到精通&am…

springboot中Thymeleaf模板插入Freemarker模板页面

概述 最近在修改springboot架构的项目&#xff0c;项目之前配置的是Thymeleaf模板&#xff0c; 但是在我新加的功能中&#xff0c;我非常想用Freemarker模板来新加一些页面功能。 看到网上很多其他地方描述&#xff0c;要么用不同的文件后缀来区分(如html文件为Thymeleaf&…

【java 程序设计实训】学生请假管理系统

学生请假管理系统 运行结果学生请假管理系统需求分析GUI 编程事件处理数据库编程部分代码项目结构实体类 Admin.javaLeaveData.javaUserLogin.javaMainWindow.javaTeacherReviewFrame.javaleaveList.java 注&#xff1a;完整内容可下载查看完整报告 运行结果 学生请假管理系统需…

mac配置VScode主题加makefile etc

profile配置&#xff1a; 参考链接&#xff1a;https://www.bilibili.com/video/BV1YW4y1M7uX/?spm_id_from333.999.0.0&vd_sourced75fca5b05d8be06d13cfffd2f4f7ab5 https://code.visualstudio.com/docs/cpp/config-clang-mac vscode profiles如下&#xff1a; {//…

蓝桥杯专题-试题版-【九宫重排】【格子刷油漆】【回文数字】【国王的烦恼】

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列点击跳转>蓝桥系列 &#x1f449;关于作者 专注于Android/Unity和各种游…

空间曲线的切线和法平面与曲面的切平面和法线

&#xff08;一&#xff09;空间曲线的切线和法平面 1. 参数方程的形式 理解和记住如下逻辑&#xff1a; 该两个公式&#xff0c;笔者可以理解但是无法证明。 2. 参数方程外的第二种形式&#xff1a; 此种变换的本质&#xff0c;就是将多元函数转换为参数方程的形式。如此看…

English Learning - L3 作业打卡 Lesson7 Day54 2023.6.29 周四

English Learning - L3 作业打卡 Lesson7 Day54 2023.6.29 周四 引言&#x1f349;句1: I daydreamed like I did as a little girl and I imagined myself walking gracefully, helping other people through my journey and snowboarding again.成分划分连读爆破语调 &#x…

Learn Mongodb 可是工具及基本命令的使用 ③

作者 : SYFStrive 博客首页 : HomePage &#x1f4dc;&#xff1a; PHP MYSQL &#x1f4cc;&#xff1a;个人社区&#xff08;欢迎大佬们加入&#xff09; &#x1f449;&#xff1a;社区链接&#x1f517; &#x1f4cc;&#xff1a;觉得文章不错可以点点关注 &#x1f44…

Spark 3.4.0新特性--UI支持存储在RocksDB中

背景 对于Spark来说&#xff0c;目前存储所有的事件信息以及UI所需要的信息都是默认存储在内存中&#xff0c;这在CS中&#xff0c;对于以Spark作为 Server的模式下&#xff0c;会导致OOM&#xff0c;也会导致造成之前作者提交PR&#xff1a;Multi sparkSession should share …