通过点引导掩码表示的弱半监督实例分割

news2024/11/25 6:41:07

文章目录

  • The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation via Point-Guided Mask Representation
    • 摘要
    • 本文方法
      • Weakly Semi-Supervised Instance Segmentation using Point Labels
      • Mask Refinement Network
    • 实验结果
      • 消融实验

The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation via Point-Guided Mask Representation

摘要

  1. 带有点标签的弱半监督实例分割(WSSIS),用于经济高效和高性能的实例分割。
  2. 由几个完全标记的图像和许多点标记的图像组成的数据集
  3. 为了处理完全标记的数据量极其有限的困难情况,提出了一种MaskRefineNet,它可以细化粗糙掩模中的噪声。
    代码地址
    在这里插入图片描述
    没有建议会导致缺少mask
    如果给出正确的建议(斑马线),也可以生成mask
    噪声往往会导致mask噪声
    在这里插入图片描述
    伪实例掩码的定性结果。(a) 和(b):由于假阴性和假阳性实例建议之间的权衡,伪掩码的质量在很大程度上受到建议的置信度分数的影响。(c) :我们的点驱动方法可以过滤建议,只保留真正的正建议,从而使伪实例掩码的质量更清晰。

本文方法

在这里插入图片描述
步骤1:用完全标记的数据训练教师网络和MaskRefineNet
步骤2:在点标签指导下,通过教师网络生成伪标签,并使用MaskRefineNet进行进一步细化。然后,在伪标记数据和完全标记数据上训练学生网络。

Weakly Semi-Supervised Instance Segmentation using Point Labels

(1) 仅使用完整标签来训练教师网络;
(2) 使用教师网络生成的完整标签和伪标签以及点标签来训练学生网络。生成高质量的伪标签对WSSIS至关重要,因此我们使用点标签作为过滤建议的指导,以保持真正的积极建议。然后,在给定过滤后的建议的情况下,我们通过利用教师网络的掩码表示来生成实例掩码。
在这里插入图片描述

SOLOv2采用了一个5级特征金字塔(P2~P6),每个金字塔级别都可以识别特定大小的实例。当与使用点标签进行抽样建议相结合时,需要根据实例的大小谨慎地提取建议的级别。否则,生成的实例掩码通常是有噪声的。
根据每个级别的分辨率重新缩放点标签的坐标,并提取所有级别的置信度分数。然后,我们仅从具有最大置信度分数的金字塔级别生成实例掩码,如图4所示。形式上,存在N个提议分支{fpi}Ni=1,并且我们遵循FPN的配置,其中N=5。对于每个点标签(x,y,c),其中c表示类别id,我们提取实例建议和置信度得分(Pi,si)=Fp i(x,y,c)。将置信度得分视为预测的可靠性,我们自适应地选择具有最大得分的金字塔级别k,k=argmaxk∈{1,2,…,N}。
最后,在掩码分支Fm处,我们生成伪实例掩码M=σ(Fm(Pk)),其中σ是sigmoid函数。

Mask Refinement Network

我们松散地裁剪输入图像中的每个实例区域、粗略掩码和点信息,并将它们调整为256×256,然后将它们连接到一个输入张量中。对于点信息,我们将点标签转换为热图的形式,其中每个点被编码为sigma为6的2D高斯核。
MaskRefineNet的有效性可归因于两个原因:
(1) 它利用了教师网络的先验知识;由于MaskRefineNet以教师网络的粗略掩码预测为输入,它学习如何校准教师网络预测的常见误差;(2) 它采用来自输入点的指导,该输入点可能提供用于识别重叠实例和错误预测像素的准确目标实例提示。因此,MaskRefineNet在点引导的帮助下细化了缺失和有噪声的部分,并解开了粗糙掩模中拥挤的目标实例。
在这里插入图片描述
MaskRefineNet的效果。在10%的COCO完全标记数据条件下的定性结果。当教师网络无法在粗略掩码中解开对象时,MaskRefineNet可以由于给定的点标签(第一行)而分离每个表示。我们的MaskRefineNet进一步丰富了生成的掩码表示(第二行),并去除了有噪声的部分(第三行)。

实验结果

在这里插入图片描述
在这里插入图片描述

消融实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/614618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【JavaEE】HTTP状态码-HTTP数据报的构造

HTTP状态码HTTP数据报的构造 文章目录 JavaEE & HTTP状态码 & HTTP数据报的构造1. HTTP状态码1.1 200 - OK1.2 404 - Not Found1.3 403 - Forbidden1.4 500 - Internal Server Error1.5 504 - Gateway Timeout1.6 302/301 重定向 2. 构造HTTP请求2.1 浏览器搜索栏输入u…

Express应用之记账本项目总结

前言 在学完nodejs相关知识后第一个实践就是这个记账本项目,本篇文章是对项目遇到的问题的总结。 先聊聊技术栈: 前端技术:h5结合bootstrap框架; 后端技术:nodejsExpress框架lowdb数据库。 gitee地址:ht…

FinalShell界面左侧为什么能够监测系统指标动态变化的原理并用python实现

前言: 我们可以看出FinalShell是用Java写的,具体怎么看出来的,不能光看界面logo是Java的logo,还要进它的安装目录下进行查看是否真是用Java编写的!!! 具体查看如下: 查看finalshe…

软件外包开发在线监测工具

软件系统上线后需要在线网络工具监测系统的运行,这样在系统出现故障时第一时间通知到系统维护人员,对于软件系统的稳定运行是必不可少的监测工具。今天和大家分享一些常用的在线监测工具,希望对大家有所帮助。北京木奇移动技术有限公司&#…

Vue.js 中的 TypeScript 支持是什么?如何使用 TypeScript?

Vue.js 中的 TypeScript 支持 Vue.js 是一款流行的前端框架,它提供了一种简单、灵活的方式来构建用户界面。随着 TypeScript 的普及,Vue.js 也开始支持 TypeScript,使得开发者可以使用类型检查等 TypeScript 特性来提高代码质量和可维护性。…

看完这篇卡尔曼滤波原理,我被惊到了!

在网上看了不少与卡尔曼滤波相关的博客、论文,要么是只谈理论、缺乏感性,或者有感性认识,缺乏理论推导。能兼顾二者的少之又少,直到我看到了国外的一篇博文,真的惊艳到我了,不得不佩服作者这种细致入微的精…

Vue-- 锚点实现左右两栏联动--scrollIntoView方法

官网:scrollintoView 通过滚动浏览器窗口或某个容器元素,调用元素就可以出现在视窗中。 利用scrollIntoView() 函数 默认是true document.getElementById(需要滚动的div的id).scrollIntoView() 如果给该方法传入true作为参数,或者不传入任何参…

什么是 Vue.js 中的 computed 属性?

什么是 Vue.js 中的 computed 属性? 在 Vue.js 中,computed 属性是一个非常重要的概念。它提供了一种方便的方式来计算和监听 Vue.js 实例中的属性,从而使得代码更加简洁、易于维护。在本文中,我们将详细介绍 computed 属性的原理…

【SVN】设置ubuntu下SVN服务开机自启

目录 0.背景环境 1.开机自启步骤 0.背景环境 1)ubuntu下,已搭建好svn版本库,具体搭建方法参考文末的其他博客链接 2)在搭svn服务器的过程中,发现ubuntu重启后,svn服务就关闭了 svn正常开启时见下图 所以…

ps技术的革命创新-photoshop beta版

Photoshop 2023 Beta功能介绍 全新的Generative Fill功能现已加入Photoshop Beta桌面应用程序,可以让用户在非破坏性的基础上轻松地添加、扩展或删除图像内容,实现令人惊喜、高兴和震撼的真实效果,仅需数秒。使用此功能,只需要选…

Java编程中必须掌握的抽象类和接口

抽象类与接口是J--a中两个重要的概念,都用于实现多态性和代码重用。在本文中,将会介绍这两个概念的特点以及如何使用它们来实现继承父类同时实现接口,还有接口的多继承。 老规矩,思维导图我已经整理好放在文末,需要自…

【ARM AMBA AXI 入门 1 - AXI 握手协议】

文章目录 1.1 AXI 双向握手机制简介1.1.1 信号列表1.1.2 双向握手目的1.1.3 握手过程 1.2 数据通路的握手要求1.2.1 读数据通路1.2.2 读地址通路1.2.3 写数据通路1.2.4 写地址通路1.2.5 写回复通路1.2.6 全信号 1.3 不同数据通路间的约束关系1.3.1 读操作约束关系1.3.2 写操作约…

怎么将pdf文件免费转为扫描件

推荐两个工具,也算是给自己记一下 1、手机:扫描全能王APP 太好使了,可以直接拍照并转换为扫描件 不开会员的话会出现水印,因为我都是自己用或者交作业就没开 支持读取相册,一次一张、多张都可以 如果不想要水印也…

Grafana 如何监控容器指标(五)

Grafana 如何监控容器指标(五) 1、添加cadvisor CAdvisor 是用于收集有关我们容器信息的常用工具。它是普罗米修斯和格拉法纳用来抓取信息和可视化图表、图表、时间序列和其他各种形式的信息的代理人。CAdvisor从我们的容器中收集各种指标,这些信息被普罗米修斯刮擦…

SQL了解之复制(二)

(续)从另一个master初始化slave 前面讨论的假设你是新安装的master和slave,所以,slave与master有相同的数据。但是,大多数情况却不是这样的,例如,你的master可能已经运行很久了&#xf…

Pads和AD画图哪个更好?

Mentor Pads和Altium Designer(简称:AD)是两种常用的电子设计软件,用于PCB设计,它们拥有各自的优势及适用场景,但如何根据项目来选择工具?下面将比对Pads和AD在不同方面的比较,希望对…

chatgpt赋能python:Python安装包制作入门教程

Python 安装包制作入门教程 Python 作为一门简单易学且适用范围广的编程语言,不仅可以运行在各种操作系统上,还能够通过制作安装包方便地分享给其他人使用。本文将介绍如何使用 Python 的一些工具来制作安装包,以帮助 Python 开发者更加便捷…

VFP下载公众号消息图片,小白入门DAY2

封面张终于放正了。 VFP接收到的消息如下 <xml><ToUserName><![CDATA[gh_63145a34e897]]></ToUserName> <FromUserName><![CDATA[oljsK6OgHA9ftJxuCUWg7cFylj6Y]]></FromUserName> <CreateTime>1685926602</CreateTime>…

设置float后,按钮遇上position: relative点击失效

1 问题&#xff1a;设置button浮动到右边之后&#xff0c;button上的onClick事件无法触发 "点击"按钮点不了 2 原因&#xff1a;button浮动到右边之后&#xff0c;下面的div填补上来&#xff0c;但是下面的div设置了position: relative&#xff0c;结果下面的div直接…

“AI Earth”人工智能创新挑战赛:助力精准气象和海洋预测Baseline[3]:TCNN+RNN模型、SA-ConvLSTM模型

【机器学习入门与实践】入门必看系列,含数据挖掘项目实战:模型融合、特征优化、特征降维、探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战:数据融合、特征优化、特征降维、探索性分析等,实战带你掌…