弱监督语义分割-对CAM的生成过程进行改进3

news2024/11/25 6:37:58

三、擦除图像高响应部分以获取更多的分割领域

ECS-Net: Improving Weakly Supervised Semantic Segmentation by Using Connections Between Class Activation Maps(ICCV,2021)

1.引言

我们首先从图像中擦除高响应区域,并生成这些擦除图像的新 CAM。然后,我们从新 CAM 中抽样可靠的像素,并将它们的分割预测作为语义标签应用于训练相应的原始 CAM。与多次擦除不同,我们的方法只需要进行一次擦除,避免引入过多的噪音。我们进行了大量的消融研究,以发现最佳的超参数,如抽样阈值。具体来说,我们可以实现以下目标:

  • 为了解决弱监督语义分割中的问题,我们提出了一个简单、高效、新颖的框架:擦除CAM监督网(ECS-Net)。该方法利用目标区域挖掘技术和两次cam之间的关系,提供了额外的分割线索。实验表明,ECS-Net预测的CAMs能够更好地学习到物体的边界和形状等分割信息。
  • 由于过度激活等噪声严重损害分割性能,我们的ECS-Net设计了采样规则来抑制从擦除图像的cam带来的噪声。实验结果表明,该方法有助于剔除不可靠样本,加快网络收敛速度。
  • 在PASCAL VOC 2012数据集测试集上的实验表明,我们的框架在VGG-16主干网和ResNet-38主干网上的mIoU分别达到63.4%和67.6%,优于之前最先进的方法。

2.相关工作

细化和扩展类激活映射,以扩展整个对象:

  • SEC[17]引入了三个损失函数,播种、扩展和约束损失来指导网络训练。然而,静态种子线索太少且稀疏,限制了分割性能。为了提高低响应目标区域的识别能力,
  • AE[32]迭代地擦除输入图像中的高响应特征,迫使网络从低响应区域学习新的亮点特征。然而,迭代学习是费时的。
  • MDC[34]采用高扩张率的扩张卷积对整个目标区域的特征进行采样和研究。由于采样位置固定,MDC难以灵活捕获目标边界。
  • FickleNet[18]对此问题进行了研究,尝试利用不同掉落率的Dropout方法来随机选择和组合特征。FickleNet在一张图像上生成多个位置图,获得不同形状的区域。由于dropout的随机性较大,flicklenet不可避免地引入了噪声。
  • PSA[2]生成亲和矩阵来研究像素之间的相似性,并应用随机游走来预测最终结果。

 大多数方法无法抑制采样带来的过度激活,因为少量背景像素被错误分类,可能不会影响分类损失。为了突破这些限制,我们提出了ECS-Net。据我们所知,我们的方法可能是第一个在探索阶段引入可靠的伪分割监督的算法。

使用cam之间的连接:

  • MDC[34]对不同扩张卷积预测的CAMs求和。
  • 同样,RRM[37]计算不同尺度下CAM的平均值。
  • AE[32]从每个cam中裁剪高亮片,并根据相应位置粘贴在一起。
  • 我们认为过于简化的装配设计不能发挥不同CAMs的功能。
  • SEAM[31]通过将图像大小调整为两个尺度来生成相应的cam。此外,它利用等变正则化来缩小这两个cam之间的差异。通过这种自监督学习方法,SEAM为分割任务生成了更加鲁棒的cam。
  • 在一定程度上,小尺度图像的CAM激活了更多物体的部分,但加剧了过度激活。相反,大规模图像的CAM具有较少的激活区域,包括较少的过度激活。这两个cam相互监督,在扩展对象区域和过度激活之间提供了良好的平衡。然而,在SEAM中很难修正两种cam中相同的预测误差。

3.我们的方法

首先,我们详细阐述了应用cam生成片段监督的详尽过程。我们还介绍了抑制噪声标签的方法,并进一步讨论了我们的框架的实现,包括损失函数,网络结构,以及其他一些改进,如缩放和多扩展覆盖模块。整个框架如图2所示。最后,我们详尽地解释了算法的工作原理。

图1:空间维度标注的不足导致网络过于关注突出的目标区域,降低了对目标边缘的敏感性(左)。我们的方法使网络不会遗漏另一个有价值的区域,并且可以更好地捕获边缘(右)。

空间维度注释存在的问题是指在语义分割任务中,使用的注释信息缺乏对像素级别的空间位置信息。传统的图像级别标签或注释无法提供像素级别的对象位置信息,这导致网络在学习时可能过度关注显著的对象区域,而忽略了对象的边缘或细节部分。因此,缺乏空间维度注释会限制网络对对象结构的全面理解,可能导致分割结果缺乏准确性和细节。通过解决空间维度注释不足的问题,可以帮助网络更好地捕捉对象的边缘和细节信息,提高语义分割的性能。 

  • 将分类标签为L的图像I输入网络F,预测热图H\epsilon \mathbb{R}_{> 0}^{C\times H\times W},
  • C为对象类别
  • 将H归一化得到原始CAM a,
  • 分类权重W={w_{c}|w_{c}=1,if c\epsilonL,elsew_{c}=0.\forallc\epsilon{1...C}}  禁止不存在的类别被激活。

  •  分数越高意味着分类特征越明显,我们设置阈值δ = 0.6从s中选择擦除区域R。
  • 对选定区域的像素应用高斯模糊来擦除M上的这些特征。
  • ECS-Net将处理后的图像I'发送到与F共享权重的网络F'中,并输出热图H'
  • 根据式(1),得到擦除后图像a '的CAM。然后,通过argmax函数对a '进行处理,得到粗分割标签L '。

图2: 我们提议的ECS-Net的整个框架。F中cam的高响应区域在图像上被擦除。通过抑制噪声,F'中的CAMs被用作附加的分割标签。F和F'共享权重。

  • 图2显示,通过擦除高响应特征(红色区域),我们的网络将注意力转移到其他低响应对象区域。到目前为止,我们制作的粗略标签包含大量的预测误差,远远低于要求

  • 噪声抑制:我们遵循从L '中选择可靠分割标签的规则。首先,我们忽略来自擦除区域的标签。有两个原因:(1)这些区域,被认为是简单的例子,没有贡献。(2)由于擦除,这些区域遗漏了特征,导致预测不可靠。我们进一步忽略背景标签。最后,对分数图s '施加阈值θ,得到可靠标签。

  •  f(x)=exp(-x),o是GAP层预测的长度为C的向量,
  • 我们的lcls忽略背景类别,即c = 0。

 对于语义分割任务,我们采用交叉熵损失

  •  Q '表示伪分割标签L'的一个结果,Φ定义为可靠标签的位置集,P经过softmax操作后的CAM E在F中的结果,表示对CAM进行了一定的处理后得到的结果。

 图3:在我们的方法中有多个扩展的覆盖模块。实线表示F中的CAM预测过程,虚线表示F '中擦除后的图像生成H '的过程。在多重膨胀叠加模块中,3×3卷积层与每个膨胀卷积层共享权重。

其他改进:我们还讨论了提高预测性能的其他改进。首先,在将图像送入F之前,我们用比例因子β∈[0,1]重新缩放原始图像M。这意味着我第一输入图像小于m .更具体地说,我第二输入图像的具有相同的形状与m .此外,出于这一事实扩张卷积层能够扩大接受域[8],我们添加K扩张卷积层在不同的rates与层B并联(如图3)。值得一提的是,这些额外的层与B和分享重量仅应用于F '在训练阶段。因此,我们的网络可能会捕捉到更多健壮的特征。热图H '的计算方法如下

其中H_{0}^{'}定义为B的输出,H_{k}^{'}定义为第k个扩张卷积层的输出。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1689412.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据防泄露解决方案分享

在当今高度数字化和互联的商业环境中,数据防泄密已成为企业保护财产、维护客户隐私和遵守合规要求的重要一环。数据防泄密不仅关乎企业的经济利益,更涉及用户个人信息安全、商业机密保护以及国家安全等核心问题。能做好数据防泄露,对于提升企…

【简单介绍下爬山算法】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

AIGC:AI整活!万物皆可建筑设计

在过去的一年里 AI设计爆火 各行业纷纷将之用于工作中 同时不少网友也在借助它整活 万物皆可设计 甲方骂我方案像屎一样 于是我就回馈他屎一样的方案 他有点惊喜,但是没话 不是吧,随便找了个充电头图片 也能生成建筑设计!这都能行 鸟…

【EasyX】快速入门——消息处理,音频

1.消息处理 我们先看看什么是消息 1.1.获取消息 想要获取消息,就必须学会getmessage函数 1.1.1.getmessage函数 有两个重载版本,它们的作用是一样的 参数filter可以筛选我们需要的消息类型 我们看看参数filter的取值 当然我们可以使用位运算组合这些值 例如,我们…

React-router 最佳实践

使用的是 BrowserRouter,Routes 和 Route,这是 react-router-dom v5 和 v6 都支持的 API。这种方式的优点是路由配置和应用的其它部分是紧密集成的,这使得路由配置更加直观和易于理解 // router/index.js import { BrowserRouter as Router,…

使用 Docker 部署 Jenkins 并设置初始管理员密码

使用 Docker 部署 Jenkins 并设置初始管理员密码 每一次开始,我都特别的认真与胆怯,是因为我期待结局,也能够不会那么粗糙,不会让我失望,所以,就多了些思考,多了些拘束,所以&#xf…

基于YOLO系列算法(YOLOv5、YOLOv6、YOLOv8以及YOLOv9)和Streamlit框架的行人头盔检测系统

摘要 本文基于最新的基于深度学习的目标检测算法 (YOLOv5、YOLOv6、YOLOv8)以及YOLOv9) 对头盔数据集进行训练与验证,得到了最好的模型权重文件。使用Streamlit框架来搭建交互式Web应用界面,可以在网页端实现模型对图像、视频和实时摄像头的目标检测功能…

Error:(6, 43) java: 程序包org.springframework.data.redis.core不存在

目录 一、在做SpringBoot整合Redis的项目时,报错: 二、尝试 三、解决办法 一、在做SpringBoot整合Redis的项目时,报错: 二、尝试 给依赖加版本号,并且把版本换了个遍,也不行,也去update过ma…

基于springboot+vue的在线考试系统

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

web自动化之PO模式

PO模式 1、为什么需要PO思想? 首先我们观察和思考一下,目前我们写的作业脚本的问题: 元素定位和操作动 作写到一起了,这就就会用导致一个问题: UI的页面元素比较容易变化的,所以元素定位和脚本操作写到一…

【Sync FIFO介绍及基于Verilog的实现】

Sync FIFO介绍及实现 1 Intro2 Achieve2.1 DFD2.2 Intf2.3 Module 本篇博客介绍无论是编码过程中经常用到的逻辑–FIFO;该FIFO是基于单时钟下的同步FIFO; FiFO分类:同步FiFO VS 异步FiFO; 1 Intro FIFO可以自己实现,但…

如何安全地进行隔离网数据导出,提升文件流转效率?

隔离网(也称为隔离区或DMZ,即Demilitarized Zone)是一种网络安全措施,用于将内部网络与外部网络(如互联网)隔离开来,以减少安全风险。隔离网数据导出通常需要采取一些特殊的安全措施来确保数据的…

pod介绍之 容器分类与重启策略

目录 一 pod 基础概念介绍 1,pod 是什么 2,Pod使用方式 3,如何解决一个pod 多容器通信 4,pod 组成 5, k8s 中的 pod 二 pause容器 1,pause容器 是什么 2,pause容器作用 3&#xff…

【嵌入式Linux】Cmake、makefile、Cmakelist

记录嵌入式 linux环境下的编译方式 测试之前确保你的 Ubuntu 机器上安装了Gcc和cmake 1. 编译有以下几种方式 在 Linux系统下,编译一个 .c文件可以有以下几种方式: 直接用 Gcc 编译器编译为可执行文件编写Makefile文件,使用 make 指令&…

[LEECODE每日一题]找出最具竞争力的子序列

好久没有更新CSDN了,这段时间学业压力比较忙所以没有时间写,今天有时间来看看LEECODE的每日一题,碰巧刷到了这样一道题; 题目给的很清楚,既输入一个序列要求给定一个子序列长度,让其输出为一个最有"竞争力"的序列,说白了就是在所有子序列比较中,处于靠前位置的元素要…

Kafka之【生产消息】

消息(Record) 在kafka中传递的数据我们称之为消息(message)或记录(record),所以Kafka发送数据前,需要将待发送的数据封装为指定的数据模型: 相关属性必须在构建数据模型时指定,其中…

第2天 搭建安全拓展_小迪网络安全笔记

1.常见搭建平台脚本使用: 例如 phpstudy IIS Nginx(俗称中间件): 什么是中间件: 中间件是介于应用系统和系统软件之间的一类软件,它使用系统软件所提供的基础服务(功能),衔接网络上应用系统的各个部分或不同的应用&#…

论文阅读--ViLD

现在的目标检测数据集,标注的类别都很有限,如图中的base categories,只能检测出toy而不能检测出细分类别,能不能在现有数据集的基础上,不额外打标注,就能直接检测细分物体? (a&#…

订餐系统总结、

应用层: SpringBoot:快速构建Spring项目,采用“约定大于配置”的思想,简化Spring项目的配置开发。 SpringMvc:Spring框架的一个模块,springmvc和spring无需通过中间整合层进行整合,可以无缝集成。 Sprin…

深度学习之Python+OpenCV+Tensorflow实时人体检测和计数

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 深度学习之PythonOpenCVTensorflow实时人体检测和计数项目简介 一、项目背景与意义 随着科技的不断发展&#xff…