2022_TIP_DSNet

news2025/1/21 22:32:46

Boosting RGB-D Saliency Detection by Leveraging Unlabeled RGB Images 

通过利用未标记的RGB图像来增强rgb-d显着性检测

1. 动机

1) 用于监督学习的像素级注释既昂贵又耗时。

2) 与RGB图像相比,成对的rgb-d图像更难以收集。

2. 解决方法

提出 Dual-Semi RGB-D Salient Object Detection Network(DS-Net),利用没有标记的RGB图像来增强 RGB-D 显著性检测

第一步:设计了一个depth decoupling convolutional neural network (DDCNN),包含两个分,depth estimation branch and a saliency detection branch.

1. depth estimation branch:由RGB-D 图像训练,然后用于估计所有未标记的RGB图像的伪深度图,以形成配对数据。

2. saliency detection branch:用于融合RGB特征和深度特征以预测rgb-d显著性。

第二步:将第一步中的DDCNN作为骨干网络,用于半监督的教师学生框架

第三步:介绍了未标记数据中间注意力显著图一致性损失(consistency loss ),以及标记数据监督深度显著性损失

3. 网络框架

用带标记的数据训练深度分支,将得到的模型用于生成未标记的RGB图片的深度图, 

3.1DDCNN

        包含两个分支,depth estimation branch and a saliency detection branch。给定一对输入的rgb-d图像: 将RGB图像传递到编码器以生成RGB特征R_1,R_2,R_3,R_4,深度图像送到另一个编码器提取深度特征D_1,D_2,D_3,D_4

        在depth estimation branch 中,使用“Conv(3×3) → BN → ReLU → Conv(3×3)”的卷积块将每个RGB特征R_i分解为两个特征:(1)用于估计深度图的深度感知特征R_i^d,(2)用于预测显著性的深度消除特征R_i^s深度感知特征R_i^d上采样到与R_1^d相同大小,并应用“Conv(3×3) → Conv(1×1)”的卷积块串联在一起以预测深度图。此外,我们融合R_i^dR_i^s来重建RGB特征\widetilde{R_i},并计算重建损失L_i^r来正则化解耦过程:

 其中,CB表示“Conv(3×3) → BN → ReLU → Conv(3×3)”的卷积块,Cat(·) 表示特征级联操作,L_{MSE}表示均方误差mean square error  (MSE) 损失。

        在saliency detection branch中,设计了一个深度诱导融合模块DIM),将深度消除特征R_i^s和 与每个CNN层的两个深度特征(R_i^dD_i)融合在一起,生成融合特征F_1,F_2,F_3,F_4。最后迭代合并F_1,F_2,F_3,F_4,采用3×3卷积,1×1卷积和sigmiod 激活函数生成显著图。两个相邻的特征进行相加融合时,低分辨率特征上采样到与高分辨率特征相同大小,高分辨率则是经过ASPP模块(r=1,6,8,12),目的是细化浅层特征,最后将4个分支串联再经过1×1卷积。

3.1.1深度诱导融合模块DIM

 

1. 深度门控模块 (DGM) 来融合来自输入深度图的深度特征D_i和来自深度估计分支的R_i^d,生成融合特征F_i^{dgm}2. 采用深度感知模块 (DAM) 融合R_i^sD_i,以获得新的特征F^{dam}_i。此外,拼接F_i^{dgm}F^{dam}_i,并应用3×3卷积层和sigmiod 激活函数,目的是学习用于加权深度特征D_i的注意力图A_i^dA_i^dD_i生成新的特征F_i^d,最后将F_i^dF_i^{dgm}F^{dam}_i相加生成DIM的输出特征F_i

 

 3.1.2 深度感知模块(DAM)

 

考虑到低质量深度图中的冗余和噪声以及RGB和深度特征之间的内在差异,我们设计了一种有效的融合方法来抑制噪声,并利用了两种模态的特征R_i^sD_i互补信息。受CBAM 的启发设计了DAM,配备了通道注意空间注意操作。这是通过在D_i上应用通道注意操作以加权R_i^s的不同通道来实现的,然后在D_i上计算空间注意重新校准R_i^s的逐像素显著性信息以获得F^{dam}_i:

 

 Catt(·) 包括3 × 3卷积和全局平均池化。空间注意Satt(·) 由具有softmax函数的3 × 3卷积组成。 表示逐通道乘法,而 “⊗” 表示逐元素乘法。

3.1.3 深度门控模块DGM

 

丰富了来自不同深度模态的深度表示 ,方法是考虑用于学习显著性线索的远程像素依赖性。首先,我们首先在R_i^d上应用一个3 × 3卷积层,将合成特征重塑为中间C × HW特征图,在R_i^d上应用另一个3 × 3卷积层,将合成特征重塑为另一个中间HW × C特征图,然后将两个中间特征相乘,生成大小为HW × HW的非局部相似性矩阵。此外,我们在D_i上应用3 × 3卷积层,并将所得特征重塑为中间的HW × C特征图,然后将其与非局部相似性矩阵相乘。之后,我们将由乘法产生的特征HW ×C重塑为大小为H × W × C的特征图,该特征图经过3 × 3卷积以获得DGM的特征F_i^{dgm}

 

 

 

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/92566.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]Python计算机毕业设计Django景区直通车服务系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

智能人机交互

前言 随着移动机器人越来越多地走向实 际应用,需要提高机器人与人类之 间的协同水平,实现机器人与人类的共融。 一、人机交互的三个级别 二、火星车的遥操作控制 火星车的遥操作控制(超大时延):地面团队将命令序列发至…

Linux | 网络概念理解 | 对网络的初识

文章目录重新看待计算机体系结构软件分层的思想网络中的分层协议的理解局域网的理解MAC地址 && IP地址报头的作用端口号(port)重新看待计算机体系结构 计算机由硬件组成,而不同硬件之间要怎么通信,或者说要怎么进行数据的…

STM32F4的串口烧录问题

前言:以前总是画F1的板子,第一次接触F4的芯片,画板子时串口接在了PB6、PB7上,导致烧录程序、检测芯片失败的情况。其原因是由于F1的USART1对应(PA9\PA10),而F4的USART1则对应了(PA9\PA10)和(PB6\PB7)。两个对应搞得不知…

linux安装jdk教程(手动安装/yum安装) 保姆级教程

yum安装jdk方式: 1、查询要安装jdk的版本 命令:yum -y list java* 2、选择你需要安装的版本号 命令:yum install -y 你选择的版本号 ​ 3、 查询jdk版本 命令:java -version (有版本证明安装成功了......) 手动安装方式&#…

Kibana:运用 transform 来实现服务质量目标(SLO)的可视化

Kibana 是一个有用的工具,用于监控应用程序和服务以确保它们在指定的服务级别目标内运行。 服务质量指标 (SLI) 是服务的可衡量方面,例如错误代码和延迟。 服务质量目标 (SLO) 定义应用程序或服务预期如何按照 SLI 衡量的方式执行,并在某种程…

《集体智慧编程》笔记(3 / 12):发现群组

Discovering Groups 文章目录监督学习和无监督学习监督学习无监督学习单词向量对博客用户进行分类对订阅源中的单词进行计数分级聚类绘制树状图列聚类K-均值聚类针对偏好的聚类获取数据和准备数据BeautifulSoup收集来自Zebo的结果定义距离度量标准对结果进行聚类以二维形式展现…

二、导论——可解释性机器学习(DataWhale组队学习)

目录引言ZFNet的网络结构可视化反卷积反池化反激活反卷积训练细节特征可视化特征演化特征不变性局部遮挡测试敏感性分析相关性分析消融实验宽度影响深度影响迁移学习能力有效性分析总结引言 纽约大学ZFNet,2013年ImageNet图像分类竞赛冠军模型。对AlexNet进行改进的…

Redis框架(十三):大众点评项目 达人探店 博客功能实现

大众点评项目 达人探店 博客功能实现需求:达人探店 博客功能实现业务实现总结SpringCloud章节复习已经过去,新的章节Redis开始了,这个章节中将会回顾Redis实战项目 大众点评 主要依照以下几个原则 基础实战的Demo和Coding上传到我的代码仓库…

送书福利!全自主IDE的《运动控制系统应用与实践》

功能齐全、稳定性强、简单易用的实时工控软件平台是成就工业控制的重要工具。运动控制作为工业控制领域的核心技术之一,在3C电子、锂电新能源、装配、激光加工、点胶、贴附、工业机器人等工业应用场景中发挥着巨大作用。 正运动技术自主自研的ZDevelop是国内少有的…

腾讯工作3个月,做软件测试的一些感悟

普通二本计算机专业毕业,从毕业后,第一份接触测试的工作是在一家通讯小公司,大部分接触的工作是以功能测试为主,一直都是几千块钱工资,还一度被派出差,以及兼职各种产品、运维、运营的活,感觉自…

基于FPGA的spi通信接口VHDL设计

目录 1.算法概述 2.仿真效果 3.MATLAB仿真源码 1.算法概述 SPI是串行外设接口(Serial Peripheral Interface)的缩写,是一种高速的,全双工,同步的通信总线,并且在芯片的管脚上只占用四根线,节约了芯片的管脚,同时为PCB的布

Coretex_M0工程创建

本文档介绍如何创建一份基于成熟库函数的新工程! 类似于如下的工程: 如上的MCU表示的是NXP公司封装好的关于芯片的库函数,BSP表示的是板级支持开发包,是和具体开发板外设的设备有关。 那么如果我们需要我们的工程包含这样的库函数&#xff0c…

小程序在线生成平台怎么使用?

其实目前小程序在线生成平台是比较主流的,很多小伙伴看到一些制作小程序教学,都会有“这个软件怎么下载?”、“怎么做?”之类的问题。其实小程序在线生成平台一般都不需要下载的,它主要是在网页中打开工具进行在线制作…

Jenkins在windows平台下,让Powershell、批处理可以拉起进程并保持

📢欢迎点赞 :👍 收藏 ⭐留言 📝 如有错误敬请指正,赐人玫瑰,手留余香!📢本文作者:由webmote 原创📢作者格言:无尽的折腾后,终于又回到了起点,工控,我来了 !前言 没有人喜欢windows平台下的自动化构建,一如多年前没人喜欢linux的桌面一样。 最近在考虑wi…

Back Propagation 反向传播

文章目录3、Back Propagation 反向传播3.1 引出算法3.2 非线性函数3.3 算法步骤3.3.1 例子3.3.2 作业13.3.3 作业23.4 Tensor in PyTorch3.5 PyTorch实现线性模型3.6 作业33、Back Propagation 反向传播 B站视频教程传送门:PyTorch深度学习实践 - 反向传播 3.1 引…

联通数科一面+二面+面谈 经验分享 base济南

联通数科一面二面面谈 10.8 投递简历(大数据开发岗位 base西安 有成都岗? 我怎么没看到) 10.10-12 笔试 11.05 一面 有五六个面试官 问了问题的有两个 介绍了下项目,问了些每个组件的基础知识,都是大数据的基本八股…

深聊性能测试,从入门到放弃之: Windows系统性能监控(三)任务管理器介绍及使用。

任务管理器1、引言2、任务管理器2.1 打开方式2.2 介绍2.2.1 定义2.2.2 进程2.2.3 性能2.2.4 应用历史记录2.2.5 启动2.2.6 用户2.2.7 详细信息2.2.8 服务3、总结1、引言 关于Windows系统性能监控的前两篇 《Windows系统性能监控(一) 性能监视器介绍及使用》《Windows系统性能…

深圳IB学校哪家强?入学标准如何?

我们都知道,孩子就读哪所学校,学校开设什么课程,这会直接影响孩子的留学之路和未来。 所以一般情况下,选择国际学校都是分两步走,先是需要是根据孩子的个性特点去选择能够适应的课程体系,再根据学校开设课程…

【论文阅读】inception v1学习总结

【论文阅读总结】inception v1总结1. 摘要2. 序言3. 文献综述4.动机和高层考虑4.1提高深度神经网络性能的最直接方法4.1.1 增加模型的大小4.1.2 解决增加模型大小导致的缺点思路5.结构详述5.1 Inception架构的主要思想5.2 原生inception块问题5.3 解决通道数增加问题5.4 1*1卷积…