【论文笔记】DEEP FEATURE SELECTION-AND-FUSION FOR RGB-D SEMANTIC SEGMENTATION

news2024/11/10 12:58:25

论文

题目:DEEP FEATURE SELECTION-AND-FUSION FOR RGB-D SEMANTIC SEGMENTATION

收录于:ICME 2021

论文:Deep Feature Selection-And-Fusion for RGB-D Semantic Segmentation | IEEE Conference Publication | IEEE Xplore

[2105.04102] Deep feature selection-and-fusion for RGB-D semantic segmentation (arxiv.org)代码:暂未找到

摘要

场景深度信息可以帮助视觉信息进行更准确的语义分割。然而,如何有效地将多通道信息集成到具有代表性的特征中仍然是一个悬而未决的问题。现有的工作大多使用DCNN来隐式融合多通道信息。但随着网络的深入,一些关键的区分特征可能会丢失,这降低了分割性能。提出了一种统一高效的特征选择与融合网络(FSFNet),该网络包含一个对称的跨通道残差融合模块,用于多通道信息的显式融合。此外,网络还包括详细特征传播模块,用于维护网络转发过程中的低层详细信息。实验结果表明,与现有方法相比,该模型在两个公共数据集上取得了相当的性能。

引言

语义分割指根据语义信息对图像进行分类。RGB-D图像包含RGB图和Depth深度图,两者可相辅相成。如何有效将RGB图和Depth信息进行融合,依旧是一个问题。现有方法虽进行整合,但利用不充分。下采样时会降低分辨率导致信息丢失,使用跳接有助于细节恢复,但不具有针对性。

针对上述问题,本文提出了一种新的特征选择融合网络,从多通道表示和解码特征两个方面对RGB-D语义分割模型中的特征进行显式增强。网络的核心思想是从一个通道中选择有区别的信息来补充另一个通道,以获得良好的信息表示。此外,这项工作还针对编码器中丢失的信息,使用一些方法加以改善。

这两个方面分别对应于两个模块。对于前者,设计了对称交叉通道残差融合模块(SCRF),有效地融合了两个通道的互补信息,同时在编码阶段的信息交互过程中保持了特定通道的特异性。对于后者,设计了一个详细的特征传播模块(DFP),以鼓励网络关注编码器中丢失的重要细节,并在解码器中重复使用它们来提高分割性能。这两个模块都被设计成两个步骤:特征选择和特征融合。

本文的主要工作如下:

  • 为了解决RGB-D语义分割中的多通道信息融合问题,设计了FSFNet中的SCRF模块。该模块的核心是跨通道残差连接,它既保留了残差连接的优点,又能明确地选择和融合互补信息,形成区分和有效的表示。
  • 针对下采样过程中一些重要信息的丢失,设计了网络中的DFP模块。DFP模块首先通过注意力机制选择在编码阶段可能丢失的重要信息。然后,该模块将所选择的特征与解码器特征进行传播和融合以用于进一步分割。
  • 对于提出的模块,FSFNet使用相对简单的架构来实现出色的性能。通过一系列的实验验证了FSFNet及其模块的有效性,并在NYUDv2和SUN RGB-D数据集上取得了较好性能。

方法

 RGB-D语义分割模型,通常为编码器-解码器结构。本文改进编码器,将两个模式的互补特征进行选择融合,生成一个特定表示。再增加一条残差分支减少细节丢失。

网络以三通道RGB图和三通道HHA图像为输入,通过级联的SCRF模块选择和增强两种模式的信息表示能力,同时鼓励尽可能保存特定模式的特定特征。另外,DFP模块选择编码器的部分细节,并将其传输到解码器的相应阶段,以充分利用丢失的重要细节。

框架

(a) 整体框架。在给定RGB和HHA图像作为输入的情况下,上下编码分支分别从输入中提取特定模式的特征。中间的融合分支使用级联的SCRF模块来融合两种模式特征。融合分支中间两层的融合特征由DFP模块选择并传播到相应的解码层进行联合预测。

(b) SCRF模块的详细信息。它是基于跨模态残差连接的。SCRF首先从一个通道中选择与另一个通道互补的特征,然后在通道和级别之间执行特征融合。

(c) DFP模块的详细信息。该算法首先利用空间方向的关注度,从编码级中间两层的融合特征中选取重要但可能丢失的细节信息,然后与解码级的相应特征进行融合,进行最终的联合分割。 

 

Symmetric Cross-modality Residual Fusion (SCRF) 对称交叉模态残差融合

利用互补部分进行建模,完成跨模态信息融合。两个步骤:特征选择和特征融合。

 

 

 

 

 

Detailed Feature Propagation (DFP)  详细特征传播

 

 Loss 损失函数

 

实验

数据集和评价指标

 实验细节

 实验结果

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/68539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]Python计算机毕业设计Django学生宿舍维修管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

仿QQ音乐(HTML+CSS)

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

[安装] Doris集群搭建环境

参考文献 参考链接 推荐指数 Doris集群安装部署(详细) [火][火][火][火][火] Doris学习笔记之数据表的创建 [火][火][火] doris官网0.15版本的安装部署 [火][火][火][火][火] Doris0.15升级到1.1.1 [火][火][火][火][火] [说明] Doris使用…

7个有用的Pandas显示选项

Pandas是一个在数据科学中常用的功能强大的Python库。它可以从各种来源加载和操作数据集。当使用Pandas时,默认选项就已经适合大多数人了。但是在某些情况下,我们可能希望更改所显示内容的格式。所以就需要使用Pandas的一些定制功能来帮助我们自定义内容…

Word控件Spire.Doc 【图像形状】教程(13): 如何在C#中对齐word文档上的形状

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转…

poi-tl实现对Word模板中复杂表格的数据填充

文章目录前言what poi-tlwhy poi-tlHow poi-tl1. 版本问题2. 集成和使用3. SpringEL表达式总结前言 开发时, 我们有时需要进行word类型表格导出, 而对于表格操作. 我们一般可能会倾向于使用 poi 进行操作. 但poi操作比较复杂, 所以就在寻找一种可以快速将内容填充到表格中的工具…

yolov7配置与训练记录(二)

yolov7配置与训练记录(一) 已经完成了环境的配置,下面开始文件内部的操作 yolov7官方下载地址为 git clone https://github.com/WongKinYiu/yolov71 将下载好的预训练权重放在yolov7-main/weights内 需要在yolov7中新建weights文件夹(也是为了方便管理权重文件) 测试 pyth…

单调队列算法总结

背景 单调队列,即为单调递减或者单调递增的队列。队列中的元素只能在队尾入队、从队首或者队尾出队。 单调队列的基本实现就是维护一个双向队列,只有当一个元素是当前最值、或者可能成为最值时才保留,否则出队。 单调队列通常用来解决在滑…

NR 大规模天线设计--1

参考《无线系统设计与国际标准》 概述 空间自由度是多天线系统获得性能增益的源泉。随着有源天线技术理论的出现, 为MIMO维度的扩展奠定了理论基础,有源天线技术在商用移动通讯领域的发展, 对天线的进一步扩展,尤其对信道垂直维…

Java常用API

Java常用API什么是API?Object类的作用:Object类的常用方法:Object的toString方法:Obiect的equals方法ObiectsStringBuilderMathSystem类概述BigDecimal什么是API? 1.API应用程序编程接口。 2.简单来说:就是Java帮我们…

JAVA中变量与常量

文章目录0 写在前面1 变量1.1 声明变量1.2 变量初始化2 常量3 写在最后0 写在前面 所有程序设计语言一样,Java 也使用变量来存储值。常量就是值不变的变量。 1 变量 1.1 声明变量 格式 类型 变量名; 例如: int index; double salary; long earthPop…

华为云发布CodeArts Req需求管理工具,让需求管理化繁为简

摘要:华为云正式发布CodeArts Req,这是一款自主研发的软件研发管理与团队协作工具,旨在助力企业大规模研发转型成功,释放组织生产力。本文分享自华为云社区《华为云发布CodeArts Req需求管理工具,让需求管理化繁为简》…

代码随想录刷题day56 583. 两个字符串的删除操作;72. 编辑距离;编辑距离总结篇

代码随想录刷题day56 583. 两个字符串的删除操作;72. 编辑距离;编辑距离总结篇 关于编辑距离的一些题目。 583. 两个字符串的删除操作 583. 两个字符串的删除操作 - 力扣(Leetcode) 化简这一步不容易想到。原理就是两个都删除…

华为云大数据BI赋能企业数字化发展

企业在数字化转型过程中面临着不少挑战,比如数据整合能力有限、不足的需求快速响应能力、缺乏数据管理机制和保障、自建分析平台成本高等等。所以各大企业都希望通过一个大数据智能系统来全方位帮助企业处理数据分析,做好智能决策。因此,对于…

基于SOPHON TPU架构实现 Faiss 的两个查询接口

文章目录1. Faiss 简介2. 距离度量3. 在 Sophon TPU 上的接口实现3.1 Sophon TPU3.2 indexflat 实现3.3 indexPQ 实现 1. Faiss 简介 Faiss 库是 Facebook 开发的一个用于稠密向量相似性搜索和聚类的库,该库包含有诸多向量相似性搜索的算法。向量相似性搜索是将一…

【Pytorch】第 2 章 :马尔可夫决策过程和动态规划

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

python之对比两张图像的相似度

python之图像背景识别 本着结合实际工作,实际落地并已应用的态度去码文。 python之对比两张图像的相似度 需求:在某个手机端项目中,有多个页面图片,但每个图片都做了相应的修改,由于这种图片非常多,高达上万…

澳亚通过聆讯:上半年营收近3亿美元 元气森林与新希望乳业是股东

雷递网 雷建平 12月6日澳亚集团有限公司(简称:“澳亚集团”)日前通过聆讯,准备在港交所上市。澳亚集团是2022年10月中旬递交招股书,不到2个月时间,澳亚集团就通过上市聆讯,这在最近两年的港交所…

小型扫雪机结构设计

目 录 摘 要 I ABSTRACT II 1、绪论 1 1.1 选题意义 1 1.2小型扫雪机国内发展现状 1 1.2.1国内小型扫雪机械现状 1 1.2.2犁式小型扫雪机 2 1.2.3旋切式小型扫雪机 2 1.2.4国内小型扫雪机械的发展方向 3 1.3国外道路小型扫雪机械技术发展概况 3 1.3.1综合式扫雪 3 1.3.2融雪扫雪…

【华为上机真题 2022】数组组成的最小数字

🎈 作者:Linux猿 🎈 简介:CSDN博客专家🏆,华为云享专家🏆,Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我,关注我,有问题私聊! &…