FRNet:Feature Reconstruction Network for RGB-D Indoor Scene Parsing

news2024/10/2 6:43:08

1:铺垫
多数场景解析方法使用weak distinction和大的跨度,效果不是最好的。为了解决这个问题,作者使用了内在的多层跨模态数据反向传播去构建一个新的特征重建网络FRNet,具体来说,encoder为了获得自上而下的逐层特征。特征节点从高层流向邻近的低层,作者提出cross-level enrich 模块去选择性完善和衡量每一层的特征。最后作者通过使用不通膨胀率的膨胀卷积聚合多层特征。
深度信息可以补充结构信息,多层特征表示也很重要,通过使用多层跨模态特征去重建多层特征表示。现存的方法有两个挑战:通过大的跨度充分使用多层特征,有效聚合跨模态RGB和深度特征。
为了解决现存问题,作者提出FRNet,包含特征构造encoder(FCE),在encoder中从深层到浅层,有效的融合了RGB和Depth,获得多层特征表示。在decoder中,使用带有小的膨胀率去减少信息的损失。
先关工作跳过,里面有很多的RGB-D论文,大多是IEEE的。等有空再读。
2:框架
在这里插入图片描述
这个框架和之前的UACANet很像,都是自上而下的结构:
在这里插入图片描述
介绍:
作者使用了resnet34结构,在resnet通过不断的卷积,网络更深,获得的感受野更大,相反的是浅层有很多细节,但是也包含了噪声,因此作者引入了自上而下的传播去重构原始特征。首先作者将图片输入到网络中,五层产生五个输出,然后通过CAM产生丰富的model-aware信息。然后通过CEM重建相邻的低层,其他的几层也是这样。
在这里插入图片描述
模型的整体流程图可以用数学公式表示为:TBR进行转置上采样,CBR进行膨胀卷积。
在这里插入图片描述
在这里插入图片描述
我们可以简化来看这个模型:主要的点就是RGB和深度之间的一系列操作加到decoder上进行转置上采样。
在这里插入图片描述
下面逐个查看内部的构造:
1:Feature Construction Encoder (FCE)
在这里插入图片描述
逐层进行特征的重建,因为随着层数的下降,噪声会增加,作者进行当前层的构造时候会结合具有丰富语义信息和更少噪声的邻近层。首先先使用R5和D5产生第一个特征节点,然后利用第一个节点重建邻近的前一层R4,D4。可以表示为:
在这里插入图片描述
2:CAM:Cross-Modality Awareness Module(如何融合RGB和Depth两个分支)
在这里插入图片描述
①中的交叉即跨模态具体到反映在②中,作者受到 SA-Gate的启发:
在这里插入图片描述
图中的交叉可以表示为:
在这里插入图片描述
作者在CBR中使用了一个1x3和3x1卷积,分别在水平和垂直方向上进行特征的提取,有点类似于ESANet的non-bottleneck卷积。效果确实比普通的卷积好,同时减少了计算量。
在这里插入图片描述
深度/(RGB)信息的权重可以计算为:
在这里插入图片描述
这样Wu和Wl可以计算为:
在这里插入图片描述
最后再和原始的图片相乘:
在这里插入图片描述
通过softmax来扩大difference,使模型更好的辨别哪些是有效和无效信息。
在这里插入图片描述
为了弥补下采样丢掉的信息,将生成的fm经过四个并行的不同的膨胀率的卷积层,可以捕捉多尺度上下文信息。
在这里插入图片描述
3:CEM(Cross-Level Enriching Module)
在这里插入图片描述
逐像素相减是用来提取两个输入之间的difference,然后通过全局平均池化和sigmoid函数获得全局的difference权重。生成的权重与特征节点相乘再与resnet提取的特征图相加。
3:多尺度监督损失
之前已经提到过,不再赘述。
4:实验
作者做的实验还是挺丰富的,几乎对每一个创新点都有消融实验验证有效性。
4.1:
TITAN :12G
尺寸:640x480
backbone:ResNet34
损失:交叉熵损失+多尺度监督损失
weight decay:0.0005
lr:0.005
epoch:nyu:200/sunrgbd:100
batchsize:6
与其它方法的对比:
在这里插入图片描述
在这里插入图片描述
可视化:发现一个有意思的事情:RedNet的边缘提取的相当好,没有锯齿感且十分的笔直,和本文的结果甚至差不多,下去研究一下如何提取物体的边界。
在这里插入图片描述
消融实验:自行分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/7590.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

居民消费价格指数变化新鲜出炉,这类商品同比涨幅最大

对比分析2022年10月份全国居民消费价格数据发现,今年10 月份CPI 同比增2.5%,维持近8个月新高; PPI 同比增3.3%,同比涨幅较上个月回落 2.2 个百分点。 ​ | CPI同比增2.5%,维持近8个月新高 全国居民消费价格涨跌幅情…

C++之函数模板、类模板、模板的特化

1.什么是模板? 模板是c的一种特性,允许函数或者类(对象)通过泛型(generic types)的形式表现或者运行模板可以使得函数或类在对应不同的类型(types)的时候正常工作,而无需…

数组的substring方法和substr方法

数组的substring()方法、substr()方法都可以用于字符串截取 substr(start,length) 从指定下标开始截取指定长度的字符串,不改变字符串 start 必要,开始下标,若是负数,则从字符串尾部开始截取length 可选,若省略&…

2022年下半年系统架构师考试题

很多题目想不起来了,欢迎大佬们补充 综合知识 SASS、PASS 、IASS分别代表什么(区别是什么) A.软件即服务,平台即服务,基础设施即服务 目前Gpu的最高峰值是多少 A.100TFlops B.50TFlops C.10TFlops D.1TFlops Ai芯片…

antd常用组件 select,form等

参考代码为typescriptreact 树选择 TreeSelect 下拉选项的父子节点选中不相关 import { TreeSelect } from antd;<TreeSelectshowSearchstyle{{ width: 100% }}treeData{yyIndustryOptions} // treeNodes 数据dropdownStyle{{ maxHeight: 400, overflow: auto }} //下拉…

基于Python仓库管理系统的设计与实现django框架

摘 要 随着信息化时代的到来&#xff0c;系统管理都趋向于智能化、系统化&#xff0c;仓库管理系统也不例外&#xff0c;但目前国内的有些公司仍然都使用人工管理&#xff0c;公司规模越来越大&#xff0c;同时信息量也越来越庞大&#xff0c;人工管理显然已无法应对时代的变化…

Django 中间件

文章目录Django中间件默认中间件源码分析自定义中间件process_request&#xff08;掌握&#xff09;process_response&#xff08;掌握&#xff09;process_view(了解)process_template_response(了解)process_execption(了解)Django中间件 只要是涉及到全局相关的功能都可以使…

python基于PHP+MySQL的在线汽车租赁管理系统

随着时代的发展,汽车已经成为当代人们代步的主要工具。但是很多时候人们并没有购车的念头,这个时候就出现了一种新的行业,就是汽车租赁行业,这样不仅可以解决用车的需求,而且可以节省大量的购车成本,为了能够方便用户进行汽车租赁我们开发了PHP在线汽车租赁管理系统,本系统分为…

软件版本号详解

我们现在的生活离不开软件&#xff0c;版本号一般不会引起大家的关注&#xff0c;但是一旦软件出现了Bug或者其他问题&#xff0c;这个时候&#xff0c;软件的提供方都会让用户提供其软件的版本号。软件版本号长什么样呢&#xff1f;上面这张截图是我们常用的手机APP&#xff0…

关于git你应该知道的一些东西

前言 好好写代码&#xff0c;好好的反思踩过的坑&#xff0c;然后尽量不要给别人挖坑。这是我对自己&#xff0c;以及每个刚入行或即将的小伙伴的建议。一个软件工程项目&#xff0c;是一个系统性极强且较为复杂的工作&#xff0c;会有很多人参与到这个工作中来&#xff0c;如何…

Yarn pengding任务的原因之一:Reserved

一、背景 系统&#xff1a;linux centos7.4 Yarn&#xff1a;3.0.0-cdh6.3.2 二、现象 业务方通知&#xff0c;大部分使用yarn的任务都长时间处于执行中的状态。 三、问题排查 查看yarn的ui发现&#xff0c;memory reserved的值&#xff0c;已经和memory total等值了。 然…

Unity内实现无卡顿取图像推流/截屏等功能

文章目录 一、Unity提供的ScreenCapture取图像接口二、我们一个一个看API:三、Unity日本大神keijiro还提供了一种异步截图的方案,完整代码如下:一、Unity提供的ScreenCapture取图像接口 众所周知,Unity提供了ScreenCapture API用来获取引擎最终渲染到屏幕的图像: 二、我…

深度学习入门(三十五)计算性能 编译器和解释器

深度学习入门&#xff08;三十五&#xff09;计算性能 编译器和解释器前言计算性能——编译器和解释器教材1 符号式编程2 混合式编程3 Sequential的混合式编程3.1 通过混合式编程加速3.2 序列化4 小结前言 核心内容来自博客链接1博客连接2希望大家多多支持作者 本文记录用&…

【离散数学】第一章 测试

1. A. 对 B. 错 正确答案&#xff1a;A 2. A. 对 B. 错 正确答案&#xff1a;B 3. A. 错 B. 对 正确答案&#xff1a;B 4.p↔q⇔p↔q A. 对 B. 错 正确答案&#xff1a;A 5. A. 对 B. 错 正确答案&#xff1a;A 6.n个命题变元组成的命题公式共有( )种不同的…

小胶质细胞仅仅是神经系统内的“配角”?

大脑中存在着数量众多的神经胶质细胞&#xff0c;约占人类大脑细胞的 90%&#xff1b;不同类型的胶质细胞在起源、组成、形态和解剖学上都是不同的&#xff0c;而且它们发挥着不同的功能。 图 1. 中枢神经系统的四种神经细胞 小胶质细胞与 AD 疾病进程 小胶质细胞是一类来源于…

数据分析的重要性体现在哪?

近几年&#xff0c;数据分析成为了当今IT界的新起之秀&#xff0c;在我国互联网飞速发展的浪潮下&#xff0c;无论是公司职员还是个体商户或大公司管理者&#xff0c;都需要学习掌握数据分析的能力&#xff0c;它已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段。 那…

微信小程序复习题

文章目录填空题选择题判断题分析题&#xff08;20&#xff09;分析代码显示效果页面设计题&#xff08;40&#xff09;填空题 微信小程序创始人是 张小龙 &#xff0c;英文缩写 Mini Program小程序是一种无需下载和无需安装即可使用的应用&#xff0c;它实现了应用“ 触手可得…

[附源码]java毕业设计基于web的硕士研究生入学考务管理

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

5、Redis的发布和订阅

文章目录5、Redis的发布和订阅5.1、什么是发布和订阅5.2、Redis的发布和订阅5.2.1、客户端可以订阅频道如下图5.2.2、当给这个频道发布消息后&#xff0c;消息就会发送给订阅的客户端5.3、发布订阅命令行实现5.3.1、打开一个客户端订阅channel15.3.2、打开另一个客户端&#xf…

Day32——二叉树专题

文章目录28.删除二叉搜索树的节点29.修剪二叉搜索树30.将有序数组转换为二叉搜索树31. 把二叉搜索树转换为累加树28.删除二叉搜索树的节点 题目链接&#xff1a;450. 删除二叉搜索树中的节点 - 力扣&#xff08;LeetCode&#xff09; 如果目标节点大于当前节点值&#xff0c;则…