FRNet:Feature Reconstruction Network for RGB-D Indoor Scene Parsing实验补充

news2024/9/22 13:30:21

FRNet做了大量的消融实验,这里仔细来分析一下。
1:ResNet backbone:
作者消融实验使用了ResNet34作为backbone来提取特征,将最后一层的输出简单相加起来,然后通过不断的上采样获得最终的输出。并且只在最后一层进行监督。最终在NYU取得了45.9%的成绩。我自己也跑过,说实话有些偏高。
在这里插入图片描述
在这里插入图片描述
可视化:
在这里插入图片描述
作者提到FRNet为什么可以获得比较好的结果其原因是因为考虑到了跨模态的信息,多层信息,上下文信息,多尺度监督。
接着作者对FCE的四个变量进行验证:
WA表示移除掉所有的重建操作,即CEM,而多层特征表示直接又相加替换掉。效果可以达到49.6。相比基础模型多了个信息的回流和融合上采样。等我下去试试这种top-down的结构的表现再回来。
在这里插入图片描述
在这里插入图片描述
可视化:
在这里插入图片描述
我们通过图片可以看到,如果不对RGB和Depth进行重建和融合,图片的边缘会比较模糊,且有大面积的涂抹感。
OH操作表示重建操作只在第四层有,且反向不再执行。
在这里插入图片描述
结果:相比于WA提升很明显有3.1%的提升。
在这里插入图片描述
OR表示我们只重建RGB分支,OH表示我们只重建Depth分支。我们只画rgb,depth同理。效果有所降低,说明只对RGB或Depth分值进行重建不如同时进行重建。
在这里插入图片描述
接着作者验证了添加第一层对模型的结构的影响:
在这里插入图片描述
结果:添加了不如不加的好,因为第一层噪声比较多。同时参数量肯定增加了不少在这里插入图片描述
作者验证了CAM的三个变量:
在这里插入图片描述
首先W+表示将所有的CAMs替换为逐像素相加。在这里插入图片描述
结果:51.3%
在这里插入图片描述
WD表示移除掉权重相乘的Wd操作。
在这里插入图片描述
结果:提升到了52.4%相比于逐像素相加,效果提升了1%。
在这里插入图片描述
WOA表示用逐像素相加和卷积替代ADr和ADd:
在这里插入图片描述
结果:和WD结果差不了多少。
在这里插入图片描述
WOC:表示移除多尺度特征提取。
在这里插入图片描述
结果:相比于之前的效果降低了一些,可以知道多尺度特征提取是有用的,即ASPP比一般的卷积效果好一点,这个我也经过实验的。
在这里插入图片描述
WSOF:
在这里插入图片描述
结果:稍微有点降低。
在这里插入图片描述
接着是
CAM
模块的效果可视化:
在这里插入图片描述
接着是
CEM
的三个变量:
在这里插入图片描述

首先是RC,删除掉所有的CEMs,输出值用原始的RGB替换掉,这里的原始RGB到底是输入的RGB还是经过每层卷积后的RGB,这里暂且为经过每层卷积后的RGB。
在这里插入图片描述
结果:相比于最好的结果降低了1点多。
在这里插入图片描述
结果可视化:
在这里插入图片描述
C+:用SUM替代所有的CEMs。
在这里插入图片描述
结果:相比于不加高层次的语义信息还是有些许提升。
在这里插入图片描述
CA:验证逐像素相减的有效性,将减法替换为加法。
在这里插入图片描述
结果:有所下降,相比于逐像素相加,相减可以有效地突出特征的差异。
在这里插入图片描述
CA:将CEM和CAM替换为sum。
在这里插入图片描述
结果下降了4%,证明CAM和CEM的有效性。
在这里插入图片描述
总结:
1:类似于TOP-Down结构效果还是挺好的。即高层语义信息向低层的细节特征flow。
2:整个模型总体看来就是一个点即RGB和Depth的融合问题。融合的效果好最后的结果也是很好的,比如SA-Gate,encoder只关注RGB和Depth的融合问题,decoder比较简单。
3:RGB和Depth融合,一般三四个分支就足够的,不用太多,说的就是第一层,即经过池化后融合大可不必和decoder融合,增加计算量,并且第一层特征噪声比较多。
4:跨模态,跨层融合比单一的融合效果更好。同时注意力也是必不可少的。
5:类似于ASPP的结构获得更大的感受野,加在模型中会有一点提升。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/12773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FAM DBCO, 6-isomer,DBCO-羧基荧光素琥珀酰亚胺酯-6-异构体

产品名称:DBCO-羧基荧光素琥珀酰亚胺酯-6-异构体 英文名称:FAM DBCO, 6-isomer 荧光素 (FAM) 是荧光染料之一。FAM 的这种衍生物含有环辛炔基团(二苯并环辛炔,缩写为 DBCO 或 ADIBO),用于通过无铜、应变促…

MyBatis 关联映射

文章目录一、关联映射概述二、一对一查询1.association 元素2.嵌套查询实例演示3.嵌套结果集实例演示三、一对多查询1.collection 元素2.嵌套结果集实例演示四、多对多查询1.嵌套查询实例演示2.嵌套结果集实例演示五、自动补全 get、set 方法一、关联映射概述 在此之前&#x…

飞瞳引擎™集装箱AI检测云服务,集装箱信息识别功能免费,全球顶尖AI高泛化性,正常集装箱识别率99.98%,全球2000企业用户

党的二十大报告指出,加快发展物联网,建设高效顺畅的流通体系,降低物流成本。空箱闸口智慧监管为青岛港提高集装箱运输物流效率提供了保障。飞瞳引擎™AI集装箱识别检测云服务,自动化识别检测集装箱信息大幅降低物流成本提升效率&a…

EFK部署centos7.9(三)Kibana部署

系统类型:Centos7.9 节点IP: 192.168.11.140 软件版本:nginx-1.14.2、kibana-6.5.4-linux-x86_64.tar.gz 上传或者下载安装包 Wget https://artifacts.elastic.co/downloads/kibana/kibana-6.5.4-linux-x86_64.tar.gz tar zvxf kibana-6.5.…

供应链解决方案SRM是什么?企业实施SRM有什么价值?

企业业务对外的两个最重要的出口就是广义的 “买”和“卖”。在“卖”的方面,企业为了使自己的产品和服务赢得市场、赢得客户,更为重视这方面的管理和更加投入了在市场上的力度。管理软件供应商纷纷推出了CRM产品,企业也开始利用这种管理思想…

字符串的算法题目

题目一: 描述 对于一个长度为 n 字符串,我们需要对它做一些变形。 首先这个字符串中包含着一些空格,就像"Hello World"一样,然后我们要做的是把这个字符串中由空格隔开的单词反序,同时反转每个字符的大小写…

RabbitMQ 服务启动失败问题小结(Windows环境)

RabbitMQ 服务启动失败问题小结(Windows环境) 最近在Windows环境上安装RabbitMQ服务时,踩了不少坑,往上的回答让人很崩溃,几乎一样的回答,起不到帮助作用;特此做个记录总结; *****…

Nginx缓存配置教程

问题引出 假设某电商平台商品详情页需要实现 700 QPS(假设宽带是千兆宽带) 千M局域网宽带网卡速率按照1000进位,所以1Gbps1,000,000,000bps125,000,000Bps≈119.21MB/s 当达到500QPS 的时候很难继续压测上去。 假设每个页面主体渲染所需要的…

java的static关键字及类加载顺序

Java中static可以修饰类、变量、方法甚至可以构成静态块,让我们来了解下它们各自的使用以及加载顺序吧。 基本用法 static关键字修饰类 java里面用static修饰内部类,普通类是不允许声明为静态的,只有内部类才可以。 public class StaticT…

苹果电脑硬盘读写软件有哪些?Tuxera NTFS2023mac读写硬盘软件

格式化是将硬盘重置到初始状态或者是转换硬盘格式所需的一项重要步骤,格式化可以解决大部分用户遇到的硬盘问题,不过在进行格式化之前,大家需要提前了解格式化的具体注意事项,以避免不必要的损失。下面本文就来着重介绍磁盘格式化…

windows xp 邮件服务器漏洞溢出

缓冲区溢出攻击过程概念解释:第一步:入侵着测试目标机的25和110端口第二步:入侵着测试目标机缓冲区溢出第三步:判断目标机器是否发生缓冲区溢出第四步:得到确切缓冲区溢出位置所在的区间。第五步:得到确切缓…

基于低代码开发平台搭建的生产制造管理系统

在现代化社会中,信息化管理模式早已成为企业管理的主流趋势。尤其是随着企业信息化的程度已经成为影响企业创新、发展以和企业经济效益的重要因素之后,生产管理信息化就变得至关重要。因此,拥有一套完备的生产制造管理系统对于提高企业的工作…

Nginx安全控制

安全隔离 通过代理分开了客户端到应用程序服务器端的连接,实现了安全措施。在反向代理之前设置防火墙,仅留一个入口供代理服务器访问。 使用SSL对流量进行加密 常用的http请求转变成https请求,因为http协议是明文传输数据,存在…

黑马redis学习记录Ⅲ SpringDataRedis客户端

学习视频:https://www.bilibili.com/video/BV1cr4y1671t/ SpringDataRedis客户端 SpringData 是 Spring 中数据操作的模块,包含对各种数据库的集成,其中对 Redis 的集成模块就叫做 SpringDataRedis,官网地址:https://…

基于eNSP中大型校园/企业网络规划与设计_综合大作业

作者:BSXY_19计科_陈永跃BSXY_信息学院注:未经允许禁止转发任何内容基于eNSP中大型校园/企业网络规划与设计_综合大作业前言及技术/资源下载说明( **未经允许禁止转发任何内容** )一、设计topo图与设计要求(简单列举18个)二、相应…

漏洞深度分析|Apache Airflow example_bash_operator DAG 远程代码执行漏洞

项目介绍 Airflow 是一个使用 python 语言编写的 data pipeline 调度和监控工作流的平台。 Airflow 是通过 DAG(Directed acyclic graph 有向无环图)来管理任务流程的任务调度工具, 不需要知道业务数据的具体内容,设置任务的依赖…

Vue实现搜索关键字标红高亮加粗

博主介绍 📢点击下列内容可跳转对应的界面,查看更多精彩内容! 🍎主页:水香木鱼 🍍专栏:后台管理系统 文章目录 简介:这是一篇有关【Vue实现搜索关键字标红高亮加粗】的文章&#xf…

光流法draw_flow()函数报错

光流法draw_flow()函数报错 1 import cv22 from scipy import *3 4 5 def draw_flow(im, flow, step16):6 """ Plot optical flow at sample points7 spaced step pixels apart. """8 h, w im.shape[:2]9 y, x mgrid[step / 2…

苹果电脑pd工具箱Parallels Toolbox中文

ParallelsToolbox中文版是一款体积小巧、功能齐全的电脑系统工具箱,Parallels Toolbox将所有的功能均非常直观的展现出来了,在这里可以轻松实现驱动器清理、视频转换、桌面隐藏、锁定屏幕、音频录制等一系列操作。 专为创意人士、学生、小企业主、长期多…

这些基本语法规则你还不知道?那你的Python还没入门...

官方对Python的介绍如下:Python是一款易于学习且功能强大的编程语言。它具有高效率的数据结构,能够简单又有效地实现面向对象编程。 Python有着非广泛的应用,几乎所有大中型互联网公司都在使用Python,例如国外的Google、Youtube、…