2022_SPIC_FANet

news2025/1/16 3:33:01

Feature aggregation network for RGBD saliency detection 

1. 动机

如何将RGB和Depth充分挖掘和融合仍是一个关键问题。

第一个问题是如何从深度图中充分挖掘几何信息,从而可以可靠地反映场景的空间结构。

第二个问题是如何有效地融合外观信息和几何信息,即有效的RGB和深度特征,其中RGB图像和深度图的内在属性存在很大差异。

2. 方法

提出FANet,主要包括两个部分

1. 特征提取模块(非对称架构)

2. 特征聚合模块(主要特点),由两部分组成:REM(区域增强模块),HFM(分层融合模块)

REM(区域增强模块):用于区分显著目标背景

HFM(分层融合模块):用于逐步整合高级语义信息低级空间细节,其中K最近邻图神经网络 (KGNNs) 和非局部模块 (NLM) 嵌入HFM中,以分别挖掘几何信息增强高级外观特征

3. 网络框架

 

KGNN(K最近邻图神经网络):充分挖掘几何信息。

NLM(非局部模块):获取全局语义特征。

为什么深度分支只有3层?

深度数据包含更丰富的空间位置信息,并且通常被视为RGBD显着性检测的辅助组件。同时,浅层的深层特征通常传达空间信息,而深层特征则呈现丰富的语义信息。因此,我们的模型部署了浅层结构来提取深度特征,这足以使depth branch从深度图中获取空间线索

3.1 REM(区域增强模块)

 REM作用:初步融合,大致定位显著目标并融合跨模态特征。

具体过程:针对于提取前三层的RGB和深度特征

1. 元素求和:用于初步融合。

2.sigmoid激活函数:将特征值范围映射为从0-1。

3.做大池化:特征选择。

4.反向最小池化:突出非显著区域。(“-”表示反向操作)

 以上操作的作用:能够更加关注显著对象和背景

5. FFG和FBG元素求和:得到关注引导特征 𝐅𝐴,它充当注意力图,分别突出显示显著目标和抑制非显著区域。

6.将特征𝐅𝐼𝐷 𝑖 与 特征 𝐅𝐴 相乘再相加:得到深度特征𝐅𝑅𝐸 𝑖,关注显著对象,同时保留原始信息。

REM使模型能够产生更准确的显着性预测结果,因为它不仅可以增强显着对象,而且可以有效地抑制非显着区域。 

3.3 KGNNs (K-最近邻图神经网络)

重点是为了充分挖掘几何信息.。。。。。。。(不太关注省略)

3.4 HFM (分层融合模块)

具体地,图3所示的HFM是基于池化的结构,它引入了多尺度体系结构,并以粗到精的方式集成了多级深度特征。 图2中,HFM 𝑖 (𝑖 = 2, 3,4) 努力对HFM(𝑖 +1)的输出进行据聚合 (意思就是第4层聚合第5层,第3层聚合第4层,第2层聚合第3层),jX 表示上采样与 同样空间大小。

具体而言,首先,对于每个HFM 𝑖 (𝑖 = 2,3,4),它包含四个子分支: 一个本身和三个子分支,它们是平均池化 (降采样) 层,采样率分别为2、4和8。然后,在每个平均池化层之后,有一个3 × 3卷积层和一个双线性插值层。依次通过元素求和来融合四个子分支的特征图。接下来,部署双线性插值层 (upsample) 和3 × 3卷积层以进一步促进深度特征。这样,前面的分层融合模块HFM(𝑖 +1) 的输出 (即) 首先用这个结构进行处理,我们就可以得到初始的深度融合特征

 最后,如前所述,REM(𝑖 − 1) 的输出 (即) 和高级外观特征 (即 ) 也被馈送到,产生融合的深度特征 ,也是的输入。总的来说,这个过程可以定义如下:

 

当 𝑖 = 4时,我们将 与使用KGNNs生成的结合起来,为分层深度特征融合产生了更具代表性的深度特征。因此,HFM4的输入,即 ,可以表述如下: 

 

其中,图2所示的 𝐅𝐼𝐷𝐺 表示完全集成了外观信息和几何信息的混合特征,[⋅] 表示串联操作。

此外,包括HFM5和HFM1 ∗ 的第5和第1分层融合模块与HFM 𝑖 不同 (𝑖 = 2、3、4)。具体地说,首先,根据图2,我们可以发现HFM5的输入包含来自RGB分支的深层特征,包括 𝐅𝐼 5和 𝐅𝐼 4,以及NLM特征 。对于HFM1 ∗,其输入仅包括HFM2的输出 (即 𝐅𝐻𝐹 2)。其次,HFM5和HFM1 ∗ 仅配备3 × 3卷积层。因此,整个计算过程可以定义为 

 

 

 

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/79009.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

koa项目

一.koa起步 1.项目初始化 执行 npm init -y ,生成 package.json npm init -y2.安装koa 执行命令 npm install koa3.编写基本app 创建 src/main.js //1.导入koa包 const Koa new require("Koa");//2。实例化app对象 const app new Koa();//3.编写中间件 app.…

基于C#+Mysql实现(WinForm)企业的设备管理系统【100010018】

企业的设备管理系统 1 引言 企业的设备管理在企业的生产制造和管理过程之中意义比较重大,明确企业的设备的产权和维护成本对于企业的成本控制和财务管理之中起到了重要的作用。随着市场竞争的加剧,现代企业所处的市场环境发生了深刻的变革,…

JDK19都出来了~是时候梳理清楚JDK的各个版本的特性了【JDK13特性讲解】

JDK各个版本特性讲解-JDK13特性 一、JAVA13概述 2019年9月17日,国际知名的OpenJDK开源社区发布了Java编程语言环境的最新版本OpenJDK13。 Features:总共有5个新的JEP(JDK Enhancement Proposals): http://openjdk.java.net/projects/jdk/13/ Features: …

java基于springboot的人事管理系统-计算机毕业设计

开发环境 开发语言:Java 框架:springboot JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 数据库工具:Navicat11 开发软件:eclipse/myeclipse/idea Maven包:Maven 项目介绍 在这个计…

m基于GA遗传优化的三维工程施工设施布局算法matlab仿真,显示二维和三维布局优化效果

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 GA把问题的解表示成“染色体”,在算法中也即是以二进制编码的串。并且,在执行遗传算法之前,给出一群“染色体”,也即是假设解。然后,把…

Matplotlib学习笔记(第二章 2.13 Matplotlib中的图形(三))

图例(Legends) legend()函数,使用MATLAB兼容的图例,放置函数自动生成图形图例。 感谢查尔斯特沃迪对图例功能的投入。 Fig. 19: Legend 文本对象的Tex表示法(TeX-notation for text objects) 下面是Matplotlib内部的mathtext工程支持的许多Tex表达式…

基于C#+SQLServer 2005实现(WinForm)校园卡消费信息系统【100010013】

校园卡消费信息管理系统 一、前言 1.1 选题说明 校园卡消费信息系统是一个实用并且与我们的学校生活密切相关的管理信息系统;如果能够很好的研究、开发并加以利用,校园卡的相关业务会变得更加简单、学生能更便利地进行消费同时准确了解自己的消费情况…

信号包络提取

目录 一、信号包络提取的相关应用: 二、信号包络提取方法 1、希尔伯特变换-Hilbert Transform 1.1 公式原理 1.2 例子说明 2、平方能量包络提取 3、香农能量包络提取 三、3种方法的对比 一、信号包络提取的相关应用: 1)当某一个机械部…

多副本自动化发布——standalone下

一: supervisor 具体这玩意是干嘛的,我就不说了,大家自己看官网: http://www.supervisord.org/ 接下来快速部署一下。 1. pip pip是python的一个包管理器,类似于nuget,如果你的centos上没有安装,那么请执行下面命令。 1 yum -y install epel-release 2 yum -y inst…

经矩形窗截断的信号频谱泄露现象研究-附Matlab代码

⭕⭕ 目 录 ⭕⭕✳️ 一、频谱泄露现象✳️ 二、原因分析以及解决方法✳️ 三、Matlab程序获取与验证✳️ 一、频谱泄露现象 有一个余弦信号,信号频率30Hz,信号为x(t)cos(2π30t),采样频率fs128Hz,样本长度分别取N128和N100&…

代码随想录算法训练营第四天| 24. 两两交换链表中的节点 ,19.删除链表的倒数第N个节点 ,面试题 02.07. 链表相交 ,142.环形链表II

代码随想录算法训练营第四天| 24. 两两交换链表中的节点 ,19.删除链表的倒数第N个节点 ,面试题 02.07. 链表相交 ,142.环形链表II 24. 两两交换链表中的节点 用虚拟头结点,这样会方便很多。 本题链表操作就比较复杂了&#xff…

MicroPython-On-ESP8266——8x8LED点阵模块(4)基于MAX7219滚动显示字符/图案

MicroPython-On-ESP8266——8x8LED点阵模块(4)基于MAX7219滚动显示字符/图案 1. 继续折腾点阵模块 咱们已经学习了点阵屏基础电路与驱动原理,并用74HC595和MAX7219都成功地驱动点阵屏显示了爱心图案。 MicroPython-On-ESP8266——8x8LED点…

python-(6-5-2)爬虫---处理cookie来获取书架数据

文章目录一 需求二 流程分析1 登录2 获取书架的数据三 完整代码一 需求 通过处理cookie来访问自己的书架资源。 二 流程分析 带着cookie,去请求url,得到书架内容。 要将上述的两个操作连续起来,可以使用session。 session是一连串的请求…

自动驾驶之多任务方法调研

1. YOLOP github C TRT TX2 我们提出了一种高效的多任务网络,该网络可以联合处理自动驾驶中的目标检测(车,没有红绿灯)、可驾驶区域分割和车道检测三个关键任务 速度: TX2上23FPS;TAITAN XP上41FPS. 自测结果: 灵活性: 支持…

RNN LSTM GRU

GRU是LSTM的简化结构,而LSTM是RNN的优化结构。 1.RNN RNN对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息. 将网络的输出保存在一个记忆单元中,这个记忆单元的输出经过权重参数调整后和下一次的输入一起进入神经网络中…

队列之王: Disruptor 原理、架构、源码 一文穿透

文章很长,而且持续更新,建议收藏起来,慢慢读!疯狂创客圈总目录 博客园版 为您奉上珍贵的学习资源 : 免费赠送 :《尼恩Java面试宝典》 持续更新 史上最全 面试必备 2000页 面试必备 大厂必备 涨薪必备 免费赠送 经典…

MySQL innodb引擎架构分析-Redo log

文章目录系列文章目录前言一、Redo log是什么?二、Redo log是怎么工作的Redo log的组成Redo log的配置Redo log何时刷盘总结系列文章目录 1. MySQL innodb引擎架构分析-Buffer Pool 2. MySQL innodb引擎架构分析-Redo log 前言 在MySQL的事物处理过程中&#xff0c…

12 款 yyds 的 IDEA插件,配上18条使用技巧,绝了

工欲善其事,必先利其器。想要提升编程开发效率,必须选择一款顺手的开发工具。 JetBrains 公司提供了一系列功能强大、风格统一的开发工具,深受开发者喜爱。其中,IDEA 是面向 Java 开发的专业 IDE(集成开发环境&#x…

python os.system调用别的系统程序总出现一闪而过的黑框解决办法

python os.system调用别的系统程序总出现一闪而过的黑框解决办法 今天打包了py程序,运行的时候发现老是有个黑框一闪而过。经过多次尝试发现是os.system的问题,调用这个函数会调用cmd,所有会出现短暂的黑框显示。 解决办法1:换用…

HarmonyOS跨端迁移开发代码演示

目录说些废话开源代码环境代码ability_main.xmlconfig.jsonMainAbility.javaMainAbilitySlice.java测试说些废话 官方文档:跨端迁移开发指导(基于java开发)     下面环境里写的两台真机我测试的时候无法正常产生回迁效果,所以…