Capturing Omni-Range Context for Omnidirectional Segmentation总结笔记

news2024/9/29 5:35:57

Capturing Omni-Range Context for Omnidirectional Segmentation(捕获全范围上下文进行全方位分割)

目录

一、论文出发点

二、论文核心思想

三、论文工作中主要问题

四、方法论

五、实验

六、结论


一、论文出发点

大多数用于分析城市环境的分割模型都是针对普通的、狭小的视场图像。将这些模型从它们设计的领域转移到360 °全景图像,它们的性能急剧下降。以此作为出发点希望能够构建出一种能捕获全向图像特征的分割模型。

二 、论文核心思想

1.为了弥补图像域之间在FoV和结构分布方面的差距,引入了高效并发注意力网络(ECANets),直接捕获全向(omni directional)图像中固有的长距离依赖关系。

2.由于缺乏足够的全景图像标注,引入多源全监督学习,将未标记的全景图像集成到训练中,使模型能够学习丰富的上下文先验。

3.并且提出并评估了一种全新的全景图像分割数据集Wild PAnoramic Semantic Segmentation ( WildPASS ),如下图为WildPASS标注展示:

底部图像:在不同角度方向上展开的像素类关联的类分布。

三、论文工作中主要问题

问题1:如何提取全景图像中全景上下文先验?

解决思路:提出了一个高效的并发注意力模块。可以在突出水平驱动的dependencies同时,收集全局上下文信息用于宽FoV分割。这里指的是ECANets。

问题2:没有合适的全向图像分割数据集

解决思路:提出了Wild PASS数据集,该数据集包含来自60多个城市和多个大洲的360 °图像,鼓励更真实地评估全景分割性能。

四、方法论

(1)ECANets模型具体实现过程

ECANet使用了水平部分注意力( HSA )模块金字塔空间注意力( PSA ) 模块进行有效的上下文聚合,同时相对于非局部基线在很大程度上减少了计算负担。将关注的特征图通过不同尺度的PSA,然后与HSA和主干特征图进行拼接。最后,将得到的特征图通过卷积层和上采样层进行转换,得到语义图。

(2)HSA模块的实现过程

(引入HSA目的:建立自我注意模型,以捕捉广泛的FoV依赖性)

1.首先将输入特征图沿H维度划分为N段(图中N = 4),送入卷积层生成Query Q、Key K和Value V的特征图进行自注意力。

2.进一步地,为了提取360 °区域先验和大幅度降低计算负担,对特征K和特征V进行Height-wise Strip Pooling(长条池化)得到特征K'和V'然后,由重新整形的特征Q'和K'计算得到注意力图A,计算公式如下:

(这样,就可以将每个像素与带状池化区域之间的关联起来,这直接使学习关系沿着横轴跨越360 °。)

将softmax函数应用于注意力图A,并对其进行转置得到A^{T}A^{T}和V'计算得到S',计算公式如下:

3.最后,将所有分段S'沿垂直维度H拼接,得到水平驱动输出特征O。

(通过拼接,最后得到在拥有每个分割方向的水平上下文信息的自我注意力特征图)

(3)PSA模块的实现过程

 (为了捕捉全局上下文,引入了PSA模块,通过空间池化将每个像素与全局分布的区域联系起 来)

PSA模块与HSA模块的实现过程基本一致,但是不同之处在于:没有对输入特征图进行水平分割,因此使用的是Spatial Pooling(空间池化)进行的下采样,最后直接就能得到每个像素与全局分布的区域关联起来的特征图O

(4)多源全监督学习:

1.首先使用pass piplines在针孔集上预训练的复杂架构在未标记的全景图上创建标注。

2.再通过多空间融合,对HSA和PAS模块输出的预测进行融合避免标签重叠的公式,如下图所示:

 

 五、实验

使用数据集:1.PASS数据集( 400张环形图像) 2.Wild PASS全景数据集(使用PSPNet50进行创建全景标注)

(1)在PASS数据集结果

(2)在Wild PASS数据集结果

 

六、结论

文章新颖的提出了如何在360 °全景图像上提取上下文先验的问题,并创造性的提出了两种新模块的设计HAS和PAS模块,有效的提高了模型在全景图像分割的精确度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/545954.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot+swagger项目中,controller引入@NotEmpty等校验注解的问题

springboot项目 springbootswagger项目中,controller层如果使用对基本数据类型使用 NotEmpty Length 等校验注解,controller会获取不到值,加了RequestBody后可以获取到了,但是前端传值content-type必须是text/plain。所以建议con…

考研数据结构--树和二叉树(2)

文章目录 二叉树的遍历前序遍历中序遍历后序遍历层次遍历 不用栈的二叉树中序遍历算法Morris代码分析 二叉树的构造概述如何完成二叉树的构造**回顾****思考**各种遍历序列提供的信息二叉树遍历性质性质1性质2 线索化二叉树引入定义构造 堆堆的定义堆的性质堆的建立堆的元素插入…

GPT1解读:Improving Language Understanding by Generative Pre-Training

自然语言处理NLP是当代人工智能的关键领域,包含文本识别、智能问答等多个方向任务,通过监督学习方式一般需要大量带标签数据,而对某些特定任务,获取带标签数据成本非常高。GPT通过大量的未标记文本数据来学习一个通用预训练&#…

ZiKiT DICOM 存档(PACS)模态服务器 Crack

ZiKiT结合了DICOM存档(PACS),模态工作列表服务器和HL7消息代理,它们共享相同的数据库并相互通信。 最新版本 – ZiKiT 2020 ZiKiT 提供动态映射规则和消息结构定义,同时保持合规性并遵守标准。该套件使非程序员能够在…

电动力学:电偶极辐射场

电磁辐射的产生条件 存在时变源(时变的电荷源、时变的电流源,或时变的电磁场)时变源的频率应足够高(辐射系统的尺寸大小和电磁波波长差不多时,才有可能产生明显的辐射效应)波源电路必须开放(源电…

Android 如何获取有效的DeviceId

目录 前言官方唯一标识符建议使用广告 ID使用实例 ID 和 GUID不要使用 MAC 地址标识符特性常见用例和适用的标识符 解决方案DeviceIdANDROID_IDMac地址UUID补充 总结 前言 从 Android 10 开始,应用必须具有 READ_PRIVILEGED_PHONE_STATE 特许权限才能访问设备的不可…

新手建站:腾讯云轻量服务器安装宝塔镜像和使用方法

腾讯云轻量应用服务器宝塔面板怎么用?轻量应用服务器如何安装宝塔面板?在镜像中选择宝塔Linux面板腾讯云专享版,在轻量服务器防火墙中开启8888端口号,然后远程连接到轻量服务器执行宝塔面板账号密码查询命令,最后登录和…

Java内存模型介绍

Java作为一种面向对象的,跨平台语言,其对象、内存等一直是比较难的知识点。而且很多概念的名称看起来又那么相似,很多人会傻傻分不清楚。比如本文要讨论的JVM内存结构、Java内存模型和Java对象模型,这就是三个截然不同的概念&…

系列四、vue3 初始化项目(图形化界面方式)

一、启动UI界面 vue ui 二、创建项目 2.1、在此创建项目 2.2、创建新项目-详情配置 2.3、创建新项目-预设 2.4、创建新项目-功能 2.5、创建新项目-配置 2.6、运行项目 任务》serve》运行》启动app 2.7、首页 三、安装element-plus 3.1、步骤 ①、运行 vue ui 命令&#…

【C++初阶】想要编译器为你干活吗?来试试模板吧(模板初阶)

一.泛型编程 引入 我们之前都写过交换函数Swap,例如这样的: //交换两个整型 void Swap(int*x1, int *x2) {int tmp *x1;*x1 *x2;*x2 tmp;} 如果要交换其它的类型该怎么办呢? 那只能当个CV工程师了,然后再修修改改,…

java枚举enum

目录 一、概念二、声明枚举三、枚举类四、为枚举添加方法五、EnumMap 与 EnumSet 一、概念 枚举是一个被命名的整型常数的集合,用于声明一组带标识符的常数。枚举在曰常生活中很常见,例如一个人的性别只能是“男”或者“女”,一周的星期只能…

CAN总线通讯协议学习

s目录 CAN(controller Area Network) 控制器局域网 CAN通讯 CAN总线的数据帧 解析 CAN(controller Area Network) 控制器局域网 CAN总线应用最多的是汽车领域,这里的控制器在汽车领域的专业术语是ECU.(electronic control unit)电子控制单元。可以看成…

【计算机网络之HTTP篇】HTTP协议详解

目录 一、HTTP协议概念 二、HTTP 协议格式 三、HTTP请求详解 认识URL 认识HTTP方法 GET POST Host Content-Length Content-Type User-Agent (简称 UA) Referer Cookie 四、HTTP 响应详解 状态码 200 OK 404 Not Found 403 Forbidden 500 Internal Server E…

IMX6ULL裸机篇之DDR3初始化

一. DDR3L初始化简介 I.MX6U-ALPHA 开发板上带有一个 256MB/512MB 的 DDR3 内存芯片,16 位宽,型号为 NT5CC128M16JR/MT5CC256M16EP,nanya 公司出品的,分为对应 256MB 和 512MB 容量。 我自己用的开发板上 DDR3L内存芯片型号为…

【论文阅读】REPLUG: Retrieval-Augmented Black-Box Language Models

文章目录 前言REPLUGREPLUG LSR: Training the Dense RetrieverComputing Retrieval LikelihoodComputing LM likelihood 前言 原文地址:REPLUG: Retrieval-Augmented Black-Box Language Models 本文提出REPLUG,一个将语言模型视为黑盒检索增强的语言模…

45道SQL题目陆续更新

文章目录 学习视频配置环境第一天内连接 外连接第二天 学习视频 学习视频 配置环境 四张表 配置四张表的sql语句 #创建发据库 create database frogdata charsetutf8;use frogdata;# 学生表 Student create table Student( SId varchar(10), Sname varchar(1…

网易云音乐开发--SongDetail搭建

SongDetail静态页面搭建 我们再新建一个页面songDetail 先写结构 再写结构 然后在写样式,把这个图片放进去 这样就放进去了,这里有一个新的让元素居中的方式就是,子绝父相,然后 position: absolute;top: 0;left: 0;right: 0;bot…

MultipartFile来上传单个及多个文件代码示例

目录 一、MultipartFile上传单个文件代码示例1.1、MultipartFile上传单个文件,不包含其它参数1.2、MultipartFile上传单个文件,包含其它参数1.3、MultipartFile上传单个文件,包含其它请求实体 二、MultipartFile上传多个文件代码示例2.1、MultipartFile上传多个文件,不包含其它…

java(springboot+ssm)/python/php/nodejs/基于vue的景区门票预约管理系统

后端:java(springbootssm)/python/php/nodejs/ 开发运行:微信开发者/hbuilderx 后端:idea/eclipse/vscode/pycharm 模块划分:公告类型、公告信息、用户信息、用户咨询、地区信息、景区信息、景区开放、景区预约、统计信息 本技术是Java平台的…

国考省考行测:年均增长率,等速率增长率问题

国考省考行测:年均增长率,平均增长率 2022找工作是学历、能力和运气的超强结合体! 公务员特招重点就是专业技能,附带行测和申论,而常规国考省考最重要的还是申论和行测,所以大家认真准备吧,我讲一起屡屡申…