End-to-End视觉里程计新突破:从运动模糊图像中精确估计相机姿态

news2024/11/16 13:36:12

更多优质内容,请关注公众号:智驾机器人技术前线

1.论文信息

  • 论文标题:MBRVO: A Blur Robust Visual Odometry Based on Motion Blurred Artifact Prior

  • 作者:Jialu Zhang, Jituo Li*, Jiaqi Li, Yue Sun, Xinqi Liu, Zhi Zheng, and Guodong Lu

  • 作者单位:浙江大学机械工程学院流体动力与机电系统国家重点实验室,设计工程及数字孪生浙江省工程研究中心

  • 论文地址:https://ieeexplore.ieee.org/abstract/document/10636188

  • 项目地址:https://github.com/zhangcv123/MBRVO-Dataset

2.摘要

如何从运动模糊的图像中估计相机姿态仍然是视觉里程计的一个挑战。由于相机运动期间的曝光,模糊伪影是不可避免的。虽然当前的视觉里程计将它们视为噪声,我们认为有必要从模糊伪影中提取潜在信息,因为它们包含了相机运动的先验知识。基于此,我们提出了一种抗模糊的视觉里程计,它通过曝光轨迹提高了相机姿态估计的准确性。具体来说,我们首先使用曝光轨迹来指导相邻帧之间的像素匹配。然后根据曝光轨迹的大小生成模糊掩模。该掩模使姿态模块对严重模糊区域的特征信息关注较少。实验表明,我们提出端到端视觉里程计在大多数运动模糊数据集的序列上都取得了有竞争力的性能。

3.主要贡献

  • 本文首先提出了一种方法,通过利用运动模糊中包含的先验来提高视觉里程计的性能。匹配约束指导光流的方向,模糊掩模使得姿态模块更多地关注在清晰区域的特征;

  • 提出了第一个大规模运动模糊合成数据集,并已开源。它为解决模糊问题的视觉里程计研究提供了基础;

  • 实验表明,我们提出的视觉里程计在运动模糊数据集上实现了有竞争力的性能。

4.核心思想与方法

本文的端到端视觉里程计通过使用模糊图像中包含的先验信息,在运动模糊场景中实现了更准确的位姿估计。如下图所示,本文的方法由两个模块组成。匹配模块估计代表图像运动信息的光流。姿态模块基于匹配模块提供的光流估计相机姿态。

MBR-VO(运动模糊鲁棒视觉里程计)框架的概述

MBR-VO(运动模糊鲁棒视觉里程计)框架的概述

匹配模块由两部分组成:MotionNet和FlowNet。MotionNet从运动模糊图像中提取曝光轨迹,而FlowNet利用曝光轨迹来限制相邻帧之间像素匹配的方向。

姿态模块由掩模分支和光流到姿态分支组成,如下图所示。掩模分支基于曝光轨迹生成掩模。光流到姿态分支使用光流、内在层和掩模作为输入来估计相机姿态。

姿态模块结构

姿态模块结构

5.实验仿真验证

6.总结 && 展望

本文提出了一种抗模糊的视觉里程计,它能够从运动模糊的图像中稳健地估计相机姿态。与之前忽略模糊图像内运动信息的方法不同,本文的方法从运动伪影中提取曝光轨迹作为先验信息。这使本文的方法在运动模糊数据集上实现了有竞争力的性能。此外,本文还提出了并发布了一个大规模运动模糊的SLAM数据集。

目前,MotionNet在低纹理区域生成的错误先验会降低某些序列上的视觉里程计性能。在未来,我们计划设计一个子网络来忽略这些区域。此外,我们将探索使用多帧图像估计相机姿态。通过具有低级别模糊的前帧,有可能从严重模糊的帧中估计运动。

近期知识星球部分文章分享

文章一:多模态传感器数据融合在无人机SLAM中的应用研究综述

文章二:四层因子图优化技术,提升机器人在复杂环境中的定位与情境感知能力

文章三:瑞典皇家理工学院学位论文,探索多自主水下航行器的同时定位与地图构建

文章四:提高LIO在激烈运动场景中的精度:基于SOD的自适应框架

文章五:1%的顶尖软件工程师与其他99%的不同之处在哪里?

文章六:主动SLAM的前沿:历史视角与未来研究方向

文章七:首个全面综述!移动机器人的全局激光雷达定位:最新进展与未来方向综述

本文仅做学术分享,如有侵权,请联系删文!

更多优质内容,请关注公众号:智驾机器人技术前线

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2076364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

饮水机复杂交互功能联网调试

饮水机复杂交互功能联网调试 引言 饮水机我们从最开始的放水和加热, 逐渐拓展到保温功能, 童锁功能, 红外检测功能, 对于这些复杂的交互功能, 我们如果通过按键进行调试, 会极大的增加我们的开发时间和成本, 如果我们频繁的进行烧录, 则如果涉及到一些中间变量, 则无法进行调试…

帆软BI怎么制作不等宽柱状图

帆软BI怎么制作不等宽柱状图 文章目录 帆软BI怎么制作不等宽柱状图不等宽柱状图起源一、怎么做不等宽柱状图准备二、操作步骤1.展示效果2.操作步骤-3.操作步骤 -图形属性4.操作步骤 -组件样式5.操作步骤 -横轴和纵轴6.完成7.不等宽柱状图与传统等宽柱状图对比 总结 不等宽柱状图…

【深度学习】嘿马深度学习笔记第5篇:神经网络与tf.keras,学习目标【附代码文档】

本教程的知识点为:深度学习介绍 1.1 深度学习与机器学习的区别 TensorFlow介绍 2.4 张量 2.4.1 张量(Tensor) 2.4.1.1 张量的类型 TensorFlow介绍 1.2 神经网络基础 1.2.1 Logistic回归 1.2.1.1 Logistic回归 TensorFlow介绍 总结 每日作业 神经网络与tf.keras 1.3 …

介绍云计算在医疗领域的应用实例

云计算在医疗领域的应用日益广泛,为医疗行业带来了诸多便利和创新。以下是几个典型的应用实例: 电子病历管理系统: 基于云计算技术的电子病历管理系统,通过互联网实现对病历数据的存储、管理、维护和查询等功能。这类系统能够自动…

关于助记词,词库的讨论

我有个想法,既然私钥碰撞的难度大。 -seed-(pathmasterkey)-privatekey-publickey-address 通过反推的难度大,那我可以尝试使用助记词碰撞 就例如,我生成1000个eth地址 1000个地址的助记词全部拿到,然后…

C++学习笔记——打印ASCII码

一、题目描述 二、代码 #include <iostream> using namespace std; int main() {char a_char;int a_int;cin >> a_char;a_int a_char;cout << a_int;return 0; }

【数据结构】关于TreeMap与TreeSet的使用你了解多少???

前言&#xff1a; &#x1f31f;&#x1f31f;本期讲解TreeMap与Set的相关知识&#xff0c;希望能帮到屏幕前的你。 &#x1f308;上期博客在这里&#xff1a;http://t.csdnimg.cn/K1moi &#x1f308;感兴趣的小伙伴看一看小编主页&#xff1a;GGBondlctrl-CSDN博客 目录 &am…

开源模型应用落地-LangChain实用小技巧-使用各种Loader高效解析不同数据源(七)

一、前言 在 LangChain框架中&#xff0c;提供了Loader机制&#xff0c;以统一的方式来从各种数据源获取数据&#xff0c;使得开发人员可以方便地集成不同类型的数据源&#xff0c;而无需为每种数据源编写特定的加载代码。它可以将不同格式的数据转换为 LangChain 可以处理的统…

如何使用ssm实现新锐台球厅管理系统的设计与实现+vue

TOC ssm221新锐台球厅管理系统的设计与实现vue 系统概述 1.1 研究背景 如今互联网高速发展&#xff0c;网络遍布全球&#xff0c;通过互联网发布的消息能快而方便的传播到世界每个角落&#xff0c;并且互联网上能传播的信息也很广&#xff0c;比如文字、图片、声音、视频等…

Python(R)均方根误差平均绝对误差导图

&#x1f3af;要点 回归模型评估指标评估薪水预测模型评估员工倦怠率模型评估大气分析生成式对抗模型目标对象缺失下&#xff0c;性能估算法追踪模型误差指标降尺度大气学模拟模型准确性评估蛋白染色质相互作用模型评估 Python回归误差指标 平均绝对误差表示数据集中实际值和…

Manim实现目标的移动和出现速度控制

一&#xff0c;介绍 缓动函数 自定义参数随时间变化的速率。 现实生活中&#xff0c;物体并不是突然启动或者停止&#xff0c; 当然也不可能一直保持匀速移动。就像我们 打开抽屉的过程那样&#xff0c;刚开始拉的那一下动作很快&#xff0c; 但是当抽屉被拉出来之后我们会不自…

TCP协议中断开连接机制

目录 客户端与服务端四次挥手 关于TIME_WAIT状态 为什么TIME_WAIT状态等待的时间是2MSL&#xff1f; 客户端与服务端四次挥手 基于TCP协议通信的客户端与服务端断开连接就要进行四次挥手&#xff0c;如下图&#xff1a; 四次挥手过程中客户端与服务端状态转化&#xff1a; …

Rocm-Programming with HIP 内存分配

1. 主机内存&#xff08;Host Memory&#xff09; hipHostMalloc 是 HIP API 中的一个函数&#xff0c;它用于在主机上分配特殊的内存&#xff0c;这种内存被称为 "pinned" 或 "page-locked" 内存。这种内存有以下特点和用途&#xff1a; GPU 地址空间映射…

SD6201 同步增压DC/DC调节器芯片IC

一般描述 SD6201是高效率同步、PWM升压型DC/DC转换器&#xff0c;专为中型功率系统提供高效率解决方案而优化。该器件在0.9 V至4.4V的输入电压下工作&#xff0c;开关频率为1.4 MHz。这些功能允许使用微小、低剖面的电感和陶瓷电容器&#xff0c;从而最大限度地减少了整…

LivePortrait模型构建指南

一、介绍 快手可灵大模型团队开源了名为 LivePortrait 的可控人像视频生成框架&#xff0c;能够准确、实时地将驱动视频的表情、姿态迁移到静态或动态人像视频上&#xff0c;生成极具表现力的视频结果。该项目的模型产生了定性肖像动画&#xff0c;只要输入一张静态的肖像图像…

多线程面试常问

一、创建线程的几种方式 1、继承Thread类并重写run()方法。 public class MyThread extends Thread {Overridepublic void run() {System.out.println("通过集成 Thread 类实现线程"); } } // 如何使用 new MyThread().start() 2、实现Runnable接口并重写run()方法…

deepin(深度)社区亮相2024 RISC-V中国峰会,全力推动RISC-V生态发展

8月21日—23日&#xff0c;全球三大RISC-V专业展会之一、国内最大的RISC-V年度盛会——2024 RISC-V中国峰会于浙江杭州盛大召开&#xff01;deepin&#xff08;深度&#xff09;社区携手合作伙伴出席峰会&#xff0c;与国内外业界专家、企业代表、研究机构及社区伙伴&#xff0…

python如何通过Json路径返回Json响应对应的值例子解析

在Python中&#xff0c;处理JSON数据通常使用标准库中的json模块来解析和操作JSON格式的数据。如果你想要通过JSON路径来获取JSON响应中的值&#xff0c;你可以使用第三方库&#xff0c;如jsonpath-ng&#xff0c;它允许你使用类似XPath的语法来查询JSON对象。 首先&#xff0…

mysql读写分离(mysql路由)

mysql路由 1. server4路由主机操作 rpm -ivh mysql-router-community-8.0.21-1.el7.x86_64.rpm # 安装路由工具 cd /etc/mysqlrouter/ vim mysqlrouter.conf # 配置文件# 均摊 [routing:ro] bind_address 0.0.0.0 bind_port 7001 destinations 192.168.228.11:3306,192.168…

LLM自对齐技术最新研究分享(一):对齐 Pipeline 数据合成(上)

欢迎关注 OpenMMLab 公众号获取一手技术干货 当我们向 ChatGPT 提问时&#xff0c;我们希望他能准确地回答我们的问题。当我们向他提出不合理的要求&#xff0c;比如询问如何制作炸弹或者如何考试作弊&#xff0c;我们希望他能拒绝回答并及时纠正我们的错误。AI 对齐&#xff0…