【视觉SLAM:六、视觉里程计Ⅰ:特征点法】

news2025/1/3 22:09:06

视觉里程计(Visual Odometry, VO)是通过处理图像序列,估计摄像头在时间上的相对位姿变化的技术。它是视觉SLAM的重要组成部分之一,主要通过提取图像中的信息(如特征点或直接像素强度)来实现相机运动估计。以下从特征点法、2D-2D对极几何、三角测量、3D-2D的PnP方法、3D-3D的ICP方法介绍视觉里程计的核心内容。

特征点法

特征点法是视觉里程计的经典方法,通过提取图像中的显著特征点,计算特征点之间的匹配关系,进而估计相机的运动。

特征点法简介

  • 原理:提取图像中显著的特征点,并通过特征点的匹配关系推断相机运动。
  • 流程:
    • 提取图像特征点。
    • 描述特征点并计算特征点匹配关系。
    • 通过特征匹配估计相机运动(后续结合几何关系)。

ORB特征

  • ORB(Oriented FAST and Rotated BRIEF)是一种高效的特征点提取和描述方法,常用于特征点法中。
    • ORB特征点提取:基于FAST角点,结合图像金字塔提取多尺度特征点。
    • ORB描述子:使用BRIEF描述子(特征点局部的二值编码)加快特征匹配。
    • 优势:ORB特征兼具高效性和鲁棒性,且能处理旋转和尺度变化。

特征匹配

  • 常用匹配算法:
    • 暴力匹配:直接计算每对特征点描述子的距离(如欧氏距离、汉明距离),效率低。
    • KNN匹配:为每个特征点找到最近的几个邻居,并通过比值测试筛选最佳匹配。
  • 关键点均匀化:通过八叉树等方法均匀分布特征点,避免密集区域的冗余。

2D-2D对极几何

在特征点匹配基础上,2D-2D对极几何用于计算相机间的相对位姿。

对极约束

  • 定义:在两幅图像中,某点 𝑝1 的匹配点 𝑝2 必定满足对极约束: p 2 ⊤ F p 1 = 0 \mathbf{p}_2^\top\mathbf{F}\mathbf{p}_1=0 p2Fp1=0
    其中 𝐹 是基础矩阵,描述两图像之间的几何关系。

本质矩阵

  • 当相机的内参已知时,基础矩阵 𝐹可转化为本质矩阵 𝐸: E = K ⊤ F K \mathbf{E}=\mathbf{K}^\top\mathbf{F}\mathbf{K} E=KFK
    其中 𝐾 是相机的内参矩阵。

单应矩阵

  • 对于静止的平面场景,匹配点间也可以通过单应矩阵 𝐻 建立关系: p 2 = H p 1 \mathbf{p}_2=\mathbf{H}\mathbf{p}_1 p2=Hp1
  • 本质矩阵 vs 单应矩阵:
    • 本质矩阵:适用于一般场景,包含视差信息。
    • 单应矩阵:适用于平面场景或无视差运动,易退化。

位姿分解

通过分解本质矩阵 𝐸,可恢复相机的相对位姿(旋转矩阵 𝑅 和平移向量 𝑡)。

三角测量

三角测量是从两帧图像中匹配的特征点,恢复3D点坐标的关键技术。

原理

  • 给定特征点在两帧图像中的投影位置 p 1 , p 2 \mathbf{p}_1,\mathbf{p}_2 p1,p2,以及相机的内参和位姿 𝑅,𝑡,通过以下方式恢复3D点: P = Triangulate ( p 1 , p 2 , R , t ) \mathbf{P}=\text{Triangulate}(\mathbf{p}_1,\mathbf{p}_2,\mathbf{R},\mathbf{t}) P=Triangulate(p1,p2,R,t)
  • 基于几何投影模型,通过线性方程或非线性优化求解3D点坐标。

验证三角化结果

  • 测量点是否位于相机前方。
  • 计算重投影误差是否足够小。

3D-2D: PnP问题

PnP(Perspective-n-Point)问题是已知3D点和对应的2D投影,求解相机位姿的问题。

直接线性变换(DLT)

  • 基于线性方程求解相机的位姿: p i = K [ R ∣ t ] P i \mathbf{p}_i=\mathbf{K}[\mathbf{R}|\mathbf{t}]\mathbf{P}_i pi=K[Rt]Pi
  • 通过线性求解,快速但精度不高。

P3P方法

  • 给定3对3D点和2D点的匹配关系,利用几何关系直接求解位姿。
  • 通常结合RANSAC算法,剔除外点,提高鲁棒性。

最小化重投影误差

通过非线性优化,最小化重投影误差以提高精度: x ∗ = arg ⁡ min ⁡ x ∑ i ∥ p i − h ( P i , x ) ∥ 2 \mathbf{x}^*=\arg\min_\mathbf{x}\sum_i\|\mathbf{p}_i-h(\mathbf{P}_i,\mathbf{x})\|^2 x=argxminipih(Pi,x)2
其中 ℎ(⋅) 是投影函数。

3D-3D: ICP方法

3D-3D配准问题是已知两组3D点云,求解它们之间的刚体变换(旋转矩阵 𝑅 和平移向量 𝑡)。

SVD方法

  • 基于点云的最近邻匹配,构造误差函数:
    E ( R , t ) = ∑ i ∥ q i − ( R p i + t ) ∥ 2 E(\mathbf{R},\mathbf{t})=\sum_i\|\mathbf{q}_i-(\mathbf{R}\mathbf{p}_i+\mathbf{t})\|^2 E(R,t)=iqi(Rpi+t)2
    其中 p i \mathbf{p}_i pi q i \mathbf{q}_i qi 是两帧中的对应3D点。
  • 使用奇异值分解(SVD)求解最优刚体变换。

非线性优化方法

  • 在初始位姿的基础上,利用非线性优化方法(如高斯-牛顿或LM算法)进一步减少误差,提高精度。
  • 优化目标:最小化点到点或点到平面的距离误差。

总结

视觉里程计通过特征点法提取信息,结合几何约束(2D-2D对极几何、三角测量)估计相机位姿,并通过PnP(3D-2D)和ICP(3D-3D)实现更复杂场景下的位姿求解。这些方法构成了视觉里程计的核心技术体系,为SLAM中的前端跟踪提供了坚实的数学基础和实现方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2269254.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【D3.js in Action 3 精译_047】5.2:图形的堆叠(一)—— 图解 D3 中的堆叠布局生成器

当前内容所在位置: 第五章 饼图布局与堆叠布局 ✔️ 5.1 饼图和环形图的创建 5.1.1 准备阶段(一)5.1.2 饼图布局生成器(二)5.1.3 圆弧的绘制(三)5.1.4 数据标签的添加(四&#xff09…

自建私有云相册:Docker一键部署Immich,照片视频备份利器

自建私有云相册:Docker一键部署Immich,照片视频备份利器 前言 随着人们手机、PC、平板等电子产品多样,我们拍摄和保存的照片和视频数量也在不断增加。如何高效地管理和备份这些珍贵的记忆成为了一个重要的问题。 传统的云备份虽然方便&…

[微服务] - MQ高级

在昨天的练习作业中,我们改造了余额支付功能,在支付成功后利用RabbitMQ通知交易服务,更新业务订单状态为已支付。 但是大家思考一下,如果这里MQ通知失败,支付服务中支付流水显示支付成功,而交易服务中的订单…

【Unity3D】A*寻路(2D究极简单版)

运行后点击透明格子empty即执行从(0,0)起点到点击为止终点(测试是(5,5))如下图 UICamera深度要比MainCamera大,Clear Flags:Depth only,正交视野 MainCamera保持原样;注意Line绘线物体的位置大小旋转信息,不…

xadmin后台首页增加一个导入数据按钮

xadmin后台首页增加一个导入数据按钮 效果 流程 1、在添加小组件中添加一个html页面 2、写入html代码 3、在urls.py添加导入数据路由 4、在views.py中添加响应函数html代码 <!DOCTYPE html> <html lang

压敏电阻MOV选型【EMC】

左侧的压敏电阻用来防护差模干扰&#xff1b;右侧并联在L N 两端的压敏电阻是用来防护共模干扰&#xff1a; 选择压敏电阻时&#xff0c;通常需要考虑以下几个关键因素&#xff0c;以确保它能够有效保护电路免受浪涌电流或过电压的损害&#xff0c;同时满足 EMC 要求&#xff1…

pycharm pytorch tensor张量可视化,view as array

Evaluate Expression 调试过程中&#xff0c;需要查看比如attn_weight 张量tensor的值。 方法一&#xff1a;attn_weight.detach().numpy(),view as array 方法二&#xff1a;attn_weight.cpu().numpy(),view as array

log4j2的Strategy、log4j2的DefaultRolloverStrategy、删除过期文件

文章目录 一、DefaultRolloverStrategy1.1、DefaultRolloverStrategy节点1.1.1、filePattern属性1.1.2、DefaultRolloverStrategy删除原理 1.2、Delete节点1.2.1、maxDepth属性 二、知识扩展2.1、DefaultRolloverStrategy与Delete会冲突吗&#xff1f;2.1.1、场景一&#xff1a…

设计模式之访问者模式:一楼千面 各有玄机

~犬&#x1f4f0;余~ “我欲贱而贵&#xff0c;愚而智&#xff0c;贫而富&#xff0c;可乎&#xff1f; 曰&#xff1a;其唯学乎” 一、访问者模式概述 \quad 江湖中有一个传说&#xff1a;在遥远的东方&#xff0c;有一座神秘的玉楼。每当武林中人来访&#xff0c;楼中的各个房…

结合实例来聊聊UDS诊断中的0x2F服务

1、什么是UDS中的0x2F服务 0x2F简单来说&#xff0c;就是输入输出控制服务。先看官方的简绍 翻译如下&#xff1a; InputOutputControlByldentifier服务来替换输入信号、内部服务器函数和/或强制控制为电子系统的输出&#xff08;执行器&#xff09;的值。通常&#xff0c;此…

1月第二讲:WxPython跨平台开发框架之图标选择界面

1、图标分类介绍 这里图标我们分为两类&#xff0c;一类是wxPython内置的图标资源&#xff0c;以wx.Art_开始。wx.ART_ 是 wxPython 提供的艺术资源&#xff08;Art Resource&#xff09;常量&#xff0c;用于在界面中快速访问通用的图标或位图资源。这些资源可以通过 wx.ArtP…

【弱监督视频异常检测】2024-TCSVT-基于片段间特征相似度的多尺度时间 MLP 弱监督视频异常检测

2024-TCSVT-Inter-clip Feature Similarity based Weakly Supervised Video Anomaly Detection via Multi-scale Temporal MLP 基于片段间特征相似度的多尺度时间 MLP 弱监督视频异常检测摘要1. 引言2. 相关工作A. 分布外检测B. 弱监督视频异常检测C. 多层感知器 3. 方法A. 概述…

C# OpenCV机器视觉:凸包检测

在一个看似平常却又暗藏玄机的午后&#xff0c;阿强正悠闲地坐在实验室里&#xff0c;翘着二郎腿&#xff0c;哼着小曲儿&#xff0c;美滋滋地品尝着手中那杯热气腾腾的咖啡&#xff0c;仿佛整个世界都与他无关。突然&#xff0c;实验室的门 “砰” 的一声被撞开&#xff0c;小…

【英特尔IA-32架构软件开发者开发手册第3卷:系统编程指南】2001年版翻译,2-44

文件下载与邀请翻译者 学习英特尔开发手册&#xff0c;最好手里这个手册文件。原版是PDF文件。点击下方链接了解下载方法。 讲解下载英特尔开发手册的文章 翻译英特尔开发手册&#xff0c;会是一件耗时费力的工作。如果有愿意和我一起来做这件事的&#xff0c;那么&#xff…

8.若依系统监控与定时任务

帮助开发者和运维快速了解应用程序的性能状态。 数据监控 定时任务 实现动态管理任务。 需求&#xff1a;每间隔5s&#xff0c;控制台输出系统时间。 新建的任务类必须在指定目录ruoyi-quartz模块下的task包下。 状态设置为启动 执行策略 场景&#xff1a;比如一个任务每个…

【JAVA高级篇教学】第六篇:Springboot实现WebSocket

在 Spring Boot 中对接 WebSocket 是一个常见的场景&#xff0c;通常用于实现实时通信。以下是一个完整的 WebSocket 集成步骤&#xff0c;包括服务端和客户端的实现。本期做个简单的测试用例。 目录 一、WebSocket 简介 1. 什么是 WebSocket&#xff1f; 2. WebSocket 的特…

【YOLO 项目实战】(12)红外/可见光多模态目标检测

欢迎关注『youcans动手学模型』系列 本专栏内容和资源同步到 GitHub/youcans 【YOLO 项目实战】&#xff08;10&#xff09;YOLO8 环境配置与推理检测 【YOLO 项目实战】&#xff08;11&#xff09;YOLO8 数据集与模型训练 【YOLO 项目实战】&#xff08;12&#xff09;红外/可…

Ubuntu开机The root filesystem on /dev/sdbx requires a manual fsck 问题

出现“Manual fsck”错误可能由以下几种原因引起&#xff1a; 不正常关机&#xff1a;如果系统意外断电或被强制重启&#xff0c;文件系统可能未能正确卸载&#xff0c;导致文件系统损坏。磁盘故障&#xff1a;硬盘的物理损坏可能会引发文件系统错误。文件系统配置问题&#x…

RFSOC 47dr Dp口测试(ARM裸机)

47DR 内核还是一个4核A53的MPSOC&#xff0c;测试方式和MPSOC一样 首先设置好BD文件 编译好BIT设置VITIS工程 examle工程测试即可 但是本人硬件会跑飞不知道为何&#xff0c;通过注释掉下图的子函数得以解决 值得注意的是&#xff0c;最好用HP的线&#xff0c;不要用DP转…

protobuf: 通讯录2.1

先引入需要知道的proto3语法&#xff1a; 1.proto3 1.hexdump 作用&#xff1a; hexdump&#xff1a;是Linux下的⼀个⼆进制⽂件查看⼯具&#xff0c;它可以将⼆进制⽂件转换为ASCII、⼋进制、 ⼗进制、⼗六进制格式进⾏查看。 -C: 表⽰每个字节显⽰为16进制和相应的ASCI…