深入研究矫正单应性矩阵用于立体相机在线自标定

news2024/12/23 7:03:13

文章:Dive Deeper into Rectifying Homography for Stereo Camera Online Self-Calibration

作者:Hongbo Zhao, Yikang Zhang, Qijun Chen,, and Rui Fan

编辑:点云PCL

欢迎各位加入知识星球,获取PDF论文,欢迎转发朋友圈。文章仅做学术分享,如有侵权联系删文。

公众号致力于点云处理,SLAM,三维视觉,高精地图等领域相关内容的干货分享,欢迎各位加入,有兴趣的可联系dianyunpcl@163.com。侵权或转载联系微信cloudpoint9527。

摘要

准确估计立体相机外参是确保立体匹配算法性能的关键。在先前的研究中,立体相机的在线自标定通常被形式化为专门的视觉测距问题,而未考虑立体矫正原理。本文首次深入探讨了矫正单应性的概念,它是我们新颖的立体相机在线自标定算法发展的基石,适用于仅有一对图像的情况。此外引入了一个简单而有效的解决方案,用于在立体视频序列存在的情况下全局最优的外参估计。此外强调使用三个欧拉角和三个平移向量分量进行性能量化的不切实际性。相反,我们引入了四个新的评估指标,用于量化外参估计的鲁棒性和准确性,适用于单对和多对情况。通过在各种实验设置下进行的室内外环境的大量实验证明了我们提出的算法的有效性。全面的评估结果表明,相对于基线算法,我们的算法表现更为优越。

主要贡献

本文通过在一个包含超过1万对来自室内和室外环境的真实立体图像的大规模数据集上进行广泛实验证明了我们提出的算法在不同外参参数条件下的有效性,同时还在两个公共数据集,KITTI 和Middlebury,在不同方向上进行扰动。展示了我们的算法相对于基线算法的卓越性能。总的来说,我们的创新贡献如下: 

• 面向单对情况的基于矫正单应性的新型立体相机在线自标定算法; 

• 针对存在多对立体图像的情况,提供了一个简单而有效的全局最优外参估计解决方案; 

• 四个实用的评估指标,旨在全面量化立体相机在线自标定的性能; 

• 在各种室内外环境中使用不同的实验设置进行的广泛实验。

内容概述

矫正单应性

"Rectifying homography"(矫正单应性)是立体视觉中的一个概念,用于对立体图像进行矫正,使其满足特定的几何关系。在双目视觉中,通过使用两个摄像机同时拍摄同一场景,图像中的物体可能呈现一定的透视畸变和几何差异。矫正单应性的目标是将左右相机的图像重新投影到一个共同的平面上,以便简化立体匹配和深度估计。这个平面通常是平行于摄像机的基线的平面。"Rectifying homography" 是一个齐次矩阵,它描述了左右相机图像之间的几何关系,使它们在矫正后满足平行的条件。通过将左右图像应用矫正单应性,可以使同一行的像素在两个图像中具有相同的纵坐标,从而简化了匹配问题。在立体视觉中,这种矫正对于提高立体匹配算法的效果和精度非常重要,因为它有助于消除图像中的透视畸变,使得匹配更加可靠和准确。

优化中的能量函数

"Energy function"(能量函数)在计算机视觉和优化问题中是一种常见的概念。在文中,特指用于描述问题优化目标的数学函数。对于"Energy function and its solution for single-pair cases",这是指针对单一图像对的情况,用于描述某一问题的能量函数以及解决该函数的方法。在文中提到的问题是关于双目立体视觉中的相机标定或者图像矫正。能量函数通常包含一个表示目标的模型,以及一些参数,这些参数需要被调整以最小化或最大化该函数。在优化中,通过改变这些参数,可以达到最优解,使得能量函数取得最小或最大值。对于单一图像对的情况,通常存在一个能量函数,它与图像的特定几何关系和标定参数有关。解决这个能量函数的目标是找到能够使得该函数最小化或最大化的参数值,从而得到问题的最优解。

全局优化

在多对图像的情况下进行全局优化的步骤或方法。在文需要解决涉及多组图像的问题,这与局部优化的思想相对,局部优化只考虑在当前参数值附近的优化,而全局优化则考虑整个参数空间。在多对图像的情况下,可能存在更复杂的相机配置或者场景几何关系,因此需要对所有图像对的参数进行联合优化,以获得更为准确和鲁棒的结果。这包括对相机的外参(旋转矩阵和平移向量)等参数进行全局调整,使得整个系统的重建或者标定效果最佳。解决这样的问题通常需要使用更为复杂的数学和计算机视觉技术,包括全局优化算法、非线性优化方法等。这些方法的目标是通过考虑所有图像对之间的相互关系,找到一个全局最优解,以达到更好的整体性能。

实验

在我们的实验中使用了两台MindVision的MV-SUA202GC全局快门CMOS相机来收集数据,这些数据来自室内和室外环境。我们通过利用FPGA提供的20Hz同步信号,结合一个提供24V的外部电源,实现了相机硬件同步。将左侧相机安装在五个不同的视点(中间、顶部、底部、左侧和右侧视图)进行了全面评估我们算法性能的实验,如图1所示。

图片

图1:左侧相机安装在五个不同视点的实验配置

使用了两个公共的立体匹配数据集,KITTI 和 Middlebury以进一步量化我们算法的性能,同样手动创建了四个额外的视点(顶部、底部、左侧和右侧视图),旋转角度为10度。我们的算法使用C++实现,使用了OpenCV、Sophus、Eigen和Ceres库。

图片

在自己创建的大规模数据集上进行了定量实验,结果见表格 I 和图 2。

图片

图 2:在我们创建的大规模数据集上,对比 [3] 和我们提出的算法。

我们的算法在多对情况下,尤其是在 t∗ 和 θ∗ 估计方面,表现出更高的准确性。对于KITTI 2015数据集的定量实验结果见表 II 和图 3,与上述室外实验一致。我们认为这可能是因为KITTI 2015数据集中的图像质量略高于我们的数据集,受运动模糊影响的情况较少,使得两个算法能够达到相对稳定的结果。由于移动车辆通常具有可以忽略的偏航角,除非它们转弯,旋转向量的估计相对稳定和准确。通过对我们的算法在我们创建的数据集和KITTI 2015数据集上的综合性能进行全面分析,我们相信我们的算法对图像质量不太敏感,即使在图像具有运动引起的模糊时,也能提供可行的解决方案。

图片

图片

图 3:在KITTI和Middlebury数据集上,[3] 和我们提出的算法的比较。

关于Middlebury数据集的实验结果进一步支持我们对算法在静态和动态环境中性能的观点。我们的算法将 eθ 和 et 平均降低了 35.62% 和 66.04%。我们获得的σθ 和σt与[3]得到的结果相当。

图片

图 4:视差估计的定性实验结果:(a) 左图像;(b) 使用未校正的立体图像估计的视差图;(c) 使用基于Ling和Shen算法估计的外参数校正的立体图像估计的视差图;(d) 使用基于我们提出的算法估计的外参数校正的立体图像估计的视差图。

如图 4 所示,未校正的立体图像估计的视差图质量较差,而使用我们提出的算法自标定和校正后的立体图像估计的视差图在准确性上表现更好,错误区域更少,相较于基线算法[3]得到的视差图有明显的改善。

总结

本文提出了两个重要的算法贡献:(1) 一种基于单对情况的立体相机在线自标定算法,建立在立体校正原理之上;(2) 一种在多对立体图像可用时,用于全局优化外参数估计的高效且有效的算法。此外,本文引入了四个新的实用评估指标,用于量化外参数估计的稳健性和准确性,适用于单对和多对情况。通过在我们新创建的室内和室外数据集以及两个公共数据集上进行全面实验,我们证明了该算法明显优于最先进的算法。通过进一步优化算法效率,我们有信心将该算法整合到实际的立体视觉系统中,为自主机器人提供稳健的三维信息。

参考文献

[3] Y. Ling and S. Shen, “High-precision online markerless stereo extrinsiccalibration,” in 2016 IEEE/RSJ International Conference on IntelligentRobots and Systems (IROS). IEEE, 2016, pp. 1771–1778.

资源

自动驾驶及定位相关分享

【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法

自动驾驶中基于光流的运动物体检测

基于语义分割的相机外参标定

综述:用于自动驾驶的全景鱼眼相机的理论模型和感知介绍

高速场景下自动驾驶车辆定位方法综述

Patchwork++:基于点云的快速、稳健的地面分割方法

PaGO-LOAM:基于地面优化的激光雷达里程计

多模态路沿检测与滤波方法

多个激光雷达同时校准、定位和建图的框架

动态的城市环境中杆状物的提取建图与长期定位

非重复型扫描激光雷达的运动畸变矫正

快速紧耦合的稀疏直接雷达-惯性-视觉里程计

基于相机和低分辨率激光雷达的三维车辆检测

用于三维点云语义分割的标注工具和城市数据集

ROS2入门之基本介绍

固态激光雷达和相机系统的自动标定

激光雷达+GPS+IMU+轮速计的传感器融合定位方案

基于稀疏语义视觉特征的道路场景的建图与定位

自动驾驶中基于激光雷达的车辆道路和人行道实时检测(代码开源)

用于三维点云语义分割的标注工具和城市数据集

更多文章可查看:点云学习历史文章大汇总

SLAM及AR相关分享

TOF相机原理介绍

TOF飞行时间深度相机介绍

结构化PLP-SLAM:单目、RGB-D和双目相机使用点线面的高效稀疏建图与定位方案

开源又优化的F-LOAM方案:基于优化的SC-F-LOAM

【论文速读】AVP-SLAM:自动泊车系统中的语义SLAM

【点云论文速读】StructSLAM:结构化线特征SLAM

SLAM和AR综述

常用的3D深度相机

AR设备单目视觉惯导SLAM算法综述与评价

SLAM综述(4)激光与视觉融合SLAM

Kimera实时重建的语义SLAM系统

易扩展的SLAM框架-OpenVSLAM

基于鱼眼相机的SLAM方法介绍

以上内容如有错误请留言评论,欢迎指正交流。如有侵权,请联系删除

让我们一起分享一起学习吧!期待有想法,乐于分享的小伙伴加入知识星球注入爱分享的新鲜活力。分享的主题包含但不限于三维视觉,点云,高精地图,自动驾驶,以及机器人等相关的领域。

分享与合作:微信“cloudpoint9527”(备注:姓名+学校/公司+研究方向) 联系邮箱:dianyunpcl@163.com。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1352669.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

文件监控软件丨文件权限管理工具

文件已经成为企业最重要的资产之一。然而,文件的安全性和完整性经常受到威胁,如恶意软件感染、人为误操作、内部泄密等。 为了确保文件的安全,文件监控软件应运而生。本文将深入探讨文件监控软件的概念、功能、应用场景和未来发展等方面。 文…

Deep Q-Network (DQN)理解

DQN(Deep Q-Network)是深度强化学习(Deep Reinforcement Learning)的开山之作,将深度学习引入强化学习中,构建了 Perception 到 Decision 的 End-to-end 架构。DQN 最开始由 DeepMind 发表在 NIPS 2013&…

中兴通讯携手龙蜥社区,共创繁荣生态 | 2023龙蜥操作系统大会

12 月 17-18 日,由开放原子开源基金会指导,龙蜥社区主办,阿里云、中兴通讯、浪潮信息、Arm、Intel 等 24 家理事单位共同承办,主题为“云智融合共筑未来”的 2023 龙蜥操作系统大会在北京圆满结束。本次大会上,中兴通讯…

海外静态IP和动态IP有什么区别?推荐哪种?

什么是静态ip、动态ip,二者有什么区别?哪种好?关于这个问题,不难发现,在知道、知乎上面的解释有很多,但据小编的发现,这些回答都是关于静态ip和动态ip的专业术语解释,普通非专业人事…

java生产设备效率管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java Web生产设备效率管理系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发,数据库为ac…

web自动化(6)——项目配置和Grid分布式

1. 框架的可配置性 项目之间的区别: 兼容性:有些项目只兼容chrome,有些只兼容Firefox等元素定位特点:有些项目闪现快,有的项目很慢有些项目集成Jenkins,不需要用python生成allure报告 如果想要我们的框架…

分布式(8)

目录 36.什么是TCC? 37.分布式系统中常用的缓存方案有哪些? 38.分布式系统缓存的更新模式? 39.分布式缓存的淘汰策略? 40.Java中定时任务有哪些?如何演化的? 36.什么是TCC? TCC&#xff08…

HTML5+CSS3③——无语义布局标签、画盒子、CSS定义、CSS引入方式

目录 无语义布局标签 画盒子 CSS定义 小结 CSS引入方式 小结 无语义布局标签 画盒子 CSS定义 小结 CSS引入方式 小结

潮玩宇宙大逃杀游戏搭建

潮玩宇宙是当下较火的社交互动平台,它不仅涵盖了各种潮玩商品,还拥有各种游戏玩法,尤其是大逃杀游戏非常火爆!本文将介绍大逃杀游戏的开发和发展前景。 大逃杀游戏 大逃杀游戏是当下的一种新型游戏模式,旨在为玩家提供…

十分钟带你学会用python3网络爬虫抓取猫眼电影排行!

本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。 1. 本节目标 本节中,我们要提取出猫眼…

ConcurrentHashMap源码学习

实现接口 ConcurrentMap(Map的基础方法)、Serializable(序列化) 基础属性 最大容量:2^30 默认容量:16 常用方法 PUT 调用PutVal方法进行插入。 判断key或value是否为空: 是:抛出空指针一场 否&#xff…

系列六、RestTemplate

一、RestTemplate 1.1、概述 RestTemplate是一种便捷的访问RestFul服务的模板类,是Spring提供的用于访问Rest服务的客户端模板工具集,它提供了多种便捷访问远程HTTP服务的方法。 1.2、API https://docs.spring.io/spring-framework/docs/5.2.2.RELEASE…

【中小型企业网络实战案例 七】配置限速

相关学习文章: 【中小型企业网络实战案例 一】规划、需求和基本配置 【中小型企业网络实战案例 二】配置网络互连互通【中小型企业网络实战案例 三】配置DHCP动态分配地址 【中小型企业网络实战案例 四】配置OSPF动态路由协议【中小型企业网络实战案例 五】配置可…

听GPT 讲Rust源代码--compiler(1)

File: rust/compiler/rustc_errors/src/diagnostic_builder.rs 在Rust编译器源代码中,rust/compiler/rustc_errors/src/diagnostic_builder.rs文件的作用是定义错误和警告的构建器,用于生成编译器诊断信息。这个文件是Rust编译器错误报告系统的一部分&am…

8个超高清图片素材网站,免费下载,真的很实用~

图片真的是我们日常生活中必不可少的一部分,大到工作,小到发朋友圈都需要配图,那除了自己拍摄之外,哪里还能找到精美又高清的图片素材呢?本期就给大家整理了8个可免费下载的图片素材网站,真的免费下载&…

【JAVA】AI医疗导诊系统源码

智能导诊系统是一种基于人工智能和大数据技术开发的医疗辅助软件,它能够通过对患者的症状、病史等信息进行计算分析,快速推荐科室和医生。通过简单的描述自身症状,系统即可找到最适合的科室,实现线上高效挂号,线下门诊…

Acrel-EIoT能源物联网云平台助力电力物联网数据服务 ——安科瑞 顾烊宇

摘要:Acrel-EIOT能源物联网云平台是一个结合在线销售的互联网商业模式,为分布广泛的互联网用户提供PAAS服务的平台。安科瑞物联网产品安装完成后,用户可以通过手机扫描代码轻松实现产品访问平台,无需注意调试和平台运行过程&#…

tp5 console.php 里的Console类的init();

1 加载的默认配置文件:/www/wwwroot/xxx/thinkphp/convention.php 3 CONF_PATH 和EXE /www/wwwroot/xxx/thinkphp/base.php 里定义的常量 is_file() 检查指定的文件名是否是正常的文件。 CONF_PATH . command . EXT 路径是:/www/wwwroot/xxx/applicati…

【华为机试】2023年真题B卷(python)-考古问题

一、题目 题目描述: 考古问题,假设以前的石碑被打碎成了很多块,每块上面都有一个或若干个字符,请你写个程序来把之前石碑上文字可能的组合全部写出来,按升序进行排列。 二、输入输出 三、示例 示例1: 输入输出示例仅供…

应急响应事件报告模板

文章目录 一. 项目概述1.1 事件概述1.2 应急响应工作目标1.3 应急响应工作结果1.4 相关人员 二. 应急响应工作流程2.1 检测阶段工作说明2.2 抑制阶段工作说明2.3 根除阶段工作说明2.4 恢复阶段工作说明 三. 总结及安全建议3.1 应急响应总结3.2 相关安全建议 一. 项目概述 1.1 …