【计算机视觉中的多视图几何系列】深入浅出理解针孔相机模型

news2025/1/30 16:36:02

温故而知新,可以为师矣!

一、参考资料

《计算机视觉中的多视图几何-第五章》-Richard Hartley, Andrew Zisserman.

二、针孔模型相关介绍

1. 重要概念

在这里插入图片描述

1.1 投影中心/摄像机中心/光心

投影中心称为摄像机中心,也称为光心。投影中心位于一个欧式坐标系的原点。

1.2 图像平面/聚焦平面

平面 Z = f Z=f Z=f 被称为图像平面聚焦平面

1.3 主轴/主射线

摄像机中心到图像平面的垂线称为摄像机的主轴主射线

1.4 主点

主轴与图像平面的交点称为主点

1.5 主平面(摄像机)

过摄像机中心平行于图像平面的平面称为摄像机的主平面

1.6 图像坐标系与摄像机坐标系

在这里插入图片描述

如上图所示,图像坐标系 ( x , y ) T (x,y)^T (x,y)T 和摄像机坐标系 ( x c a m , y c a m ) T (x_{cam},y_{cam})^T (xcam,ycam)T

2. 基本针孔模型

在这里插入图片描述

在针孔摄像机模型下,3维空间坐标为 X = ( X , Y , Z ) T X=(X, Y, Z)^T X=(X,Y,Z)T 的点 X X X 被投影到图像平面上的一点,该点是连接点 X X X 与投影中心的直线与图像平面的交点。根据相似三角形,可以很快地算出点 ( X , Y , Z ) T (X, Y , Z)^T (X,Y,Z)T 被映射到图像平面上点 ( f X / Z , f Y / Z , f ) T (fX/Z, fY/Z, f)^T (fX/Z,fY/Z,f)T 。略去最后一个图像坐标之后,从世界坐标到图像坐标的中心投影是:
( X , Y , Z ) T ↦ ( f X / Z , f Y / Z ) T ( 1 ) (X,Y,Z)^{T}\mapsto(fX/Z,fY/Z)^{T}\quad(1) (X,Y,Z)T(fX/Z,fY/Z)T(1)
这是从3维欧式空间 IR 3 \text{IR}^3 IR3 到 2维欧式空间 IR 2 \text{IR}^2 IR2 的一个映射

3. 投影矩阵

齐次坐标的概念:齐次坐标就是用N+1维去描述一个N维的坐标。

如果用齐次矢量表示世界和图像点,那么中心投影可以简单地表示成齐次坐标之间的线性映射。具体地说, 公式 ( 1 ) 公式(1) 公式(1) 可以写成如下矩阵乘积形式:
[ X Y Z 1 ] ↦ [ f x f y z ] = [ f 0 f 0 1 0 ] [ X Y Z 1 ] ( 2 ) \left.\left[\begin{array}{c}\mathbf{X}\\\mathbf{Y}\\\mathbf{Z}\\\mathbf{1}\end{array}\right.\right]\mapsto\left[\begin{array}{c}f\mathbf{x}\\f\mathbf{y}\\\mathbf{z}\end{array}\right]=\left[\begin{array}{cc}f&&&0\\&f&&0\\&&1&0\end{array}\right]\left[\begin{array}{c}\mathbf{X}\\\mathbf{Y}\\\mathbf{Z}\\\mathbf{1}\end{array}\right]\quad(2) XYZ1 fxfyz = ff1000 XYZ1 (2)
其中 [ f 0 f 0 1 0 ] \left[\begin{array}{cc}f&&&0\\&f&&0\\&&1&0\end{array}\right] ff1000 表示 3 ∗ 4 3*4 34 齐次摄像机投影矩阵,记作 P P P P P P 可以写成 d i a g ( f , f , 1 ) [ I ∣ 0 ] diag(f,f,1)[I|0] diag(f,f,1)[I∣0],其中 d i a g ( f , f , 1 ) diag(f,f,1) diag(f,f,1)对角矩阵,而 [ I ∣ 0 ] [I|0] [I∣0]表示矩阵分块成一个 3 ∗ 3 3*3 33恒等矩阵加上一个零列矢量。那么,中心投影的针孔模型的摄像机投影矩阵可以表示为:
P = d i a g ( f , f , 1 ) [ I ∣ 0 ] P=diag(f,f,1)[I|0] P=diag(f,f,1)[I∣0]

恒等矩阵的概念:恒等矩阵,又称为单位矩阵,是一个方阵,其对角线上的元素为1,其余元素均为0,记作 I I I或者 E E E。恒等矩阵的大小由其维度决定,例如3阶恒等矩阵是一个3x3的矩阵。

恒等矩阵在线性代数中具有很多重要的性质。例如,对于任意矩阵A,恒等矩阵1与A的乘积等于A本身。这是因为恒等矩阵的每个元素与A的对应元素相乘,并将其相加,得到的结果就是A本身。这个性质在矩阵的转置、逆运算等方面都有着重要的应用。

恒等矩阵在深度学习中也具有重要的作用。在神经网络中,恒等矩阵常被用作初始化权重矩阵初始化权重矩阵时,将其设置为恒等矩阵可以使得神经网络的初始状态更稳定。这是因为恒等矩阵具有一定的对称性和平衡性,可以避免梯度消失或梯度爆炸等问题,有助于提高模型的训练效果

恒等矩阵还可以用于矩阵的相似性度量。在图像处理和模式识别中,我们经常需要比较两个矩阵的相似性。通过计算两个矩阵之间的差异,可以得到它们的相似性度量。而恒等矩阵作为一个特殊的矩阵,与其他矩阵相比具有明显的差异,可以用于度量矩阵之间的相似性。

我们现在引入如下记号:世界点 X X X 用4维齐次矢量 ( X , Y , Z , 1 ) (X,Y,Z,1) (X,Y,Z,1)表示;图像点 x x x 被表示成3维齐次矢量的形式。则 公式 ( 2 ) 公式(2) 公式(2) 可以紧凑地写为:
x = P X x=PX x=PX

4. 主点偏置

公式 ( 1 ) 公式(1) 公式(1) 假定图像平面的坐标原点在主点上,因此一般情形的映射为:
( X , Y , Z ) T ↦ ( f X / Z + p x , f Y / Z + p y ) T (X,Y,Z)^{T}\mapsto(fX/Z+p_x,fY/Z+p_y)^{T} \\ (X,Y,Z)T(fX/Z+px,fY/Z+py)T
其中 ( p x , p y ) T (p_x,p_y)^T (px,py)T 是主点的坐标。该方程用齐次坐标可以表示为:
[ X Y Z 1 ] ↦ [ f x + Z p x f y + Z p y z ] = [ f p x 0 f p x 0 1 0 ] [ X Y Z 1 ] ( 3 ) \left.\left[\begin{array}{c}\mathbf{X}\\\mathbf{Y}\\\mathbf{Z}\\\mathbf{1}\end{array}\right.\right]\mapsto\left[\begin{array}{c}f\mathbf{x+Zp_x}\\f\mathbf{y+Zp_y}\\\mathbf{z}\end{array}\right]=\left[\begin{array}{cc}f&&p_x&0\\&f&p_x&0\\&&1&0\end{array}\right]\left[\begin{array}{c}\mathbf{X}\\\mathbf{Y}\\\mathbf{Z}\\\mathbf{1}\end{array}\right]\quad(3) XYZ1 fx+Zpxfy+Zpyz = ffpxpx1000 XYZ1 (3)
若记
K = [ f p x f p x 1 ] ( 4 ) K=\left[\begin{array}{cc}f&&p_x\\&f&p_x\\&&1\end{array}\right]\quad(4) K= ffpxpx1 (4)
公式 ( 3 ) 公式(3) 公式(3) 有一个简洁的形式:
x = K [ I ∣ 0 ] X c a m ( 5 ) x=K[I|0]X_{cam}\quad(5) x=K[I∣0]Xcam(5)
矩阵 K K K 称为摄像机标定矩阵,在 公式 ( 5 ) 公式(5) 公式(5) 中我们记 ( X , Y , Z , 1 ) T (X,Y,Z,1)^T (X,Y,Z,1)T X c a m X_{cam} Xcam 是为了强调摄像机被设定在一个欧式坐标系的原点且主轴沿着 z z z 轴的指向,而点 X c a m X_{cam} Xcam 按此坐标系表示。这样的坐标系可以称为摄像机坐标系

摄像机坐标系的原点为主点 z z z轴方向指向主轴

5. 摄像机旋转与位移

一般,3维空间点采用不同的欧式坐标系表示,称为世界坐标系。摄像机坐标系与世界坐标系通过旋转平移相联系。
在这里插入图片描述

世界坐标系和摄像机坐标系之间的欧式转换

如果 X ~ \widetilde{X} X 是一个3维非齐次矢量,表示世界坐标系中一点的坐标,而 X ~ c a m \widetilde{X}_{cam} X cam 是以摄像机坐标系来表示的同一点,那么我们可以记 X ~ c a m = R ( X ~ − C ~ ) \widetilde{X}_{cam}=R\left(\widetilde{X}-\widetilde{C}\right) X cam=R(X C ) ,其中 C ~ \widetilde{C} C 表示摄像机中心在世界坐标系中的坐标, R R R 是一个 3 ∗ 3 3*3 33 的旋转矩阵,表示摄像机坐标系的方位。这个方程在齐次坐标系下可以写成:
X c a m = [ R − R C ~ 0 T 1 ] [ X Y Z 1 ] = [ R − R C ~ 0 T 1 ] X ( 6 ) X_{cam}=\begin{bmatrix}R&-R\widetilde{C}\\0^{T}&1\end{bmatrix}\begin{bmatrix}X\\Y\\Z\\1\end{bmatrix}=\begin{bmatrix}R&-R\widetilde{C}\\0^{T}&1\end{bmatrix}\mathbf{X}\quad(6) Xcam=[R0TRC 1] XYZ1 =[R0TRC 1]X(6)
把它与 公式 ( 5 ) 公式(5) 公式(5) 结合起来形成公式:
x = K R [ I ∣ − C ~ ] X ( 7 ) x=KR\left[I|-\widetilde{C}\right]X\quad(7) x=KR[IC ]X(7)
其中 X X X 用世界坐标系表示。这是由一个针孔模型给出的一般映射。

6. 摄像机内部参数与外部参数

公式 ( 7 ) 公式(7) 公式(7) 可以看出,一般的针孔摄像机 P = K R [ I ∣ − C ~ ] P=KR\left[I|-\widetilde{C}\right] P=KR[IC ] 有9个自由度:3个来自 K (元素 f , p x , p y ) K(元素 f,p_x, p_y) K(元素f,px,py,3个来自 R R R,3个来自 C ~ \widetilde{C} C 。包含在 K K K 中的参数称为摄像机内部参数摄像机的内部校准。包含在 R R R C ~ \widetilde{C} C 中的参数与摄像机在世界坐标系中的方位和位置有关,并称为外部参数外部校准

为方便起见,通常摄像机中心不明显标出,而把世界坐标系到图像坐标系的变换表示成 X ~ c a m = R X ~ + t \widetilde{X}_{cam}=R\widetilde{X}+t X cam=RX +t。在次情形时摄像机矩阵简化成:
P = k [ R ∣ t ] ( 8 ) P=k[R|t]\quad(8) P=k[Rt](8)
其中根据 公式 ( 7 ) 公式(7) 公式(7) t = − R C ~ t=-R\widetilde{C} t=RC

7. CCD摄像机

对于基本针孔模型,假定图像坐标在两个轴向上有等尺度的欧式坐标。但CCD摄像机的像素可能不是正方形。如果图像坐标以像素来测量,那么需要在每个方向上引入非等量尺度因子。具体地说,如果在 x x x y y y 方向上图像坐标单位距离的像素数分别是 m x m_x mx m y m_y my,那么由世界坐标到像素坐标的变换由 公式 ( 4 ) 公式(4) 公式(4) 左乘一个附加的因子 d i a g ( m x , m y , 1 ) diag(m_x,m_y,1) diag(mx,my,1) 而得到。因此一个CCD摄像机标定矩阵的一般形式是:
K = [ a x x 0 a y y 0 1 ] ( 9 ) K=\left[\begin{array}{cc}a_x&&x_0\\&a_y&y_0\\&&1\end{array}\right]\quad(9) K= axayx0y01 (9)
其中 a x = f m x a_x=fm_x ax=fmx a y = f m y a_y=fm_y ay=fmy 分别把摄像机的焦距换算成 x x x y y y 方向的像素量纲。同理, x ~ 0 = ( x 0 , y 0 ) T \widetilde{x}_0=(x_0,y_0)^T x 0=(x0,y0)T 是用像素量纲表示的主点,它的坐标是 x 0 = m x p x x_0=m_xp_x x0=mxpx y 0 = m y p y y_0=m_yp_y y0=mypy。因此,一个CCD摄像机有10个自由度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1329755.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ubuntu20.04下安装pcl_ubuntu安装pcl

pcl点云数据库,用来进行3D信息的获取与处理,和opencv相比较,opencv是用来处理二维信息,他是学术界与工业界针对点云最全的库,且网络上相关的资料很多。以下是pcl的安装步骤以及遇到的问题。 提前说明,本人…

uniapp实战 -- 个人信息维护(含选择图片 uni.chooseMedia,上传文件 uni.uploadFile,获取和更新表单数据)

效果预览 相关代码 页面–我的 src\pages\my\my.vue <!-- 个人资料 --><view class"profile" :style"{ paddingTop: safeAreaInsets!.top px }"><!-- 情况1&#xff1a;已登录 --><view class"overview" v-if"membe…

Nature 新研究发布,GPT 驱动的机器人化学家能够自行设计和进行实验,这对科研意味着什么?

文章目录 前言揭秘Coscientist不到四分钟&#xff0c;设计并改进了程序能力越大&#xff0c;责任越大 前言 有消息称&#xff0c;AI 大模型 “化学家” 登 Nature 能够自制阿司匹林、对乙酰氨基酚、布洛芬&#xff0c;甚至连复杂的钯催化交叉偶联反应&#xff0c;也能完成。 …

HarmonyOS - macOS 上搭建 鸿蒙开发环境

文章目录 安装 DevEco第一个 App1、工程基本信息设置2、安装设备3、运行工程 安装 DevEco 软件下载地址&#xff1a; https://developer.harmonyos.com/cn/develop/deveco-studio 今天我下载 DevEco Studio 3.1.1 Release - Mac 版本 解压后是一个 dmg 文件&#xff08;也不必…

SolidKits.BOMs工具—BOM及焊件切割清单输出

SolidKits.BOMs工具—BOM及焊件切割清单输出包含自动出BOM&#xff0c;自定义模板&#xff0c;焊件切割清单的输出&#xff0c;虚拟件的输出等功能&#xff0c;使用该功能&#xff0c;无需打开SOLIDWORKS软件&#xff0c;可大大提高工作效率。为回馈新老客户&#xff0c;此工具…

润和软件HopeStage与亚信安全云主机深度安全防护系统完成产品兼容性互认证

近日&#xff0c;江苏润和软件股份有限公司&#xff08;以下简称“润和软件”&#xff09;HopeStage 操作系统与亚信科技&#xff08;成都&#xff09;有限公司&#xff08;以下简称“亚信安全”&#xff09;云主机深度安全防护系统完成兼容性测试。 测试结果表明&#xff0c;企…

持续集成交付CICD:GitLabCI 封装Python类 并结合 ArgoCD 完成前端项目应用发布

目录 一、实验 1. 环境 2. Python代码实现获取文件 3.Python代码实现创建文件 4.Python代码实现更新文件 5.GitLab更新库文件与运行流水线 6.ArgoCD 完成前端项目应用发布 二、问题 1.Python获取GitLab指定仓库文件报错 2. K8S master节点运行Python代码报错 一、实验…

spring基于Xml管理bean---Ioc依赖注入:对象类型属性赋值(1)----外部bean的引入(bean和bean之间的引入)

文章目录 注入普通属性的方式1、set方法注入2、构造器&#xff08;构造方法&#xff09;注入 总结&#xff1a;注入对象类型属性 注入普通属性的方式 1、set方法注入 2、构造器&#xff08;构造方法&#xff09;注入 总结&#xff1a; set方法注入和构造器方法的注入&#…

【Linux】进程等待和替换——进程等待的原理、wait/waitpid方法、进程程序替换、进程替换原理、替换函数

文章目录 进程等待和进程替换1.进程等待1.1进程等待的概念1.2进程等待的方法1.3wait方法1.4waitpid方法 1.3获取子进程status1.4进程的阻塞和非阻塞等待 2.进程程序替换2.1进程替换的概念2.2进程替换的方法 进程等待和进程替换 1.进程等待 1.1进程等待的概念 进程等待指的是父…

电脑文件vcruntime140.dll找不到要怎么去修复?vcruntime140.dll解决方法分享

遭遇“vcruntime140.dll缺失”的提示是电脑使用者可能常常面临的一项技术问题&#xff0c;而且它通常发生在尝试安装或运行某个特定软件时。由于这种问题可能频繁出现&#xff0c;掌握如何处理此类DLL文件错误显得尤为重要。这不仅有助于我们在遇到相似问题时能够迅速对症下药&…

2024年ICON设计趋势

我的新书《Android App开发入门与实战》已于2020年8月由人民邮电出版社出版&#xff0c;欢迎购买。点击进入详情 目录 极简主义 三维形式和现实主义 抽象主义与几何 微交互和动画 艺术装饰 有机和可持续 颗粒感美学 图标设计最佳实践 图标在品牌塑造中的作用 图标是用…

相对路径、绝对路径和特殊路径符

目录 相对路径概念&#xff1a; 绝对路径概念&#xff1a; 特殊路径符.概念作用 .\.概念作用 ~概念作用 总结 相对路径 概念&#xff1a; 文件/文件夹相对于当前所处的工作目录的路径。如下图&#xff1a; 如何描述用户工作目录下的 hello2.txt 的相对路径呢&#xff1f; 由…

【接口测试】如何定位BUG的产生原因

我们从在日常功能测试过程中对UI的每一次操作说白了就是对一个或者多个接口的一次调用&#xff0c;接口的返回的内容(移动端一般为json)经过前端代码的处理最终展示在页面上。http接口是离我们最近的一层接口&#xff0c;web端和移动端所展示的数据就来自于这层&#xff0c;那么…

使用docker创建自己的Android编译容器

文章目录 背景步骤1.创建Dockerfile2.编写Dockerfile指令3.编译4.使用 背景 每次拿到新机器或者系统重装&#xff0c;最麻烦的就是各种环境配置&#xff0c;最近学习了一下docker的知识&#xff0c;用dockerfile创建一个Android编译容器&#xff0c;这样就不用每次都吭哧吭哧的…

Python多任务编程-09队列Queue

程序中的定义&#xff1a;一种特殊的存储数据的方式&#xff0c;可以实现先存入的数据&#xff0c;先出去 1.程序中的队列Queue FIFO&#xff08;first in first out先进先出&#xff09; import queueq queue.Queue() q.put("22") q.put(500) q.put({"num&q…

Docker——微服务的部署

Docker——微服务的部署 文章目录 Docker——微服务的部署初识DockerDocker与虚拟机Docker架构安装DockerCentOS安装Docker卸载&#xff08;可选&#xff09;安装docker启动docker配置镜像加速 Docker的基本操作Docker的基本操作——镜像Docker基本操作——容器Docker基本操作—…

gem5 garnet 拓扑结构之port: NI CPU ROUTER L1 L2

简介 有Crossbar&#xff0c;CrossbarGarnet&#xff0c;Mesh_*&#xff0c;MeshDirCorners_XY&#xff0c;Pt2Pt等拓扑结构&#xff0c;我们主要关注mesh-xy。参考是https://www.gem5.org/documentation/general_docs/ruby/interconnection-network/ MESI TWO LEVEL与 mesh …

使用Docker-镜像命令

镜像名称一般分两部分组成:[repository]:[tag] 在没有指定tag时&#xff0c;默认是latest&#xff0c;代表最新版本的镜像 目录 案例一&#xff1a;从DockerHub中拉取一个nginx镜像并查看 1.1. 首先去镜像仓库搜索nginx镜像&#xff0c;比如DockerHub ​编辑 1.2.操作拉取n…

iOS 开发设计 App 上架符合要求的截图

1. 真机运行截屏 2. 可以在 Apple developer 官网 Design 下找到 iPhone 边框 https://developer.apple.com/design/resources/ 不用这个边框也行&#xff0c;可以参考已上架 App 的图片框 3. 使用 Procreate&#xff08;PhotoShop&#xff09;创建符合要求的画布大小 4. 导入…

论文阅读——BLIP-2

BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models 1 模型 在预训练视觉模型和预训练大语言模型中间架起了一座桥梁。两阶段训练&#xff0c;视觉文本表示和视觉到语言生成学习。 Q-Former由两个转换器子模块组成&am…