【视觉SLAM入门】3. 相机模型，内外参，畸变推导

news2026/2/11 22:37:50

"瑾瑜匿瑕"

- 1. 相机模型和内参
- - - 1.1 内参推导
    - 1.2 外参推导
- 2. 畸变
- - - 2.1 径向畸变
    - 2.2 切向畸变
- 3. 深度信息
- - - 3.1 算法测距
    - 3.2 物理测距

本节讨论围绕这个问题展开 $\quad\large\textcolor{red}{机器人如何观测外部世界？}$

注意： 的研究的目的是为了求出点在世界坐标系下的信息，也就是 $P_w$ 是要求出来的量。

1. 相机模型和内参

以针孔相机为例，我们来推导内参的由来，首先在三维世界中，拍照的数学模型如下（左）：

图源SLAM14讲话

以光心为原点的一组相似三角形(对顶角的)，取它的 $\; xoz$ 或者 $\; yoz$ 投影上图（右）：
成像过程： 空间中一点(以相机为坐标系看) $\; \boldsymbol {P=[X,Y,Z]^T} \\\qquad\qquad \Longrightarrow$ 投影到物理成像平面 $\; \boldsymbol {P'=[X',Y',Z']^T}由上图，Z'=f(焦距)\\\qquad \qquad \Longrightarrow$ 缩放和光心平移到(像素坐标系) $\boldsymbol {\; p'=[u, v]}^T$

1.1 内参推导

$\;$ 本来推导出的相似三角形应该有负号(针孔模型–倒立)，但是我们选择为正(将对顶角对称到同侧(同角))，如下：
在这里插入图片描述
由相似关系:
$\frac {Z}{Z'}即\frac {Z}{f}= \frac {X}{X'} = \frac {Y}{Y'}$
整理(这就是相机坐标系下点P到成像平面的步骤，对应上边第一个 $\Longrightarrow$ )：
$f\frac {X}{Z},\quad Y'= f\frac {Y}{Z} \qquad\qquad\qquad(1)$
像素坐标系：和成像平面只差 $\;\textbf {缩放}\;\;$ (X缩放 $\alpha$ 得到 $u\;\;$ Y缩放 $\beta$ 得到 $v\;\;$ )和 $\;\;\textbf {光心(原点)}\;\;$ 的平移 $c_x,c_y]^T$ ，看不懂直接看下边式子：
$\begin{cases} u=\alpha X'+c_x \overset{带入式1}{=} \alpha f\frac {X}{Z} +c_x \overset{记af为f_x} {=}f_x\frac {X}{Z}+c_x\\ v=\beta Y'+c_y \overset{带入式1}{=} \beta f\frac {Y}{Z} +c_x \overset{记\beta f为f_y} {=}f_y\frac {Y}{Z}+c_y \end{cases}\\ \quad \\ \Downarrow 写成矩阵形式如下(齐次坐标) \\ \quad \\\begin{pmatrix}u\\v\\1\end{pmatrix} = \frac{1}{Z} \begin{pmatrix}f_x&0&c_x \\0&f_x&c_y \\0&0&1 \end{pmatrix} \begin{pmatrix}X\\Y\\Z\end{pmatrix} \triangleq \frac {1}{Z}KP\\ \quad \\ \Downarrow 更经常的我们会这么写 \\ \quad \\Z\begin{pmatrix}u\\v\\1\end{pmatrix} = \color{red} \begin{pmatrix}f_x&0&c_x \\0&f_x&c_y \\0&0&1 \end{pmatrix}\color{blue} \begin{pmatrix}X\\Y\\Z\end{pmatrix} \triangleq \color{red} K\color{blue} P \color{b}\qquad\qquad (2)$

其中K就是我们常说的内参(矩阵)(Camera Intrinsics)，P还是相机坐标系下的点，Z就是点的Z坐标的值。
内参通常认为出厂后固定（通常不会在使用中发生变化）,有时厂商提供，有时需要自己确定内参（这一过程也称作标定）

1.2 外参推导

$\quad$ 上边的坐标 $\;P$ 都是在相机坐标系下进行的，而相机是运动的，所以实际中我们需要世界坐标系中的点 $P_w$ 来进行这个过程。即：世界坐标 $P_w$ 到相机坐标(也就是上式可用的 $\;P$ )的变换。
$\quad$ 这种: 变换上节介绍过,就是 $\;P_w \overset{经过旋转R和平移T} {\Longrightarrow} 转换到P$ (相机坐标系) 的过程。如下：

$RP_w+t = P$
这其中求得 $\;R$ 和 $\;t$ 就是相机的位姿，也是相机的外参(Camera Extrinsics)，带入上式(2)有

$ZP_{uv} = Z\begin{bmatrix}u\\v\\1\end{bmatrix}=K(RP_w+t) = KTP_w \\ \Downarrow 齐次坐标乘以系数表达相同含义，故\\\quad \\P_{uv} = KTP_w$
$\color{red}注意: 这里的P_w 不再是[X,Y,Z], 为了保证它和K相乘，它做一个归一化处理,P_w = [\frac {X}{Z},\frac {Y}{Z},1]$ ，这个点所在的平面也成为归一化平面，经过这样处理的点可以看成一个二维的其次坐标，位于 $z = 1$ 平面上，故称为归一化坐标。
$\quad$

下面对以上内容进行总结：

相机内参就是 $f_x,f_y,c_x,c_y$ ，所以基本出厂就确定好了
相机外参就是 $R, t$ 即相机位姿，随运动时刻变化

图源视觉SLAM14讲

2. 畸变

2.1 径向畸变

$\qquad$ 1. 透镜自身形状对光线传播的影响 $\Longrightarrow$ 径向畸变（分为桶形畸变和枕形畸变）
$\qquad$ 2. 这种畸变是径向对称的
$\qquad$ 3. 将点看做极坐标下的 $\;[r,\theta]$ 的话，径向畸变是 $\;r$ 发生了畸变 $\;\delta r$ 。

误差随着距离中心的距离而变化，可以利用这个特性纠正：
归一化平面上的点 $[x, y]$ ，纠正完毕的点 $x_c, y_c]$ , $c$ 就是 $correc t e d$
$\begin{cases} x_c = x(1+k_1r^2 + k_2r^4 + k_3r^6)\\\quad\\ y_c = y(1+k_1r^2 + k_2r^4 + k_3r^6) \end{cases}$
中心区域畸变小 $k_1$ 起作用，畸变较大的用 $k_2$ 起作用

2.2 切向畸变

$\qquad$ 1. 组装过程中透镜和成像平面不完全平行 $\Longrightarrow$ 切向畸变
$\qquad$ 3. 将点看做极坐标下的 $\;[r,\theta]$ 的话，径向畸变是 $\;\theta$ 发生了畸变 $\;\delta \theta$ 。

切向畸变纠正如下:
$\begin{cases} x_c = x+2p_1xy+p_2(r^2+2x^2)\\\quad\\ y_c = x+p_1(r^2+2y^2)+2p_2xy \end{cases}$

合并径向和切向畸变：
$\begin{cases} x_c = x(1+k_1r^2 + k_2r^4 + k_3r^6)+2p_1xy+p_2(r^2+2x^2)\\\quad\\ y_c = y(1+k_1r^2 + k_2r^4 + k_3r^6)+p_1(r^2+2y^2)+2p_2xy \end{cases}\\\quad\\\Downarrow 归一化平面\Rightarrow像素平面 \\\quad\\ \begin{cases} u = f_x\cdot x_c + c_x\\ v = f_y\cdot y_c + c_y \end{cases}$
$\quad$ 至此，用5个畸变项就完成了，实际中k甚至可以取一个。灵活搭配即可