计算机视觉之三维重建(1)---摄像机几何

news2024/11/14 19:18:44

文章目录

  • 一、针孔模型和透镜
    • 1.1 针孔摄像机
    • 1.2 近轴折射模型
    • 1.3 透镜问题
  • 二、摄像机几何
    • 2.1 像平面和像素平面
    • 2.2 齐次坐标下的投影变换
    • 2.3 摄像机倾斜
    • 2.4 规范化摄像机
    • 2.5 世界坐标系
    • 2.6 Faugeras定理
    • 2.7 投影变换性质:
  • 三、其他投影摄像机模型
    • 3.1 弱透视投影摄像机
    • 3.2 正交投影摄像机


一、针孔模型和透镜

1.1 针孔摄像机

 1. 当我们设计摄像机记录世界时,我们首先会想到将胶片直接放到物体的前方,但是此时胶片上某点处的图像信息可能来自物体的多个位置,图像模糊使得我们无法分辨。

在这里插入图片描述

 2. 最早提出小孔成像的是中国的墨子。那如果我们在胶片和物体之间放一个有针孔的隔板,那么就可以实现物体的光线与胶片上的像素点一对一对应。

在这里插入图片描述

 3. 如下图是一个简单的针孔摄像机模型。物体经过针孔呈现在像平面的像是倒立的。为了研究方便,我们人为定义了一个虚拟像平面,上面的图像是正立的。

在这里插入图片描述

 4. 如下图所示通过数学模型建立三维坐标到二维坐标的映射,我们可以确定出摄像机坐标系与像平面坐标系相对应点处的位置关系。

在这里插入图片描述

在这里插入图片描述

 6. 光圈的大小会对成像有影响,当缩小光圈时,成像会越来越清晰,但也会越来越暗。
思考:那如何应对到达胶片的光线变少,我们可以增加透镜来解决。

在这里插入图片描述

在这里插入图片描述

1.2 近轴折射模型

 1. 焦点和焦距的概念图如下:

在这里插入图片描述

 2. 我们仍然可以建立数学模型来表示胶片上像素点与物体发射光线处的对应关系。

在这里插入图片描述

1.3 透镜问题

 1. 使用透镜带来的第一个问题是会造成失焦。透镜问题中的 “失焦” 主要指的是在拍摄过程中,由于焦距调整不当,导致拍摄主体在胶片或传感器上未能形成清晰的图像。具体来说,当物体上离相机较远的点P在胶片上成像时,如果物体上较近的点在胶片上映射到多个位置,那么就无法形成清晰的焦点,从而产生虚像。

在这里插入图片描述

 2. 失焦的原因可以归结为焦距设置的不准确。每个透镜都有一个特定的 “聚焦” 距离,只有在该距离上的物体才能被清晰地成像。此外,景深也是一个重要的因素。景深是指在摄影机镜头或其他成像器前沿能够取得清晰图像的所成影像的景物空间范围。在一定景深范围内,物体能够形成清晰的像;而超出这个范围,物体则可能形成虚像。

 3. 使用透镜带来的第二个问题是会造成径向畸变。透镜问题中的径向畸变是一种常见的光学现象,它主要沿着透镜的半径方向分布。当光线经过透镜时,由于透镜的制造精度或组装工艺的偏差,光线在远离透镜中心的地方比靠近中心的地方更加弯曲,从而导致图像的失真。这种失真在普通廉价的镜头中尤为明显。

在这里插入图片描述

 4. 径向畸变的产生与透镜的曲率半径、折射率以及光线入射角等因素有关。当光线经过透镜时,由于不同位置的光线受到不同程度的折射,导致它们在成像平面上无法准确聚焦,从而产生径向偏移。这种偏移随着离透镜中心距离的增加而变得更加明显。

 径向畸变主要分为两种类型:桶形畸变和枕形畸变。桶形畸变通常表现为图像边缘向中心收缩,使得图像呈现出一种 “桶状” 的效果;而枕形畸变则表现为图像边缘向外扩张,形成一种 “枕状” 的效果。

二、摄像机几何

2.1 像平面和像素平面

 1. 首先,像平面是一个连续的平面,通常用于描述光线通过透镜后在成像介质(如胶片或图像传感器)上形成的图像。在像平面上,每个点都对应着一定的光线强度和颜色信息,从而构成了我们所看到的图像。这个平面的坐标原点一般设定在图像的中心,即主光轴与图像传感器的交点,以便更准确地描述图像的物理位置和关系,常常使用物理单位如毫米来描述像素在图像中的位置。

 而像素平面则是与图像的存储和显示方式紧密相关的离散平面。在数字图像处理中,图像被表示为一个由多个像素组成的矩阵,每个像素都对应着像素平面上的一个点。这些像素点按照一定的规律排列,共同构成了我们看到的数字图像。像素平面的坐标原点通常设定在图像的左上角顶点,这与计算机图像处理中的常见坐标系统相一致。

在这里插入图片描述

 2. 我们需要对小孔成像模型进行修正。由于在像平面和像素平面中坐标系的原点选择位置和物理单位不同,所以我们只需要在像平面下加上偏置和乘上系数就可以了。第二幅图中 α α α β β β 一般是由摄像机自身决定的。

在这里插入图片描述

在这里插入图片描述

 3. 思考 P P P P ′ P' P 的变换是线性的吗? 答:不是线性的,由于 x x x y y y 变化时 z z z 也有可能变化, z z z 并不是一个恒定的常数,所以并不是线性的。

2.2 齐次坐标下的投影变换

 1. 齐次坐标(Homogeneous Coordinate)是一个用于投影几何里的坐标系统。齐次坐标表示法将一个原本是 n 维的向量用一个 n+1 维向量来表示,从而能够表达更多的信息。

在这里插入图片描述

 2. 下面表达式中 P h P_h Ph 代表物体齐次坐标形式(三维), P h ′ P'_h Ph 代表像的齐次坐标形式(像素平面), P h P_h Ph P h ′ P'_h Ph 之间通过一个三行四列的矩阵 M M M 进行变换。

在这里插入图片描述

在这里插入图片描述

2.3 摄像机倾斜

 1. 摄像机倾斜是指摄像机向一侧或者上下方倾斜拍摄的一种摄像技术,主要是由于工艺制作不好的原因。当摄像机发生倾斜时,拍摄到的图像会相应地发生旋转或倾斜。这种旋转或倾斜会导致图像中的物体和背景之间的相对位置发生变化,从而在像素平面上形成新的几何布局。这种几何变换可能会使得原本水平或垂直的线条变得倾斜,或者使得物体的形状和比例发生扭曲。

 2. 摄像机倾斜情况下,变换矩阵 M M M 也要做出相应的改变。

在这里插入图片描述

 3. 综上所示,最终得到的摄像机坐标系下的摄像机模型如下图所示。反映了摄像机坐标系下的物体某处坐标到像素平面的映射。内参数矩阵 K K K α 、 β 、 θ 、 c x 、 c y α、β、θ、c_x、c_y αβθcxcy 五个参数。

在这里插入图片描述

2.4 规范化摄像机

 规范化摄像机通常指的是将摄像机的参数和设置调整到一种标准或基准状态,以确保拍摄出的图像具有一致性、准确性和可预测性。:此时物体所取的位置应该是与摄像机坐标系的中心相对应。

在这里插入图片描述

2.5 世界坐标系

 1. 世界坐标系是系统的绝对坐标系,用于描述物体在三维空间中的位置。在没有建立用户坐标系之前,画面上所有点的坐标都是以该坐标系的原点来确定各自的位置的。世界坐标系通常由三个轴表示,分别是 x x x 轴、 y y y 轴和 z z z 轴,其中 x x x 轴表示东西方向, y y y 轴表示南北方向, z z z 轴表示高度或海拔。每个点在这个坐标系中都有一个独特的坐标值,可以用 ( x , y , z ) (x, y, z) (x,y,z) 的形式表示。

 2. 假设世界坐标系 P w P_w Pw 做一个旋转与平移后转换到摄像机坐标系 P P P(齐次坐标),那么存在旋转矩阵 R R R(三行三列),平移矩阵 T T T(三行一列),对于旋转矩阵有三个自由度,平移矩阵有三个自由度,那么外参数总共有六个自由度。

在这里插入图片描述

 3. 世界坐标系下的摄像机模型如下所示, P w P_w Pw 表示世界坐标系, P ′ P' P 表示像素平面的齐次坐标系。

在这里插入图片描述

 4. 对于旋转矩阵有三个自由度,平移矩阵有三个自由度,那么外参数总共有六个自由度。 同时考虑外参数和内参数情况下,投影矩阵 M M M 有11个自由度。旋转矩阵 R R R(三行三列),平移矩阵 T T T(三行一列)。

在这里插入图片描述

2.6 Faugeras定理

 1. Faugeras定理是一个关于计算机视觉和摄影几何的重要定理,它主要关注于如何从多视图几何中提取场景的三维结构信息。Faugeras定理通常表述为:在给定足够多的视图和相应的摄像机参数的情况下,我们可以唯一地重建出场景的三维结构。这意味着,通过拍摄同一场景的多张照片,并知道每张照片的摄像机参数(如位置、方向、焦距等),我们可以利用这些信息和Faugeras定理来恢复出场景的三维模型。

 2. Faugeras定理介绍如下:

在这里插入图片描述

2.7 投影变换性质:

 1. 在计算机视觉中,投影变换是一个关键概念,它涉及将三维物体或场景投影到二维图像平面的过程。这种变换模拟了光线如何通过摄像机的镜头并在图像传感器上形成图像的过程。

 2. 投影变化的性质如下所示,共有五条,可对应右边的图来理解。

在这里插入图片描述

三、其他投影摄像机模型

3.1 弱透视投影摄像机

 1. 弱透射投影摄像机是一种特殊的摄像机模型,它在投影过程中采用了弱透视投影的原理。在弱透视投影中,像素坐标与三维坐标之间的关系相对简单,通常只需要一个放大系数就可以进行转换。

在这里插入图片描述

 2. 当观察的场景或物体与摄像机很远时,此时观察的场景或物体近似于平面。比如摄像机照一个人,当之间的距离很远时,人的脸可以看成一个平面,那么应用弱透射投影摄像机可以提供相对准确的投影结果。

在这里插入图片描述

3.2 正交投影摄像机

 正交投影摄像机是一种特殊的摄像机,其投影方式遵循正交投影的原理。正交投影是一种投影变换,其中物体在三维空间中的平行线在投影到二维平面上时仍保持平行。这种投影方式在制图、建模等领域中特别常见,因为它能够保持物体的尺寸和形状不变,不产生透视效果。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1527203.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

php版本的AI电话机器人系统有哪些优势

PHP版本的AI电话机器人系统具有以下优势: 提升客户体验:AI电话机器人能够为客户提供724小时的服务,无论何时客户有疑问或需要帮助,都可以得到及时响应1。 提高工作效率和客户满意度:AI电话机器人系统具有智能回答问题…

oracle创建序列

oracle创建序列 oracle创建序列00-查看当前用户创建的序列01-创建序列02-创建序列方法二03-序列使用04-删除序列 oracle创建序列 00-查看当前用户创建的序列 SELECT * FROM user_sequences;01-创建序列 --01-创建序列 /* 语法: CREATE SEQUENCE 序列名称 START W…

python知识点总结(四)

这里写目录标题 1、Django 中的缓存是怎么用的?2、现有2元、3元、5元共三种面额的货币,如果需要找零99元,一共有多少种找零的方式?3、代码执行结果4、下面的代码执行结果为:5、说一下Python中变量的作用域。6、闭包7、python2与p…

Hive:数据仓库利器

1. 简介 Hive是一个基于Hadoop的开源数据仓库工具,可以用来存储、查询和分析大规模数据。Hive使用SQL-like的HiveQL语言来查询数据,并将其结果存储在Hadoop的文件系统中。 2. 基本概念 介绍 Hive 的核心概念,例如表、分区、桶、HQL 等。 …

深入浅出Go的`encoding/xml`库:实战开发指南

深入浅出Go的encoding/xml库:实战开发指南 引言基本概念XML简介Go语言中的XML处理结构体标签(Struct Tags) 解析XML数据使用xml.Unmarshal解析XML结构体标签详解处理常见解析问题 生成XML数据使用xml.Marshal生成XML使用xml.MarshalIndent优化…

服务器中了mallox勒索病毒还能恢复数据吗?

什么是mallox勒索病毒? mallox是一种最近多发的勒索病毒类型,它主要针对企业的Web应用和数据库服务器进行攻击。mallox后缀的勒索病毒会加密用户的重要文件数据并以此为要挟索要赎金。该类病毒会绕过企业的防火墙和各种防护软件,对目标设备进…

带你深入了解数据库的事务

为什么要使用事务 日常开发中,很多操作,不是通过一个SQL就能完成的,往往需要多个SQL配合完成 当执行多个SQL操作的时候,如果中间出现了特殊的情况(程序崩溃,系统奔溃,网络断开,主机…

R语言:microeco:一个用于微生物群落生态学数据挖掘的R包:第七:trans_network class

# 网络是研究微生物生态共现模式的常用方法。在这一部分中,我们描述了trans_network类的所有核心内容。 # 网络构建方法可分为基于关联的和非基于关联的两种。有几种方法可以用来计算相关性和显著性。 #我们首先介绍了基于关联的网络。trans_network中的cal_cor参数…

进程的一些概述

文章目录 前言一、进程以及查看指令二、查看进程 前言 进程是什么?进程应该如何描述?进程又该如何管理?进程如何查看? 一、进程以及查看指令 一个正在运行的程序,加载到内存中的程序是进程也叫做任务,用任务资源管理…

从单机到分布式微服务,大文件校验上传的通用解决方案

一、先说结论 本文将结合我的工作实战经历,总结和提炼一种从单体架构到分布式微服务都适用的一种文件上传和校验的通用解决方案,形成一个完整的方法论。本文主要解决手段包括多线程、设计模式、分而治之、MapReduce等,虽然文中使用的编程语言…

在Visual Studio中调试 .NET源代码

前言 在我们日常开发过程中常常会使用到很多其他封装好的第三方类库(NuGet依赖项)或者是.NET框架中自带的库。如果可以设置断点并在NuGet依赖项或框架本身上使用调试器的所有功能,那么我们的源码调试体验和生产效率会得到大大的提升。今天我…

openKylin系统安装ssh服务结合内网穿透实现固定公网地址访问

文章目录 1. 安装SSH服务2. 本地SSH连接测试3. openKylin安装Cpolar4. 配置 SSH公网地址5. 公网远程SSH连接小结 6. 固定SSH公网地址7. SSH固定地址连接 openKylin是中国首个基于Linux 的桌面操作系统开发者平台,通过开放操作系统源代码的方式,打造具有自…

Selenium 自动化 —— Selenium IDE录制、回放、导出Java源码

Hello Selenium 示例 之前我们在专栏的第一篇文章中演示了使用使用Selenium进行百度搜索的Hello world示例。 代码不复杂非常简单: public static void main(String[] args) {WebDriver driver null;try {// 设置Chrome驱动的路径 // System.setPro…

matplotlib库简介及函数说明

目录 简介matplotlib.pyplot as plt 常用函数说明创建子图plt.subplots().plot() 子图参数set_title()axis2.legend()fig.autofmt_xdate() 简介 matplotlib 是一个用于创建二维图表和数据可视化的 Python …

【JavaWeb】Spring非阻塞通信 - Spring Reactive之WebFlux的使用

【JavaWeb】Spring非阻塞通信 - Spring Reactive之WebFlux的使用 文章目录 【JavaWeb】Spring非阻塞通信 - Spring Reactive之WebFlux的使用参考资料一、初识WebFlux1、什么是函数式编程1)面向对象编程思维 VS 函数式编程思维(封装、继承和多态描述事物间…

【视频异常检测】Delving into CLIP latent space for Video Anomaly Recognition 论文阅读

Delving into CLIP latent space for Video Anomaly Recognition 论文阅读 ABSTRACT1. Introduction2. Related Works3. Proposed approach3.1. Selector model3.2. Temporal Model3.3. Predictions Aggregation3.4. Training 4. Experiments4.1. Experiment Setup4.2. Evaluat…

Linux设置IP地址多种方法保姆级教程,外加修改主机名并通过生成密钥,组建机群。

[引入提问] 怎么设置linux服务器的名称? 方法1: nmtui—自动打开设置机器名称的操作界面---输入即可。重启hostnamed服务, systemctl restart system-hostnamed 方法2: 直接编辑 vim /etc/hostname ,输入新的…

VR历史建筑漫游介绍|虚拟现实体验店加盟|VR设备购买

VR历史建筑漫游是一种利用虚拟现实技术,让用户可以身临其境地参观和探索历史建筑的体验。通过VR头显和相关设备,用户可以在虚拟环境中自由移动和互动,感受历史建筑的真实氛围和文化内涵。 在VR历史建筑漫游中,您可以选择不同的历史…

Vue+SpringBoot打造数据可视化的智慧河南大屏

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、系统展示四、核心代码4.1 数据模块 A4.2 数据模块 B4.3 数据模块 C4.4 数据模块 D4.5 数据模块 E 五、免责说明 一、摘要 1.1 项目介绍 基于JAVAVueSpringBootMySQL的数据可视化的智慧河南大屏,包含了GDP、…

SpringCloud搭建微服务之Micrometer分布式链路追踪

1. 概述 由于Spring Cloud Sleuth最新版本只支持Spring Boot 2.7.x,核心项目已经迁移到Micrometer Traceing项目,Spring Boot 3.x版本要实现分布式链路追踪需要集成Micrometer。更多详情可以参阅Micrometer官网 本文将以Spring Boot 3.2.x和Spring Clo…