针孔成像模型零基础入门(三)

news2025/1/13 17:09:48

在这里插入图片描述

2020年爆火的Nerf(神经辐射场)横空出世,据说只要用手机拍照,然后喂给模型,就可以生成3D模型了,我试过了,确有此事!
那我们有想过,为什么可以从二维的图片里面获取物体三维的信息吗?

接下来,我们就追根溯源,先从数学和物理的角度来看下三维世界的物体如何通过照相机变成二维的图像信息。
稍微插播:大家支持的话可以关注公众号 AI知识物语(周更三维重建相关文章), B站 出门吃三碗饭,不定期更新视频讲解

接下来我们将依次介绍下面几个坐标
世界坐标,相机坐标,归一化坐标,像素坐标。

在这里插入图片描述

首先我们引入一个最简单的相机模型——针孔相机模型

P:真实世界中的一个点
O:相机的光心,处在相机平面上
P‘:真实世界的点通过光心在成像平面上形成的一个点
在左边的平面看作是相机内部的成像平面
光心O到成像平面O‘的距离叫f 焦距
P到光心O的距离w设为z

设P坐标 [X,Y,Z]^T
设P’坐标 [X‘,Y‘,Z‘]^T

z和f的距离可以见右图,通过相似三角形可以得出
在这里插入图片描述
我们知道成像平面最终呈现给我们是一张图片,也就是只有2维的信息,于是我们在 成像平面上引入 像素平面,并在其左上角顶点设立起点坐标系,设P’的像素坐标为 [u,v]^T
像素坐标系相对于成像平面,可看做在u、v轴分别缩放了α和β倍,同时原点平移了
[Cx,Cy]^T,像素坐标推导如下图:

在这里插入图片描述
在这里插入图片描述
为了更加美观,我们把像素坐标变为齐次形式,并写为以上形式
Z:世界空间点到光心距离
K:相机内参矩阵(可以问厂家or自己测;相机如果碰损会影响值)
P:世界空间点的坐标

现在我们已经成功实现了一个数学模型,输入空间的一个点,就输出其通过相机的像素点,是不是很神奇?如果输入的是很多个点,那么最终就会输出一幅色彩丰富的图片啦。

但是,现在我们还有一点要考虑。在上面我们输入的P是相机坐标下的点坐标,但因为相机的运动关系,P的相机坐标应该是其世界坐标P_world,简称P_w ,根据相机位姿变化的结果。
(也就是说如果需要使用P相机坐标,我们需要知道他的值,可以通过P_w推出)
相机的位姿由他的旋转矩阵R和平移向量t来确定,将其代入上述公式,代替P
在这里插入图片描述
现在,我们得到了式子,他的含义是:
输入 世界坐标下的点P_w, 先左乘 相机内参矩阵,再右乘 相机外参矩阵T,
值=空间点坐标距离光心距离 右乘 像素坐标
输出:(Z已知)可以得到其 像素坐标

这样,我们的空间点在相机的成像过程就顺利理顺了!

从另一个角度再看,
我们先把世界坐标点P_w转为P相机坐标系点,再除去其最后一维值,也就是Z(该点距离相
机成像平面的深度),这样相当于对最后一个维度归一化(最后一维经过上面操作后变为1),于是我们得到 相机坐标系的点P在 相机归一化平面上的投影点。

在这里插入图片描述
归一化坐标可以看作相机前面z=1处的平面有一个点,z=1的平面可以看作归一化平面,归一化坐标左乘内参就得到了像素坐标,因此,我们可以把像素坐标看作是对归一化平面上点量化测量的结果。
这里,如果我们对相机坐标P乘任意非0常数,其归一化坐标都是一样的,也即该点的深度在投影失去了信息。因此单目视觉(针孔成像)没法得到像素点的深度值。该任务需要双目模型来完成。
另外,本篇文章参考借鉴了高翔的视觉SLAM14讲,第5章节,想了解更多细节请自行搜索。

最后,觉的有帮助的话可以关注公众号 AI知识物语, B站 出门吃三碗饭,不定期更新视频讲解。

好了,我去复习明天下午的操作系统考试了,我真的会谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/372475.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【7】linux命令每日分享——cat查看文件内容

大家好,这里是sdust-vrlab,Linux是一种免费使用和自由传播的类UNIX操作系统,Linux的基本思想有两点:一切都是文件;每个文件都有确定的用途;linux涉及到IT行业的方方面面,在我们日常的学习中&…

Linux网络配置(NAT)

在搭配好一台虚拟机的时候想要下载,安装些什么但一直失败这个时候就可以检查一下网络是否连接这里我们使用centos7举例子使用命令——ifconfig由此可见我们的系统中目前有3个网卡ens33——用于接入外网,该网卡默认关闭lo——用于访问本地网络&#xff0c…

[数据结构]:04-循环队列(数组)(C语言实现)

目录 前言 已完成内容 循环队列实现 01-开发环境 02-文件布局 03-代码 01-主函数 02-头文件 03-QueueCommon.cpp 04-QueueFunction.cpp 结语 前言 此专栏包含408考研数据结构全部内容,除其中使用到C引用外,全为C语言代码。使用C引用主要是为了…

1.7校验码:校验码、规则校验码-奇偶校验、检验码-循环校验码CRC、模2除法、校验码-海明校验

1.7校验码:校验码、规则校验码-奇偶校验、检验码-循环校验码CRC、模2除法、校验码-海明校验校验码校验码-奇偶校验编码规则检验码-循环校验码CRC编码规则什么是模2除法如何计算校验码校验码-海明校验校验码 计算机在接收相应信息的时候能够识别的的都是一些电器信号…

【Spring6】| Spring的入门程序、集成Log4j2日志框架

目录 一:Spring的入门程序 1. Spring的下载 2. Spring的jar文件 3. 第一个Spring程序 4. 第一个Spring程序详细剖析 5. Spring6启用Log4j2日志框架 一:Spring的入门程序 1. Spring的下载 官网地址:https://spring.io/ 官网地址&…

数学建模 latex 图片以及表格排版整理(overleaf)

无论是什么比赛,图片和表格的格式都非常重要,这边的重要不只是指规范性,还有抓住评委眼球的能力。 那么怎样抓住评委的眼球? 最重要的一点就是善用图片和表格(当然撰写论文最重要的是逻辑,这个是需要长期…

CorelDRAW2023最新版序列号使用教程

CorelDRAW2023用起来非常顺手,旨在为用户解决因在工作上带来的问题,在业内可谓享有极高的声誉,是业内人士常用的一款工具,有了它,可以更好的帮助用户把握好各个方面的细节,减少其他方面的失误,让…

RabbitMQ交换机(Exchanges)

目录 一、概念 二、临时队列 三、绑定 四、Fanout(扇出交换机) (一)介绍 (二)实战 五、Direct(直接交换机) (一)介绍 (二)实…

【LeetCode】1255. 得分最高的单词集合

1255. 得分最高的单词集合 题目描述 你将会得到一份单词表 words,一个字母表 letters (可能会有重复字母),以及每个字母对应的得分情况表 score。 请你帮忙计算玩家在单词拼写游戏中所能获得的「最高得分」:能够由 …

我看谁还敢说不懂git

文章目录一、Git介绍1.1、Git的作用1.2、Git的理念1.3、Git的特点1.4、Git对比SVN二、Git的概念2.1、Git基础概念三、Git的基本操作3.1、使用Git管理一个代码仓库的流程3.2、Git常用命令介绍四、Git状态的变化五、Git安装和配置5.1、Git的安装5.2、Git的配置六、Git的高级操作6…

【阅读笔记】SecureML: A System for ScalablePrivacy-Preserving Machine Learning

1. Motivation 针对机器学习中的出现的数据隐私泄露的风险,提出了线性回归、逻辑回归以及简单神经网络的隐私保护模型。 2. Contributions 2.1 为线性回归、逻辑回归以及神经网络设计安全计算协议 2.1.1.1 线性回归 线性回归损失函数为: , 采用SG…

数据分析:某电商优惠卷数据分析

数据分析:某电商优惠卷数据分析 作者:AOAIYI 专栏:python数据分析 作者简介:Python领域新星作者、多项比赛获奖者:AOAIYI首页 😊😊😊如果觉得文章不错或能帮助到你学习,可…

单变量回归问题

单变量回归问题 对于某房价问题,x为房屋大小,h即为预估房价,模型公式为: hθ(x)θ0θ1xh_{\theta}(x)\theta_{0}\theta_{1}x hθ​(x)θ0​θ1​x 要利用训练集拟合该公式(主要是计算θ0、θ1\theta_{0}、\theta_{1}θ…

JavaScript DOM和BOM

目录 查找html元素 1.通过id 2.通过标签名 3.通过类名 DOM 1.创建动态的HTML内容 2.修改元素内容 3.改变HTML属性 4.改变css样式 DOM事件 DOM节点 1.添加HTML元素 2.删除HTML元素 浏览器对象 1.Window对象 2.Screen对象 3.History对象 4.Location对象 5.Navi…

深入理解java虚拟机精华总结:jvm内存模型(运行时数据区域)、对象、OOM异常

深入理解java虚拟机精华总结:jvm内存模型、对象、OOM异常jvm内存模型对象对象的创建对象的内存布局对象的访问定位OOM异常Java堆溢出栈溢出方法区溢出直接内存溢出以前读过好几遍《深入理解java虚拟机》这本书,最近又打算重读一遍,并且做一些…

一个接口多个实现如何选择注入对应的Bean_@Primary_@Resource_@Qualifier_@ConditionalOnProperty

文章目录引入结论案例Primary 指定默认注入的BeanQualifier配合Autowired 按名称注入对应的BeanResource 默认按照类型注入,可指定名称注入ConditionalOnProperty 结合配置文件统一设置bean的注入引入 在springboot中,如果一个接口有多个实现&#xff0…

SpringMVC - 13 - SpringMVC执行流程

文章目录1、SpringMVC常用组件2、DispatcherServlet初始化过程a>初始化WebApplicationContextb>创建WebApplicationContextc>DispatcherServlet初始化策略3、DispatcherServlet调用组件处理请求a>processRequest()b>doService()c>doDispatch()d>processDi…

【Neo4j】图数据库CypherQueryLanguage随笔

CQL语言随笔 一、Cyther关系描述 如图&#xff1a;唐僧&#xff0c;孙悟空&#xff0c;白骨精三者的关系图&#xff1a; Cypher语言描述他们的关系&#xff1a; (孙悟空)<-[:赶走]-(唐僧)-[:被骗]->(白骨精)-[:被打死]->(孙悟空) 二、CQL语言的使用案例 创建结点…

七、HTTPTomcatServlet

1&#xff0c;Web概述 1.1 Web和JavaWeb的概念 Web是全球广域网&#xff0c;也称为万维网(www)&#xff0c;能够通过浏览器访问的网站。 在我们日常的生活中&#xff0c;经常会使用浏览器去访问百度、京东、传智官网等这些网站&#xff0c;这些网站统称为Web网站。如下就是通…

_react

React 中 keys 的作用是什么&#xff1f; Keys是 React 用于追踪哪些列表中元素被修改、被添加或者被移除的辅助标识 在开发过程中&#xff0c;我们需要保证某个元素的 key 在其同级元素中具有唯一性。在 React Diff 算法中React 会借助元素的 Key 值来判断该元素是新近创建的还…