初识增强现实(AR)

news2025/1/23 4:06:20

初识增强现实(AR)

笔记来源:
1.2023年中国增强现实(AR)行业研究报告
2.wiki/Augmented reality
3.In-Depth Review of Augmented Reality: Tracking Technologies, Development Tools, AR Displays, Collaborative AR, and Security Concerns
4.Design and Implementation of Augmented Reality Browser for Mobile Terminal
5.FUSE: Towards AI-Based Future Services for Generating Augmented Reality Experiences

1.1 AR的简单定义

AR can be defined as a system that incorporates three basic features: a combination of real and virtual worlds, real-time interaction, and accurate 3D registration of virtual and real objects.
AR可以被定义为一个包含三个基本特征的系统:
(1) 虚实融合
(2) 实时交互
(3) 虚拟和现实对象的精确3D配准。

1.2 概念区分AR/MR/VR

1.3 AR所需的硬件

1.3.0 Chipset

1.3.1 Displays

AR光学显示系统大体包含两大块:

  1. 光学组合器
  2. 微型显示屏

1.3.2 Tracking

运动追踪所需硬件
motion tracking technologies: digital cameras and/or other optical sensors、accelerometers、GPS、gyroscopes、solid state compasses、radio-frequency identification (RFID)

下图来自:In-Depth Review of Augmented Reality: Tracking Technologies, Development Tools, AR Displays, Collaborative AR, and Security Concerns

1.3.3 Input Device

技术包括将用户的口语翻译成计算机指令的语音识别系统,以及通过视觉检测或嵌入在外围设备(例如魔杖、手写笔、指针、手套或其他身体穿戴设备)中的传感器来解释用户的身体动作的手势识别系统。

1.3.4 Networking

移动AR应用程序依赖强大计算能力,为弥补移动设备计算能力不足,将应用程序的计算传输给远程计算平台,这时就需要移动网络设备的支持对数据进行传输。

1.4 AR所需的软件和算法

1.4.1 Alighment (Registration) and Tracking

将虚拟物体和真实环境放在同一个坐标系下,在这种情况下虚拟物体相对真实环境就有了正确的位置和方向(配准问题)

Registration or alignment of partial 3D models is the process of bringing them all into the same reference frame by means of a suitable transformation.
部分 3D 模型的配准或对齐是通过适当的变换将它们全部带入同一参考系的过程。

Registration technology enables virtual images to be superimposed accurately in the proper environment. The main flow of 3d registration technology has two steps. First, determine the relationship between the virtual image, the model and the direction and position information of the camera or display device. Second, the virtual rendered image and model are accurately projected into the real environment, so the virtual image and model can be merged with the real environment. For the three-dimensional registration technology based on computer vision, it sets the reference point to realize the determination of the direction and position of the real scene by the camera or the display. –Research on Tracking and Registration Algorithm Based on Natural Feature Point
配准技术使虚拟图像能够在适当的环境中准确地叠加。
3D配准技术的主要流程有两个步骤。
首先,确定虚拟图像、模型以及摄像机或显示设备的方向和位置信息之间的关系。
其次,将虚拟渲染的图像和模型精确地投影到真实环境中,因此虚拟图像和模型可以与真实环境融合。
对于基于计算机视觉的三维配准技术来说,它通过设置参考点来实现摄像机或显示器对真实场景的方向和位置的确定。

To realize the three-dimensional registration process in augmented reality, the internal and external parameters of the camera are required. In fact, the camera calibration determines the intrinsic matrix, and the extrinsic matrix contains a translation component T and 3 rotation components. Therefore, the external parameter matrix M of each frame of the image obtained in the three-dimensional registration can be uniquely determined.The position of the point, that is, the accurate registration position of the virtual object in the real scene.–Research on Tracking and Registration Algorithm Based on Natural Feature Point
为了实现增强现实中的三维配准过程,需要相机的内部和外部参数。事实上,相机标定决定了内参矩阵,外参矩阵包含一个平移分量T和3个旋转分量。因此,三维配准得到的每一帧图像的外参矩阵可以唯一确定。点的位置,即虚拟物体在真实场景中的准确配准位置

经过配准后,用户、虚拟物体和真实环境同处在一个坐标系下,当后续虚拟物体或和用户进行移动时,能够更加精准的追踪虚拟物体和用户(摄像头)相对于真实环境的位置

实现追踪所需的技术

下图来自:In-Depth Review of Augmented Reality: Tracking Technologies, Development Tools, AR Displays, Collaborative AR, and Security Concerns


许多增强现实的计算机视觉方法都是继承自视觉里程计(VO)
上述方法通常由两部分组成:

The first stage is to detect interest points, fiducial markers or optical flow in the camera images. This step can use feature detection methods like corner detection, blob detection, edge detection or thresholding, and other image processing methods.
第一阶段:检测相机图像中的兴特征点、基准标记或光流。此步骤可以使用特征检测方法,例如角点检测、斑点检测、边缘检测或阈值处理以及其他图像处理方法。

The second stage restores a real world coordinate system from the data obtained in the first stage. Some methods assume objects with known geometry (or fiducial markers) are present in the scene. In some of those cases the scene 3D structure should be calculated beforehand. If part of the scene is unknown simultaneous localization and mapping (SLAM) can map relative positions. If no information about scene geometry is available, structure from motion methods like bundle adjustment are used. Mathematical methods used in the second stage include: projective (epipolar) geometry, geometric algebra, rotation representation with exponential map, kalman and particle filters, nonlinear optimization, robust statistics.
第二阶段:根据第一阶段获得的数据恢复真实世界坐标系。一些方法假设场景中存在具有已知几何形状(或基准标记)的对象。在某些情况下,应事先计算场景 3D 结构。
如果场景的一部分未知,同时定位和建图 (SLAM) 可以绘制相对位置。
如果没有有关场景几何的信息可用,则使用类似BA的SfM方法
第二阶段使用的数学方法包括:对极几何、几何代数、指数图旋转表示(Connecting the Lie algebra to the Lie group is the exponential map)、卡尔曼和粒子滤波器、非线性优化、鲁棒统计。

1.4.2 Rendering (lighting、shading, etc.)

Rendering is the process of generating a visual representation of a 3D scene or object from a 3D model. In augmented reality, rendering is a critical step in creating realistic and immersive AR experiences. It involves the use of computer algorithms to calculate how virtual objects should appear in the user’s view, considering factors like lighting, shadows, textures, and perspective.

AR rendering pipeline.
The camera or a set of sensors capture information about the environment.
The information is processed to:
(1) calculate camera extrinsic parameters and
(2) build understanding of the environment in order to generate augmentations in the form of text, images, 3D objects or neural scene representations.
(3) Finally, the extrinsic and graphic primitives are fed to the renderer which creates 2D images ready to be displayed.

以上只提到了配准、追踪、渲染,其实AR还涉及很多算法,接下来我们看看AR目前面临的几大问题

1.5 AR目前面临的几大问题(软件方面)

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978192.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

js第二天

比较运算符 ==左右两边值是否相等 ===左右两边值和类型是否全相等 !==左右两边是否类型和值全不相等 undefin === null NaN === NaN(错误,NaN不等于任何值) =单等是赋值 ==双等是判断 ===三等是全等,开发中判断是否相等,一般用全等。 console.log 先比较a和a,相…

电脑添加虚拟网卡与ensp互联,互访

一、按照过程 1、打开设备管理器 2、点击网络适配器,点击左上角操作,点击“添加过时硬件” 3、下一页 4、选择“安装我手动从列表选择的硬件”,下一页 5、下拉,选择“网络适配器”,下一页 6、厂商选择“Microsoft”&…

基于MFC对话框吸管实验

1.新建项目 2.将bmp图像放入res文件下 3.导入bmp文件到bitmap 4.在dlg中添加picture控件,修改控件属性(Type Image属性),把bitmap资源添加到控件中 5.重写鼠标单击鼠标中键响应事件 6.主要源代码 void CMFC吸管Dlg::OnMButtonDow…

使用Springboot + netty 打造聊天服务之Nacos集群问题记录

目录 1、前言1.1、方法一1.2、方法二 2、方案二实战2.1、在netty服务里加上ws连接、中断事件2.2、在netty服务里加上消息服务 4、总结 使用Springboot netty 打造聊天服务系列文章 第一章 初始搭建工程 第二章 Nacos集群问题记录 1、前言 在使用Springboot Nacos Netty(Web…

SAPUI5基础知识23 - 模型的种类(小结)

1. 背景 在前序的学习中,我们学习了SAPUI5的MVC架构中的各个知识点,包括视图的设计,控制器的设计,以及模型的使用。 在企业级应用程序中,对于数据的处理的需求是很大的,在学习更复杂的数据绑定方式之前&a…

Pr2024苹果(mac)版剪辑软件安装下载(附下载链接)

Adobe Premiere Pro 2024(简称PR 2024)是一款由Adobe公司开发的专业视频编辑软件,被广泛应用于电影、电视、广告和社交媒体视频的制作。以下是对PR 2024的详细简介: 链接:https://pan.baidu.com/s/1rN-3kB3KQgn0JswDa…

《学会 SpringMVC 系列 · 剖析初始化》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

win10系统资源监视器磁盘蓝黄线、活动时间代表什么意思?

win10系统资源监视器磁盘蓝黄线、活动时间代表什么意思?在win10系统中磁盘在运行工程中会有不同的数据信息显示,如下图所示,10兆字节/秒、磁盘中蓝线和黄线、活动时间都达标什么意思呢?本文中winwin7小编给大家分享介绍下win10系统…

Python 爬虫入门(六):urllib库的使用方法

Python 爬虫入门(六):urllib库的使用方法 前言1. urllib 概述2. urllib.request 模块2.1 发送GET请求2.2 发送POST请求2.3 添加headers2.4 处理异常 3. urllib.error 模块4. urllib.parse 模块4.1 URL解析4.2 URL编码和解码4.3 拼接URL 5. ur…

MySQL主从复制原理及实现教程

MySQL主从复制是一种数据复制技术,通过建立主服务器(Master)与从服务器(Slave)之间的数据同步,实现数据的备份、负载均衡和高可用性。 主从复制原理 MySQL binlog(binary log 即二进制日志文件) 主要记录…

Python 如何创建和操作矩阵?

在Python中,矩阵是二维数组的一种常见表示方式,特别是在数学和科学计算领域。矩阵用于表示和操作多维数据,包括数据分析、图像处理、机器学习、以及物理模拟等诸多领域。Python的NumPy库是处理矩阵的主要工具之一。NumPy提供了高效的多维数组…

Deformable Detr

参考: https://search.bilibili.com/all?vt68804228&keywordco-detr&from_sourcewebtop_search&spm_id_from333.1007&search_source5 详解可以看李宏毅的transformer视频。

SAP MM维护采购信息记录只到采购组织层级时候,税码输入报错 MESSAGE 06388

原因:税确认应该是在工厂层级 解决:对06388 消息号进行更改类型改成W

Java-文件操作和IO

文件介绍 文件本身有多重含义,狭义的文件,特指硬盘上的文件(以及保存文件的目录),广义的文件:计算机上的很多硬件设备,软件资源,在操作系统中,都会被视为是"文件" 文件除了有数据内容之外,还有一部分信息,例如文件名,文件类型,文件大小,这些信息可以称作文件的元信…

Redis-管道

面试题 如何优化频繁命令往返造成的性能瓶颈 Redis是一种基于客户端-服务端模型以及请求/响应协议的TCP服务。一个请求会遵循以下步骤: 1 客户端向服务端发送命令分四步(发送命令-命令排队一命令执行-返回结果),并监听Socket返回,通常以阻塞模式等待服…

看完这八本AI产品经理书籍,offer收的手软,收藏我这一篇就够了

对于想要深入了解人工智能领域并成为一名优秀的人工智能产品经理的专业人士来说,选择合适的书籍至关重要。下面是我为您精心挑选的八本关于AI产品经理领域的书籍,它们涵盖了从基础知识到高级实践的各个方面,旨在帮助读者构建全面的知识体系。…

情人节变情人劫?三好夫人:为何好男人怕过节

真正的爱,是两颗心灵的相互靠近,是理解、尊重与支持的结晶。———三好夫人 七夕节来源 2024年8月10是中国传统的情人节--七夕。七夕又称七巧节、七姐节、女儿节。妇女们在这一天相约,穿针乞巧,投针验巧,祈求得到智慧…

三十种未授权访问漏洞复现 合集( 一 )

未授权访问漏洞介绍 未授权访问可以理解为需要安全配置或权限认证的地址、授权页面存在缺陷,导致其他用户可以直接访问,从而引发重要权限可被操作、数据库、网站目录等敏感信息泄露。---->目录遍历 目前主要存在未授权访问漏洞的有:NFS服务&a…

全网最清晰Endnote教程笔记,轻松搞定文献管理以及文献引用

提示:从安装到使用,全网最清晰EndNote教程,轻松搞定文献管理!_哔哩哔哩_bilibili 目录 前言 1 导入文献 1.1 文献数据库建立 1.2 正式导入文献 1.3 Endnote导入PDF文献 2 管理文献 3. 引用文献 3.1 Endnote预览参考文献样…

搭建 Rancher 服务,配置k8s集群

1. 前提条件 前提条件: 安装docker,要求版本各节点版本一致。网上还有额外的要求:关闭swap、禁用selinux等等。 2. 搭建 Rancher 服务 直接通过docker命令实现即可,很方便。 docker run -d \--name rancher \--restart unles…