Karl Guttag评Vision Pro(二):这些硬件问题不容忽视

news2024/11/24 19:45:19

上周,AR/VR光学专家Karl Guttag从价格、VST透视、应用、交互等方面,将Vision Pro与Quest Pro进行对比,发现Vision Pro在设计上做出更多正确决策。尽管如此,Guttag认为该头显本身在硬件部分,依然存在一些不易发现的问题,比如人体工学和视觉体验等等。

值得注意的是,他还更正了上一篇对苹果光学模组的猜测,并表示:网络报道大部分都指出Vision Pro采用Pancake透镜,之前我说非球面镜是不准确的。因为苹果官方新闻稿中明确提到“定制的折反射透镜”字样,而Pancake也属于折返射透镜的其中一类。另外,苹果已收购的光学公司Limbak就以折反射方案闻名,此前还推出了某种“超级Pancake”透镜设计。

除此之外,我们接下来就一起看看Guttag对Vision Pro的硬件还有哪些评价吧。注:由于人眼视觉敏感性不同,对显示技术的感官体验也有差异,因此在实际体验Vision Pro时出现的问题可能不同,也许部分用户可以适应某种不良影响,而其他人则不可以。

30分钟的体验太短

在WWDC 2023上,苹果曾允许现场媒体上手体验Vision Pro的部分功能,体验时长大约30多分钟。Guttag指出,现场演示基于精心挑选的最好的体验,自然会绕开明显的问题,而且30分钟太短,很难察觉长时间使用可能会出现的人体工学和视觉问题。

从此前的3D电影、3D骑乘项目来看,部分人在体验超几分钟后,可能会有眩晕恶心等不适感。同样,AR/VR的舒适性也可能存在问题,具体需要对大量人群进行长时间研究观测。Guttag表示:也许苹果已经进行了一些用户研究,不过从现有的体验资料、硬件配置来看,Vision Pro还是做了一些错误/考虑不周的决定,而这具体对用户有哪些影响,后续将值得关注。

低延迟、高刷新率不足以解决视觉问题

Vision Pro搭载了PC级别的SoC:M2,加上定制的R1视觉处理器,可实现强悍的动态注视点渲染效果,而且可大幅降低传感器到显示器之间的延迟。

苹果在WWDC 2023发布会上有这样的描述:传感器到显示器之间的延迟容易导致不适感,而R1处理器几乎消除了延迟,只需12毫秒就能将新图像传输到显示屏,速度比眨眼还快8倍。

Guttag认为,低延迟处理、高刷新率虽然是优化XR视觉问题的必要条件,但这只是其中一个已知问题。另一方面,尽管Vision Pro的处理速度可能比其他同类头显更快,但还不够快,因为传感器到显示器延迟只是运动到光子延迟的一部分,其他未公布的数据还包括:相机和显示延迟。

假设摄像头、显示器以90Hz刷新率运行,每次只处理一帧图像,那么总延迟大约会翻三倍。除此之外,还可能出现缓冲延迟、追踪延迟,或是任何形式的错误。因此Guttag认为,“传感器到显示器之间的延迟比眨眼更快”不过是营销话术,并不能说明头显本身速度快不快。

理论上,一些低延迟系统的运动光子延迟接近为零,但实际上当涉及3D虚拟内容渲染、特殊相机和显示器同步运行时,系统延迟还是不够低。

就拿军事领域的夜视镜技术来讲,目前更常用的还是基于单色光电倍增管的ENVG夜视镜,而不是半导体相机,最大的原因就是延迟。因为军队在测试时发现,即使有轻微的图像延迟,也会让人迷失方向。

关于摄像头阵列

就像Lynx R1等VST头显那样,正常情况下主透视相机与左右眼同轴,差不多位于用户眼前。而Vision Pro由于前盖内包含了一块Eyesight屏幕,透视相机则只能和其他传感器一起放置在头显下方。Guttag认为,这并不是最佳的选择,尤其是在图像校正上,可能比Meta Quest Pro更难。

为什么这么说呢?VST头显倡导者Steve Mann在IEEE Spectrum 2013会议中强调,VST摄像头位于用户视觉中心,是实现长期视觉舒适性的关键,即使摄像头位置有轻微偏差,后续也可能造成明显的不适。比如,当用户已经适应VST头显的透视视角,摘下头显后,还需要一段时间才能适应双眼正常视觉。

而对于Vision Pro来讲,由于透视摄像头位于用户视线下方,苹果将需要使用某种复杂的校正算法,才能将透视视角与人眼自然视角匹配。

另外,由于透视摄像头位置问题,Vision Pro的视觉深度感测、协调也更加困难、更加不准确。尤其是近距离透视时,问题更加明显。Guttag表示:透视相机校正算法出现任何误差,都可能导致协调问题,但这种问题在简短的演示中不明显,后续还需要长时间观察。

整体来讲,VST相机的位置决策似乎主要与Eyesight屏幕有关。苹果为了Eyesight屏幕,还牺牲了其他多项设计,比如为其加入透光性好的玻璃保护壳,好处是外形高端,坏处是很重、不利于散热、质量存在差异、造成相机和传感器校准问题等等。

关于VAC问题

使用XR头显产生眩晕的一个原因,是VAC问题,也就是视觉辐辏调节冲突,即图像的焦距与人眼自然焦距不匹配,从而引起重影等不适。

现阶段,关于解决VAC问题的论文很多,但还没有真正有效的产品问世。Guttag指出,这通常意味着VAC还没有一个好的解决方案。比如,此前ML1通过叠加多层波导来实现变焦,缺点是牺牲了图像质量和成本。而Meta则是通过机械调焦、液晶透镜来解决,不过目前还在研究阶段,未用于正式的VR头显。另一方面,还有光场显示、计算全息图,以及基于眼球追踪的方案,但依赖大量计算,硬件复杂性和绝对图像质量也不理想。

从WWDC 2023现场开发者体验反馈来看,Vision Pro很可能将视觉焦点固定在2米左右的位置,通过将虚拟界面/内容放在较远的位置,来避免在手臂距离或1米距离内,观看图像可能产生的VAC问题。据开发者透露,苹果似乎希望开发者将应用内的物体、界面设计的更大,距离用户更远。

如果说Vision Pro未来替代电脑显示屏、电视,那么针对不同的应用场景,UI界面的距离也有讲究。举个例子,如果在头显中将虚拟屏幕放在2米远距离,那么其特性则更接近电视,而不是电脑显示屏,因为通常显示屏与用户的距离大约为半米。

虚拟屏幕位置远,意味着文字大小应该和XR屏幕等比例放大,但在体验交互上仍然与电脑显示器有差异。比如用户靠近虚拟界面时,文字清晰度变化不如现实中那么明显,而且用户不能轻易的伸手触摸界面上的内容(超出一臂距离)。但如果将XR虚拟界面设置成常见显示屏的大小和距离,就很容易产生VAC问题。

使用行为与电脑屏幕的差异,也是VR办公面临的一个难题。即使有一些人曾挑战一个月持续使用VR办公,但似乎没人认为VR能够完全替代电脑显示器。

的确,Vision Pro头显可能比现有的主流VR头显分辨率更高、运动感应追踪更好,但这些提升还不够,在效率上还不能够很好的替代电脑多屏幕工作的场景。

Guttag还指出,实际上在过去30年前,索尼Glasstron等穿戴显示器/近眼显示器已经出现,但几乎很少有人在飞机、火车或办公室使用。那么为什么人们不去选择高分辨率的穿戴大屏方案,而是更倾向于分辨率更低、尺寸更小的手机呢?相信成本并不是最主要的原因,一定还有其他原因,比如效率。

关于注视点渲染

从WWDC 2023现场体验反馈来看,Vision Pro的眼球追踪相当灵敏、准确,效果超越市面上其他XR设备。然而Guttag指出,现有的眼球追踪并不能捕捉到人眼的每一次“微动作”,比如saccade/眼跳现象。更重要的是,即使眼球追踪系统能捕捉到注视点确切的位置,也很难了解人眼都看到了什么,也就是人眼捕捉到的“图像快照”。因此,基于眼球追踪的注视点渲染系统,并不能像现实场景那样呈现自然的变化。

长期来讲,用户可能会察觉出动态变焦、渲染中的不自然,从而引起头疼等风险。

关于安全性

相比于OST头显,VST头显始终具有VR头显的问题,比如对周边环境感知力差(即使在透视模式),不适合戴着自由行走。的确,VR的边界系统可一定程度上限制用户运动范围,并在靠近障碍物时发出提示,但这并不能有效的避免用户撞上障碍物。

最深色为视线遮挡部位

VR头显的根本问题,是遮挡了人眼的余光视觉(上下左右)。而人眼余光视觉恰恰是保护用户在环境中行走的关键工具(对运动和闪烁敏感),人眼向下看的能力更重要,因为通常地面上的危险比天上更多。

另外,Vision Pro虽然接近一体机设计,但依然像PC VR那样采用有线式供电。由于Vision Pro采用MegSafe磁吸式接口,连接线比较容易被拉掉。苹果并未透露Vision Pro是否内置小容量的缓冲电池,如果没有这种电池,意味着供电一断,用户眼前的透视画面可能会消失,而这在特殊情形下可能会引发进一步危险。

关于人体工学

Guttag认为,苹果在Vision Pro的物理设计方面,似乎更看重风格而非功能性,尤其是重量分布方面有待优化。

的确,Vision Pro大部分重量似乎都集中在面部,而为了缓解这一问题,苹果为其配备了柔软、贴合人脸的Light Seal面罩。尽管如此,部分体验者仅使用Vision Pro半小时,额头和鼻子就明显压红。

实际上,虽然苹果在佩戴舒适性上做出了优化,但由于头显本身材质(铝合金+玻璃)过重,长时间佩戴会有压脸现象。有体验者称,Vision Pro头显的重量目测至少450g,甚至超过500g。此外,外接线、电池的重量可能也分别在60g、200g左右。

后续,苹果的解决方案可能包括配备额外的头部顶戴,用于分担重量,或是进一步优化面罩。然而Guttag表示:从WWDC上的演示视频来看,Vision Pro的头部绑带的位置并不在设备重心,根据物理学原理,这种设计几乎无法减轻前部头显的重量。

一种可能的解决办法是像HoloLens 2、Quest Pro那样,将电池放在后脑勺位置作为配重。但考虑到Vision Pro头带采用柔性设计,并不能很好的平衡头显重量。当然,后续也可以支持官方或第三方头带,比如类似于Quest Elite Strap的硬性头带外设。

如果通过额外的绑带,将电池放在后脑勺部分,可能会为Vision Pro增加200g重量,那么该设备的整体重量将介于Quest Pro和HoloLens 2之间。

结论

Guttag指出,现阶段来看Vision Pro依然存在不少问题,做好VST透视非常困难,不得不在功能和外观之间做权衡。尤其是加入Eyesight屏幕,对摄像头位置选择的影响。

尽管Vision Pro的透视效果远超Quest Pro,但Guttag不认为它可以长期使用,一些基本的安全问题还有待解决。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/663318.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言结构体计算大小结构体的对齐数,修改默认对齐数。

结构体的对齐规则 第一个成员在与结构体变量偏移量为0的地址处。剩余成员变量要对齐到对齐数的整数倍的地址处。 对齐数:编译器默认对齐数与该成员大小的较小值vs中默认对齐数为8没有默认对齐数,那么对齐数就是其本身成员大小 结构体总大小为最大对齐数…

2个小工具让你轻松解决大数据/数据库测试

目录 前言: 研究背景 工具 支持功能 支持功能 使用方法 总结 前言: 做大数据/数据库测试时,通常需要编写复杂的测试用例代码或手动操作来测试系统的正确性和稳定性。但是,有些小工具可以轻松解决这个问题,提高测试效率…

python自动化测试- 自动化框架及工具

1 概述 手续的关于测试的方法论,都是建立在之前的文章里面提到的观点: 功能测试不建议做自动化接口测试性价比最高接口测试可以做自动化 后面所谈到的 测试自动化 也将围绕着 接口自动化 来介绍。 如果你想学习自动化测试,我这边给你推…

智慧绿色档案馆之八防一体化解决系统方案

主要涉及系统: 智慧档案馆温湿度监控系统 智慧档案馆净化系统 智慧档案馆防火监控系统 智慧档案馆防盗监控系统 智慧档案馆漏水监控系统 智慧档案馆空气质量监控系统 智慧档案馆自动化恒温恒净化系统 智慧档案馆大数据云平台建设系统 (一)技…

C语言实现青蛙跳台阶问题【图解】

目录 问题分析方法1:找规律问题分析方法2:递归两种方法的代码 题目 一只青蛙一次可以跳上1级台阶,也可以跳上2级台阶。求该青蛙跳上一个 n 级的台阶总共有多少种跳法? 问题分析方法1:找规律 当n1时,显然…

vue+Nodejs+Koa搭建前后端系统(六)-- 用户登录

前言 采用vue3,vue-router版本为4.x前端构建工具采用viteIDE采用VSCODE,安装了MYSQL客户端插件 前端编写 安装并使用 vue-router 如果有vue-router,就略过这一小节。 vue-router完整教程:点这里>> 第一步:n…

MySQL ⽀持哪些存储引擎?默认使⽤哪个?MyISAM 和 InnoDB 引擎有什么区别,如何选择?

💧 M y S Q L ⽀持哪些存储引擎?默认使⽤哪个? M y I S A M 和 I n n o D B 引擎有什么区别,如何选择? \color{#FF1493}{MySQL ⽀持哪些存储引擎?默认使⽤哪个?MyISAM 和 InnoDB 引擎有什么区别…

centos tomcat

利用samba共享将所用的的组件复制到/usr/java/中 并给/usr/java设置777权限 Samba配置如下 重启smb服务 进入目录开始安装jdk 在当前目录解压jdk 配置环境变量 使配置生效 查看jdk版本 创建tomcat目录 解压tomcat的安装包到当前目录 进入tomcat配置目录 启动tomcat 先关闭在启…

【微服务】微服务架构设计

文章目录 背景一、流量入口Nginx二、网关三、业务组件四、服务注册中心五、缓存和分布式锁六、数据持久层七、结构型数据存储八、消息中间件九、日志收集十、任务调度中心十一、分布式对象存储 背景 当前,微服务架构在很多公司都已经落地实施了,下面用一…

01_Linux系统安装及使用

一、安装虚拟机软件 VMware16pro 安装链接:https://note.youdao.com/ynoteshare/index.html?id5fc5ad640596a0fbb41a21413ada4dad&typenote&_time1687172973066 二、安装Ubuntu 64 位 Linux系统 安装链接:https://note.youdao.com/ynoteshar…

【动态规划】简单多状态dp问题(1)打家劫舍问题

打家劫舍问题 文章目录 【动态规划】简单多状态dp问题(1)打家劫舍问题1. 按摩师(打家劫舍Ⅰ)1.1 题目解析1.2 算法原理1.2.1 状态表示1.2.2 状态转移方程1.2.3 初始化1.2.4 填表顺序1.2.5 返回值 1.3 编写代码 2. 打家劫舍Ⅱ2.1 题…

seaborn笔记:heatmap

绘制热力图 1 基本使用方法 seaborn.heatmap(data, *, vminNone, vmaxNone, cmapNone, centerNone, robustFalse, annotNone, fmt.2g, annot_kwsNone, linewidths0, linecolorwhite, cbarTrue, cbar_kwsNone, cbar_axNone, squareFalse, xticklabelsauto, yticklabelsauto, m…

C++ 教程(16)——字符串

C 字符串 C 提供了以下两种类型的字符串表示形式: C 风格字符串C 引入的 string 类类型 C 风格字符串 C 风格的字符串起源于 C 语言,并在 C 中继续得到支持。字符串实际上是使用 null 字符 \0 终止的一维字符数组。因此,一个以 null 结尾…

Mysql的学习笔记

目录 1、rc 级别的 mvcc 和 rr 级别的mvcc 有啥区别? 2、Innodb与MyIsam的文件结构? 3、Innodb 与MyIsam的简单对比? 4、innodb,Alter table 改字段类型,底层会经历什么过程? 5、Alter table 改字段类型…

Zebec Protocol 与 PGP 深度合作,将流支付更广泛的应用薪资支付领域

随着传统机构的入局,以及相关加密合规法规的落地,加密支付正在成为一种备受欢迎的全新支付方式。加密支付基于区块链底层,不受地域、时间等的限制,能够实时到账,具备去中心化、非许可等特性。 流支付是一种具备创新性的…

Jmeter和Postman做接口测试的区别你知道吗

区别1:用例组织方式 不同的目录结构与组织方式代表不同工具的测试思想,学习一个测试工具应该首先了解其组织方式。 Jmeter的组织方式相对比较扁平,它首先没有WorkSpace(工作空间)的概念,直接是TestPlan(测…

搜索旋转排序数组(leetcode 33)

文章目录 1.问题描述2.难度等级3.热门指数4.解题思路思路复杂度分析 5.实现示例参考文献 1.问题描述 整数数组按升序排列,数组中的值互不相同 。 假设数组在预先未知的某个点上进行了旋转。 如数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2]。 搜索一个给定的目…

如何安装Nginx服务

目录 一、Nginx服务 Nginx的并发能力受影响因素 二、Nginx与Apache的差异 Nginx相对于Apache的优点 Apache相对于Nginx的优点 三、阻塞/非阻塞 四、同步/异步 Nginx应用场景 五、编译安装Nginx服务 关闭防火墙和安全机制 安装依赖环境 将相关包导入/opt当中 进入指…

Linux分区的基本概念。

文章目录 前言 一、分区概念 1,书名,主引导纪录(MBR) 2,正文,就是硬盘中纪录的数据。 3,索引相当于硬盘中的分区表 3.1主分区(存放地址&#xff0…

React、Vue项目build打包编译后如何再修改后台请求地址

vue项目大家都了解,开发用 npm run dev/npm run serve。而要上线则必须是先将项目打包编译 npm run build 之后成为了普通的静态网页才可上线进行部署及发布。同样这时候我们也已经将代码全部写好了。如果说要改里面的某个值或者修改请求地址我们应该怎么办呢&#…