上周苹果正式发布Vision Pro,尽管要到明年才发售,但光学领域的专业博主Karl Guttag也发表了自己的看法。他提到:目前受邀体验的媒体中要不是苹果粉丝、要不就是对AR、VR了解比较少,没有我看到“批判性思维”或太多对技术分析的内容。虽然大多数人重点提到显示效果、Persona等,但没有提到VAC等VR中长期存在一些问题。当然,也考虑到现场体验的时间比较短(只有半小时)等因素在内。
Karl Guttag近日也发表对Vision Pro的看法,由于他此前对VST头显持怀疑态度,认为通过视频透视不能解决OST(光学透视)AR面临的瓶颈(视场角、清晰度等等),因此我们也很好奇Vision Pro能否改变他的看法。
在本文中,Guttag从光学技术、人体工学、交互、计算等九个方面,重点对Vision Pro与Meta VST头显Quest Pro进行对比,以深度剖析苹果在XR设计决策上的优缺点。
Vision Pro比Quest Pro做对了哪些?
1)价格
Quest Pro发布时价格为1500美元,后来降价至1099、后降为999美元。Vision Pro售价(3499美元)是Quest Pro的3倍多,是Quest 2(299美元起)的10多倍。
外界一度认为定价过高,仿佛没有参考市面上AR/VR头显的平均价格水平。而Guttag则认为,批评Vision Pro定价高的评论,并没有抓住要点,因为价格只是暂时的,后续还可以随着出货量增加而降价。
现阶段,AR/VR头显昂贵是因为采用了新的技术。相比之下,手机、笔记本电脑等设备早期也是贵的,随着技术和市场成熟才逐渐降价,因此和现阶段AR/VR价格没有可比性。
换句话说,价格并不是决定Vision Pro成功的最大因素,而是用户使用率。此外,当在任何价位都能打造出用途广泛的VST,才能说明这项技术的可行性,这也是苹果和Meta需要达成的目标。Guttag表示:Quest Pro更像是Quest 2.5,因为它的一些设计并不成熟。尽管从已经公开的信息来看,Vision Pro还不能证明VST透视的前景,但至少从完成度上来看,比Quest Pro更成功。
2)VST透视
Guttag认为,Quest Pro上的VST透视更像是半成品,方案是两个灰度相机+一个高分辨率RGB相机贴图,导致整体分辨率低,且存在明显畸变。
而Vision Pro则配备两个高分辨率透视相机,还有深度摄像头、自研双芯片,尽管可能没有完美解决VST透视问题,但从其他人的体验反馈来看,透视体验比Quest Pro更好,几乎没那么多明显问题。
Quest Pro透视
3)商业应用(包括文字阅读能力)
假设,Vision Pro与Quest Pro的FOV大致相同。而分辨率方面,Quest Pro单目分辨率为单眼近2K,PPD为20,Guttag认为Vision Pro PPD约40(但我们计算,Vision Pro单目分辨率近3.4K,估算PPD近34)。
PPD大小决定了给定区域内文字的可读性,PPD越低,文字就需要越大,在阅读相同数量文字时,人眼转动的跨度越远,从而减慢阅读速度。
在需要处理大量文字的办公场景中,20PPD具有较大局限性,而40PPD仅达到最低必要条件条件。此外,目前没有任何研究显示人们能够适应长时间(几周或一个月)佩戴头显且摘下后回到自然视角观看不受影响。
4)显示对比度
与LCD相比,Micro OLED最大区别是自发光特性,可通过关闭独立的像素来显示纯黑色。在Vision Pro中,苹果不仅采用了Micro OLED屏幕,还配备了微透镜阵列来提高光效。
Vision Pro采用索尼Micro OLED面板
为了优化黑色显示效果、提高对比度,Quest Pro采用Mini LED背光的LCD屏幕,特点是支持局部调光,显示比较接近纯黑色。不过,Mini LED背光和OLED自发光的对比依然存在差距,尽管亮度更高,但透过LCD面板时损失94%-97%的光。
除此之外,Quest Pro局部调光功能有一定局限,比如背光扫描会造成延迟,显示星空等高对比度图像时,存在像素拉伸现象,后续可能通过叠加优化层增强局部调光效果。
5)光学透镜
据了解,Quest Pro采用了Pancake透镜,而Guttag认为Vision Pro采用的是3P非球面折射光学模组,原因是宣传视频中没有看到偏光片或半反膜。
Guttag指出,Pancake透镜与Micro OLED结合的方案光学效率很低,光线通过偏振、反射等过程,损失大约89%。而Quest Pro采用LCD+Pancake方案,LCD输出偏振光,光损更少,但在透过半反射镜时仍然有损失。
6)手势追踪
手势操作是HoloLens头显的主要操作方式之一,但实际体验并不理想,即使不考虑灵敏度、延迟、准确性等方面,长时间举手输入也并不舒适。相比之下,苹果将追踪摄像头放置在头显底部,追踪角度向下,可识别腰部以上的手势动作,很好的解决了手势识别的人体工学问题。
据悉,Vision Pro共搭载12颗摄像头/传感器,其中包含多组摄像头用于手势追踪和SLAM。几乎所有体验者都表示,该头显的手势追踪相当准确,可能比Quest Pro好很多。
7)眼球追踪
据WWDC体验者称,Vision Pro的眼球追踪效果自然准确,而这可能得益于更好的算法。此外在硬件方面,Vision Pro将IR相机和LED放在更靠近人眼的位置,可以直接捕捉眼球动作,而不是像Quest Pro的设计,眼球追踪模组在透镜外部。
8)处理性能
Vision Pro搭载了PC级别的SoC:M2,加上定制的R1视觉处理器,整体非常强悍。而Quest Pro使用的是高通骁龙XR2+,算力相当于高端智能手机。毫无疑问,苹果在硬件算力上就超过了包括Meta在内的任何其他XR公司。
9)功耗和续航
Guttag指出,此前Kosutami曾曝光一块由中国德赛代工的Vision Pro电池,当时很多人以为该头显只用了一块电池,实际上这是一个双电池组,通过折叠的方式做成了一个外接电池模块。也就是说,Vision Pro电池容量为9578mAh/36.3瓦时。实际上,一块常规的37Wh外接电池,也是差不多的大小。
考虑到Vision Pro续航为2小时,其耗电量估算在18.5W水平。而由于Vision Pro采用更高效的光学显示设计,Guttag目测每块Micro LED屏幕的功率或低于1-2W(不显示纯白色画面会省电)。这也意味着,Vision Pro大部分功耗可能来自M2和R1处理器、数据传输、相机和红外传感器。
Quest Pro和Vision Pro均搭载双风扇系统
作为对比,Quest Pro电池容量为20.58Wh,续航在2-3小时之间,预计功耗在7-10W左右。Guttag猜测,Quest Pro的耗电可能主要来自低效的光学架构。
Quest Pro电池拆解
尽管Vision Pro功耗可能是Quest Pro的两倍左右,但平均每像素的功耗却比后者少三分之一。毕竟Vision Pro像素数量是Quest Pro的约3.3倍,而且搭载更高分辨率的摄像头阵列,支持更高分辨率VST透视,因此需要更大量和复杂的计算,功耗高是合理的。
总结
相比于Quest Pro,Vision Pro才更像是旗舰产品,尽管价格是Quest Pro的3.5倍,但从长远来看,价格并非最重要的问题。对于VST头显技术来讲,未来成功的关键在于,能否证明在任何价位都能实现且适用于庞大的用户群。
换句话说,如果Meta和苹果能够用VST解决XR中的难题,那么价格就不是主要的限制。正如苹果在WWDC 2023中宣传的那样,Vision Pro具备电视、电脑、相机、环绕音频系统等多个设备的功能,同时价格比这些设备加起来更便宜。因此,只有当这些场景能理想的实现,才能证明苹果XR的价值。
Guttag认为,Vision Pro可以在视障辅助等垂直场景展现价值,但苹果所描绘的多功能场景,现阶段很难实现,还有许多问题待解决。其中最重要的问题,是人的视觉系统复杂多变,现有的AR/VR光学显示技术还无法突破物理局限,即使投入大量人才、时间和资金,也很难找到解决办法。而Vision Pro展现的技术没有太新的东西,此前这些技术成功,不只是因为硬件不够成熟,而是在设计上做错了选择。
参考:KG