VST的天花板?苹果Vision Pro解析

news2024/11/24 18:29:28

看了那么多预测、分析之后,苹果MR头显(Apple Vision Pro)真正的来了。

十多年前,Oculus Rift DK1开启了近代新一轮VR热潮。十年之后,发展未及预期,VR仍未走向大众。如今整个AR/VR行业都在期待,期待拥有极强号召力的巨头入场;期待一个拥有更佳产品体验、更强产品定义能力的XR设备;期待能够打破当前困境,让XR走向大众的转折点;甚至期待着下一代计算终端、空间计算时代的到来。

在此之前,苹果MR就已经被大家予以这样的超高预期。那么苹果能否引领XR成为下一个十年中消费电子的新趋势?相信也是大家最想在WWDC23得到的答案。

苹果MR头显:Apple Vision Pro正式发布,让我们一起来看看它拥有哪些不一样的玩法,有哪些主推场景和应用?

1,苹果Vision Pro

  • 第一感觉:Vision Pro和之前彭博、The-information的爆料大体一致;
  • 第二感觉:展示了太多2D与大屏的场景(或者说2D应用的三维化改造),沉浸式内容比较少,游戏更是没有;
  • 第三感觉:还是那个苹果,有不少优点。也体现了苹果很多执着的地方,不免带来的槽点。

当然,苹果还是苹果,很多细节的确到位,一个3D版Siri图标看起来如此精致。演示场景甚至不会刻意隐藏那根电源线,即便这根线缆是最大槽点。

综合来看,Vision Pro还是硬生生的堆砌硬件的产品,把这样一款产品打造的(相对)尽可能轻便(重量未知)、优雅(有线缆,也不优雅)、和美观(虽然往时尚感靠,但感觉也很丑啊)。

因为要点太多,接下来就尽可能针对每一点进行讲解。

1,ID设计和佩戴

非常苹果范儿,3D玻璃、铝合金机身、3D编织头戴,至少看起来是与众不同的。

3D玻璃的确很亮眼,结合铝合金机身看起来很精致。发布之前就有爆料称,苹果坚持弧形玻璃设计,就是为了美观性。当然,也会影响良品率、摄像头透视畸变等。

综合整体的外观来看,还是一个更圆润的VR头显,这一点大家需要做好心理预期。

由上图可以看出,整个苹果Vision Pro采用几大块:头戴、面罩、主机。

主机部分两侧也可以拆下来,两个硬质支撑包含了扬声器,像是硬壳版的Apple Watch表带。

面罩部分,采用编织材料设计,里面内置金属转轴,如上图。这个转轴的可以进行多方位调节:1,深度调节;2,俯仰调节。

  • 深度调节:可以同时调整面罩宽度,可以理解为弧度大小;
  • 俯仰调节:是上下方向贴合面部的角度,这两者共同决定面部贴合程度和舒适性。

头戴设计确实有点奇葩,因为苹果Vision Pro整体重量集中在前端,虽然拿掉电池,但是因为没有额头支撑,所以也是压面式设计。因此后端这个3D编织的头戴就很重要,首先是采用3D弧形设计,柔软也很轻,也方便后续清洗。

甚至你注意到发布会有个场景是躺在床上使用,虽然有点扯淡,但是柔性头戴舒适性起码得到保障,一众的后置电池方案产品完全没法做到。

补充一点,在一个镜头中出现了“顶部绑带”,苹果居然允许这么做。。。。。。。。。。。

头戴右侧还有一个大号旋钮,可以调节头戴松紧度。

头戴左侧是连接电池的卡扣,这个卡扣安装时有一个旋转角度。

2,硬件规格

堆料还是看苹果,M2+R1芯片就是最大门槛,算力决定着应用场景。

M2芯片性能毋庸置疑,提供很好的算力支持,即便是4K分辨率。而R1芯片就是专为MR头显降低延迟而开发,它的功能是:实时处理12颗摄像头、5个传感器和6颗麦克风的输入,尽可能减小延迟,这一点对VST透视的VR头显来说至关重要。

苹果表示,得益于R1芯片的加持,整体的渲染到显示时间为12ms(这个延迟的定义后续可以再仔细聊聊)。

显示系统方面,苹果Vision Pro采用了两块定制Micro OLED显示屏,单眼像素数量1150万像素(如果是1:1,那大概接近3.4K×3.4K)。PS:苹果宣称单眼拥有比4K电视更多的像素,因为4K电视是4K×2K分辨率。

显示素质完全不用担心。另外要考虑的一点是亮度,这一点恐怕不上手不能确定。此前传闻苹果MR屏幕的峰值亮度5000nit,但考虑到OLED+Pancake综合光效,实际入眼理论625nit(峰值亮度),日常足够使用,当然其它Pancake机型也不高。

三片式Pancake透镜,应该是为了更好的像质。同时不支持屈光度调节,提供蔡司镜片定制服务(磁吸镜框),也无法佩戴自己的眼镜使用,近视用户一样也得单独配镜片。

传感器阵容也是相当庞大:

  • 12颗摄像头:2组RGB主相机、4组下视角相机(2组近乎垂直向下,两组斜向下)、2组外侧视角相机、4组眼球追踪红外相机(头显内侧);
  • 5个传感器:1个LiDAR、2颗深度相机、2组未知传感器(位于外壳上方中间区域)。

Vision Pro还有头显外侧底部还有2组红外光传感器,用途在弱光环境下提高手势追踪准确性。

另外,反向透视系统(EyeSight)用于展示面部表情,这个外侧屏幕看上去分辨率并不高,但是也足够基本的信息传递。

3,交互

苹果Vision Pro上来就直接明确:眼球追踪、手势追踪、语音控制就是三维界面最直观、最自然的交互方式。

眼球追踪:Vision Pro的UI采用圆形图标,眼球注视区域主体会被放大(如上图),这一点设计会让眼球交互非常直观。

手势追踪:从视频里看有个非常牛逼的点,但具体怎么样试了才知道。

  • 1,识别范围广,因为向下相机的加入,手不用抬起来就能识别(Quest你懂?),即便在下方位置也能识别,如上图。
  • 2,微手势,视频里展示了很多动作不大的手势动作(只是动动手指),不确定是否为了视频演示而特意渲染的镜头。
  • 3,支持双手捏合缩放,有点回到iPhone多点触控的意思。

语音交互:三维空间里的Siri,虽然不如第三方智能,但语音识别基础问题不大,基于本机的智能交互也能完成的很好。

当然,交互是搭配起来的,比如你想选择一个图标,只需要注视它,然后手指轻击即可选择。这一点和此前Quest和其它VR中的手势操作逻辑不同,它充分结合了眼球、手势和语音的逻辑。

4,应用场景

应用场景方面,主视频中更多以现有2D界面平铺至三维空间,讲了很多“大屏模式”,当然也有一些不错的3D场景;里面提到的办公、差旅,甚至家庭记录等看上去都非常尬。(的确就是之前说的曝光的那样,Vision Pro似乎没有主要卖点,一个筐里啥都有)。

苹果官方介绍了的几个场景:无限大屏模式、影音娱乐体验、沉浸式模式(切换虚拟程度,冥想等)、3D照片和视频、3D版FaceTime。

无限大屏模式:

说白了就是三维空间,可以放置无限大屏。也支持无线连接Mac电脑,进行扩展显示。苹果表示,即便是用来办公也没问题,因为文字内容可以清晰阅读。同时,还可以兼容Magic Keyboard和Magic Trackpad等键鼠方便处理文字和邮件等。

比如,可以在“空间环境”放很多Safari浏览器,以及日历等App,都可以平铺或环绕的模式来显示出来,一览无余。

另外,专为Vision Pro准备的App Store也将一同上线。

影音娱乐体验:

超高分辨率大屏结合空间音频系统,可以带来超沉浸的电影、电视节目(2D)等,集成Apple TV+和其他App的电影和电视节目。

对于3D内容,苹果沉浸式影音库提供自制180度版本视频,但这个影音库目前还未公布详细信息。

另外,还支持100多款Arcade游戏(iPad适配版),感觉和很多BB逻辑类似,只不过它可以直接运行在设备之上,连接一个手柄即可。

沉浸式模式:

苹果Vision Pro一个重点是,通过一个“数码旋钮”即可调节虚拟和现实的混合比例,如果你想静下心来可以完全沉浸到一个美丽大自然风景中等等。

另外,官方介绍了一个冥想应用,这个之前在VR中已经证明的确潜力很大。

3D照片和3D视频:

得益于3D传感器的加入,苹果Vision Pro支持拍摄3D照片、录制3D视频(会充分融合深度信息),并且融合空间音频,这个确实是之前没有想到的。

虚拟会议:

这里面有一个非常重要的就是虚拟化身,虚拟化身创建是通过手持Vision Pro通过外侧LiDAR和TrueDepth 3D相机给自己面部捕捉,从而生成逼真化身。

这个化身可以用于3D FaceTime,也可以用于外侧屏幕展示Avatar的眼睛动作和表情等。

5,visionOS

苹果表示,visionOS是苹果第一个空间计算操作系统,建立在macOS、iOS和iPadOS的基础上。

分别内嵌了iOS框架、空间计算框架、空间音频引擎、3D空间引擎、注视点渲染引擎、实时驱动的子系统等。

早期第三方App:医疗应用,展示心脏3D模型;JipSpace(3D模型和场景展示);MR交互DJ音乐应用;Sky Guide(星座应用);生产力:微软系应用(Word、Excel、Teams等)。

兼容iPhone和iPad应用:数十万款。反正就是2D模式的大屏效果,也是一个补充,但我们更希望看到更多3D App。

综合来看,苹果Vision Pro并未如预期那么激进,和之前爆料信息(多次推迟发布)大体相同,这款产品更像是几年前就该拿出来的、一款不断推迟的产品。而之所以放到现在发布,也是不想再延期,先从内容层面上做布局和积累,毕竟感知和交互的部分会延续,内容上也不受影响。

苹果在本次展示中还有更多值得挖掘的地方,甚至VR/MR原生游戏几乎没有提,这一点应该也会放到之后公布吧。今天就到这里,有关苹果MR的更多信息,可关注青亭网后续报道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/614803.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文带你了解11个Linux最常用命令

文章目录 1. 前言2. 文件与目录的查看:ls3. 显示当前路径:pwd4. 创建目录:mkdir5. 切换目录:cd6. 创建文件:touch7. 查看指定文件:cat8. 向终端输出:echo9. 树形结构显示目录: tree10. 删除文件或目录: rm11.复制文件或目录: cp12.文本编辑器: vim13. 总结 1. 前言 Linux的命令…

强大交互功能,真实产品体验一步到位!

动态交互效果是原型项目的灵魂,也是原型与设计产出物的关键区别。一个好的交互设置不仅能准确地传达静态界面难以表达的逻辑、流程和细节体验,还能呈现出丰富精彩的视觉效果,提高项目的质量。对于产品经理来说,学会交互设计是必不…

教你一招,能解决90%的机房问题

近年来,随着科技的发展,蓄电池的使用十分普遍,而蓄电池的广泛应用,也出现了一系列的问题,如不及时处理,可能给系统造成更严重的损失。 为什么需要电池监控? 01.人工值班巡检已经不能满足机房电…

人工智能(pytorch)搭建模型8-利用pytorch搭建一个BiLSTM+CRF模型,实现简单的命名实体识别

大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型8-利用pytorch搭建一个BiLSTMCRF模型,实现简单的命名实体识别,BiLSTMCRF 模型是一种常用的序列标注算法,可用于词性标注、分词、命名实体识别等任务。本…

chatgpt赋能python:Python如何到下一行

Python如何到下一行 Python是一种高级编程语言,因其简单易学、可读性高、广泛的应用领域与强大的工具库而迅速成为了广泛使用的语言之一。在Python编程中,换行操作是经常使用的操作。本文将介绍Python中的换行操作以及如何在代码中使用它。 换行符 换…

百度APP iOS端包体积50M优化实践(三) 资源优化

01 前言 百度APP iOS端包体积优化系列文章的前两篇重点介绍了包体积优化整体方案、各项优化收益和图片优化方案,图片优化是从无用图片、Asset Catalog和HEIC格式三个角度做深度优化。本文重点介绍资源优化,在百度APP实践中,资源优化包括大资…

存储过程和函数的区别

目录 零、基本格式 一、返回值 二、参数传递 1、存储过程 2、函数 三、执行方式 四、事务处理 1、存储过程 2、函数 五、数据库兼容性 课上老师提出的讨论题:存储过程和函数的区别? 有同学回复:在数据库后端编程中,存储…

Python数据攻略-Pandas的数据创建与基础特性

大家好,我是Mr数据杨!今天将进入Python的Pandas数据世界,就像三国演义中的英雄们,用聪明才智塑造自己的命运。 记得三国中,周瑜曾利用兵法巧妙策划火烧赤壁,击败曹军。这就像创建一个Pandas DataFrame&…

布局量子计算工业应用!D-Wave正在“偷偷”干大事

​ (图片来源:网络) D-Wave 致力于让用户从量子计算中即时受益,而不必等到长远的未来。几十年来,这家加拿大公司一直努力将设备商业化,多家企业客户都在使用其量子计算来优化业务运营。例如,Pay…

Spark RDD容错机制

文章目录 一、RDD容错机制(一)血统方式(二)设置检查点方式 二、RDD检查点(一)RDD检查点机制(二)与RDD持久化的区别(三)RDD检查点案例演示 三、共享变量&#…

mysql数据库出现Too many connections以及磁盘满了的查看方式

Too many connections问题 这问题是数据库连接数太多了导致的, 两个排查方向 1、当用户数量大的时候 先查看最大连接数show variables like ‘%max_connections%’; 这里的最大连接数就是2000,够用了,一般500-1000就够了,内存多…

【干货分享】3D模型可视化、格式转换引擎和Parasolid如何集成?

​今天分享一个示例项目,该示例项目使用HOOPS链轮将HOOPS Exchange和Siemens Parasolid实施到HOOPS Visualize中。 HOOPS中文网http://techsoft3d.evget.com/↓ 点击下方视频查看详情 ↓ HOOPS Visualize - Exchange和Parasolid集成视频 正如您在上面的视频中看到…

小白必看:零基础入门网络安全

1、什么是网络安全? 官方的回答:指网络系统的硬件、软件及其系统中的数据受到保护,不因偶然的或者恶意的原因而遭受到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。 具有保密性、完整性、可用性、可控性…

chatgpt赋能python:Python如何分成两栏写入Word文档

Python如何分成两栏写入Word文档 在进行文本排版时,有些时候我们需要将文字分成两栏来排版,这样可以让文章更加美观,易读。 本文将介绍一种使用Python将文本分成两栏写入Word文档的方法。在介绍具体实现方法之前,我们先来了解一…

【SLAM】ROS平台下三种自主探索算法总结

目录 前言 一、frontier_exploration 二、explorate_lite 三、rrt_exploration 总结 前言 探索是指当机器人处于一个完全未知或部分已知环境中,通过一定的方法,在合理的时间内,尽可能多的获得周围环境的完整信息和自身的精确定位&#…

自动化测试支持

自动化测试支持 自动化测试是现代软件开发中不可或缺的一环。它可以帮助开发团队快速、精确地检测软件中的缺陷,提高软件质量和开发效率。 自动化测试可以在代码变更频繁、测试用例数庞大时,显著地减少测试时间和工作量。相对于手动测试,自动…

集权设施攻防兵法:实战攻防之堡垒机篇

一、黑客视角下的堡垒机 堡垒机是一种网络安全设备,用于保护和管理企业内部网络与外部网络之间的访问。它作为一种中间节点,提供安全的访问控制和审计功能,用于保护内部网络免受未经授权的访问和攻击。堡垒机通常被用作跳板服务器&#xff0…

计算机网络实验:RIP路由协议配置

目录 前言实验目的实验内容相关知识点实验设备实验过程总结 前言 计算机网络是指由多台计算机通过通信设备和通信线路互联起来,实现信息交换的系统。计算机网络中的路由器是一种专用的网络设备,它负责根据目的地址选择最佳的传输路径,将数据…

容器(第二篇)docker网络

Docker 网络实现原理: Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为Container-IP,同时Docker网桥是每个容器的默认网关。因为…

6月6日汇报

1. 张量CP分解 三阶张量的CP分解是将其分解为三个矩阵。例如:一个三阶张量 ,则CP分解可以写为 其中, 表示向量外积, 。下图为三阶张量的CP分解: 将上面的CP分解展开,也可以写为: 假设有一个三维…