苹果头显设备Vision Pro突出2项技术,即“空间计算”和手部、眼部跟踪。“空间计算”使设备能够学习并与物理环境进行交互;手部和眼部跟踪功能通过从设备侧面、前置和底部安装的摄像头收集手部和眼球的感应数据,使用户能够操作虚拟环境并与之交互。目前来看,苹果头显产品没有进一步推动XR市场,但不可否认的是其产品的先进性。下面全面对比现有的XR终端和芯片,并说明生成式AI对XR行业的影响。
微软在大模型方面具有优势,XR终端和芯片供应商屈指可数
微软是较早进入头显市场的厂商之一,2015年便推出头显产品HoloLens。微软还与OpenAI建立了独家合作伙伴关系,使其可将OpenAI公司的GPT-4大模型引入生产力相关的软件和云服务,例如微软于2022年在GitHub开发了Copilot,2023在操作系统和办公软件中融入了Copilot,而背后是GPT大模型提供支持。
苹果正在开发自己的大模型,使用2000亿参数训练。作为对比,OpenAI的GPT 3.5大模型有175亿参数,GPT-4大模型超过1万亿个参数。谷歌的大模型Switch和PaLM2分别为1.6万亿和3.4千亿参数。NVIDIA和百度的LLM也具有更大参数,分别为5.3千亿参数和2.6千亿参数。与竞争对手相比,苹果的大模型规模相形见绌。
过去2年,大模型越来越大推动计算能力需求增长,预计微软将GPT-4与其产品、服务融合,具有更强的产品竞争力。大模型还将持续迭代,比如OpenAI已经在开发其GPT-5模型,而谷歌发布了新的Gemini大模型。
图注:主流大模型LLM对比
1. 终端产品
苹果在2023年拥有20亿设备总安装量,活跃iPhone用户群达到1.46亿,Vision Pro可以利用苹果的庞大客户群。苹果另一个优势是其生态系统,使得苹果手机、PC、穿戴设备产品之间无缝连接,并允许用户访问许多苹果的应用程序。
在定价能力上,对包括苹果在内的主流头显公司(Meta、索尼、PICO和微软)的计算平均价格,苹果头显的价格明显高于平均水平(1,710美元),鉴于其品牌价值,其产品溢价不足为奇。
从功能和硬件规格来看,苹果Vision Pro的优势之一是显示质量,像素为2300万像素,领先于其竞争对手,Vision Pro采用的Micro-OLED屏幕提供比大多数VR中的液晶显示器更高的分辨率和更清晰的对比度。
图注:各品牌XR头显的功能和硬件对比然而,Vision Pro在刷新率方面存在不足,最高刷新率为100Hz,而除PICO外的大多数竞争对手支持120Hz。此外,Vision Pro电池寿命与Meta和PICO并列,但落后于索尼和微软。Vision Pro配备了更多摄像头和传感器,包括12个摄像头、6个麦克风和5个传感器,用于高级跟踪和交互,以及更宽的视野。不过,Vision Pro比其竞争对手略重。
2. 芯片
对比XR设备使用的芯片,苹果是唯一一家使用自己的芯片(M2和R2)的公司,而Meta、PICO和微软则使用高通的Snapdragon芯片(XR2和850)。索尼的PS VR头显是唯一一款采用定制联发科芯片的设备。
图注:各品牌XR头显使用的芯片由于联发科定制芯片没有公开披露性能,下面进一步对比骁龙和M2芯片。
高通的骁龙XR2芯片是专门为XR头显应用设计的,被多个头显设备采用。苹果M2采用5nm光刻技术,具有20MB缓存和10核GPU,主频为1398MHz,在图形处理能力方面超过高通骁龙XR2 5G和骁龙850,拥有3578 GFLOPS、GPU FP32浮点运算能力。M2在Geekbench基准测试上也表现出色,在平均单核(4223)和多核(18170)性能方面均有较好的测试结果。
图注:苹果M2芯片和高通骁龙XR2、骁龙850芯片性能对比
生成式AI对XR的赋能
生成式AI在XR头显中的应用主要聚焦在3D内容创作和虚拟体验优化。下一代AI渲染工具将赋能内容创作者使用如文本、语音、图像或视频等各种类型的提示,生成3D物体和场景,并最终创造出完整的虚拟世界。此外,内容创作者将能够利用文本生成文本的大语言模型,为能够发出声音并表达情绪的“虚拟化身”生成类人对话。
这些功能有助于生成逼真的视觉效果,增强 XR头显呈现的真实感和沉浸感。此外,生成式AI算法可以不断从用户交互和反馈中学习,以随着时间的推移改进内容生成、个性化和适应,这种自适应学习过程确保了XR体验不断发展,并变得更加适合个人用户的偏好和行为。
图注:生成式AI在XR头显的应用包括对话式AI、AI渲染(图源:高通)
XR头显的市场前景
根据KHAVEEN的数据,XR市场目前由Meta引领,在2023年第三季度的市场份额最高,为49%,其次是索尼推出的PlayStation VR2,微软包含在“其他”里面。
图注:全球XR头显按品牌划分的出货量对比(图源:KHAVEEN)
另外,根据IDC、Counterpoint Research、Mordor Intelligence、Frost & Sullivan和Precedence Research的数据,平均预测XR市场复合年增长率为42.24%。
图注:各市场研究机构对XR市场的预测XR市场的消费者驱动力包括娱乐,如(游戏、电影和电视节目)、虚拟购物、虚拟旅行和虚拟体育;企业级应用的驱动力来源于制造(工业设计和建模、远程工厂监控)、医疗保健(VR医疗、低强度医疗手术)和零售(增强的员工培训)。
小 结
AR/VR的企业级和消费电子应用并不是新兴事物,但直到现在,包括生成式AI、计算机视觉等人工智能技术的进步,才允许轻量级XR终端设备提供逼真的沉浸感、自然的交互性等使用体验。尽管XR头显的用户群体目前仍然不大,但是随着AI技术在XR头显终端的应用持续深化,或将成为改变行业现状的关键。