智能硬件 | XR头显市场只有少数玩家,AI是扭转局面的关键?

news2024/11/18 17:44:34

苹果头显设备Vision Pro突出2项技术,即“空间计算”和手部、眼部跟踪。“空间计算”使设备能够学习并与物理环境进行交互;手部和眼部跟踪功能通过从设备侧面、前置和底部安装的摄像头收集手部和眼球的感应数据,使用户能够操作虚拟环境并与之交互。目前来看,苹果头显产品没有进一步推动XR市场,但不可否认的是其产品的先进性。下面全面对比现有的XR终端和芯片,并说明生成式AI对XR行业的影响。

微软在大模型方面具有优势,XR终端和芯片供应商屈指可数

微软是较早进入头显市场的厂商之一,2015年便推出头显产品HoloLens。微软还与OpenAI建立了独家合作伙伴关系,使其可将OpenAI公司的GPT-4大模型引入生产力相关的软件和云服务,例如微软于2022年在GitHub开发了Copilot,2023在操作系统和办公软件中融入了Copilot,而背后是GPT大模型提供支持。

苹果正在开发自己的大模型,使用2000亿参数训练。作为对比,OpenAI的GPT 3.5大模型有175亿参数,GPT-4大模型超过1万亿个参数。谷歌的大模型Switch和PaLM2分别为1.6万亿和3.4千亿参数。NVIDIA和百度的LLM也具有更大参数,分别为5.3千亿参数和2.6千亿参数。与竞争对手相比,苹果的大模型规模相形见绌。

过去2年,大模型越来越大推动计算能力需求增长,预计微软将GPT-4与其产品、服务融合,具有更强的产品竞争力。大模型还将持续迭代,比如OpenAI已经在开发其GPT-5模型,而谷歌发布了新的Gemini大模型。

图注:主流大模型LLM对比

1. 终端产品

苹果在2023年拥有20亿设备总安装量,活跃iPhone用户群达到1.46亿,Vision Pro可以利用苹果的庞大客户群。苹果另一个优势是其生态系统,使得苹果手机、PC、穿戴设备产品之间无缝连接,并允许用户访问许多苹果的应用程序。

在定价能力上,对包括苹果在内的主流头显公司(Meta、索尼、PICO和微软)的计算平均价格,苹果头显的价格明显高于平均水平(1,710美元),鉴于其品牌价值,其产品溢价不足为奇。

从功能和硬件规格来看,苹果Vision Pro的优势之一是显示质量,像素为2300万像素,领先于其竞争对手,Vision Pro采用的Micro-OLED屏幕提供比大多数VR中的液晶显示器更高的分辨率和更清晰的对比度。

图注:各品牌XR头显的功能和硬件对比然而,Vision Pro在刷新率方面存在不足,最高刷新率为100Hz,而除PICO外的大多数竞争对手支持120Hz。此外,Vision Pro电池寿命与Meta和PICO并列,但落后于索尼和微软。Vision Pro配备了更多摄像头和传感器,包括12个摄像头、6个麦克风和5个传感器,用于高级跟踪和交互,以及更宽的视野。不过,Vision Pro比其竞争对手略重。

2. 芯片

对比XR设备使用的芯片,苹果是唯一一家使用自己的芯片(M2和R2)的公司,而Meta、PICO和微软则使用高通的Snapdragon芯片(XR2和850)。索尼的PS VR头显是唯一一款采用定制联发科芯片的设备。

图注:各品牌XR头显使用的芯片由于联发科定制芯片没有公开披露性能,下面进一步对比骁龙和M2芯片。

高通的骁龙XR2芯片是专门为XR头显应用设计的,被多个头显设备采用。苹果M2采用5nm光刻技术,具有20MB缓存和10核GPU,主频为1398MHz,在图形处理能力方面超过高通骁龙XR2 5G和骁龙850,拥有3578 GFLOPS、GPU FP32浮点运算能力。M2在Geekbench基准测试上也表现出色,在平均单核(4223)和多核(18170)性能方面均有较好的测试结果。

图注:苹果M2芯片和高通骁龙XR2、骁龙850芯片性能对比

生成式AI对XR的赋能

生成式AI在XR头显中的应用主要聚焦在3D内容创作和虚拟体验优化。下一代AI渲染工具将赋能内容创作者使用如文本、语音、图像或视频等各种类型的提示,生成3D物体和场景,并最终创造出完整的虚拟世界。此外,内容创作者将能够利用文本生成文本的大语言模型,为能够发出声音并表达情绪的“虚拟化身”生成类人对话。

这些功能有助于生成逼真的视觉效果,增强 XR头显呈现的真实感和沉浸感。此外,生成式AI算法可以不断从用户交互和反馈中学习,以随着时间的推移改进内容生成、个性化和适应,这种自适应学习过程确保了XR体验不断发展,并变得更加适合个人用户的偏好和行为。

图注:生成式AI在XR头显的应用包括对话式AI、AI渲染(图源:高通)

XR头显的市场前景

根据KHAVEEN的数据,XR市场目前由Meta引领,在2023年第三季度的市场份额最高,为49%,其次是索尼推出的PlayStation VR2,微软包含在“其他”里面。

图注:全球XR头显按品牌划分的出货量对比(图源:KHAVEEN)

另外,根据IDC、Counterpoint Research、Mordor Intelligence、Frost & Sullivan和Precedence Research的数据,平均预测XR市场复合年增长率为42.24%。

图注:各市场研究机构对XR市场的预测XR市场的消费者驱动力包括娱乐,如(游戏、电影和电视节目)、虚拟购物、虚拟旅行和虚拟体育;企业级应用的驱动力来源于制造(工业设计和建模、远程工厂监控)、医疗保健(VR医疗、低强度医疗手术)和零售(增强的员工培训)。

小 结

AR/VR的企业级和消费电子应用并不是新兴事物,但直到现在,包括生成式AI、计算机视觉等人工智能技术的进步,才允许轻量级XR终端设备提供逼真的沉浸感、自然的交互性等使用体验。尽管XR头显的用户群体目前仍然不大,但是随着AI技术在XR头显终端的应用持续深化,或将成为改变行业现状的关键。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1525807.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

QT插件简单使用2

目录 1 总的目录结构 2 主程序 3 插件程序 4 运行结果 相比原来的QT插件简单使用-CSDN博客增加了 QObject *create(const QString &name, const QString &spec) override; 函数的使用和Plugin.json的使用 1 总的目录结构 编译器mingw-64 2 主程序 1 新建一个其他…

和解费用3362万美元,谁来守护跨境卖家的“钱包”

公司向原告支付3362万美元(包括原告方主张的损害赔偿金2500万美元及原告方支付的律师费用862万美元); 公司不得通过任何方式访问或使用原告的产品或数据; 公司不得向最终用户提供维修帮助服务(属于公司汽车诊断产品中的辅助维 修功能,不影响…

【代码】提取图像轮廓坐标并保存为YOLOv8所需的txt格式

该段代码的应用场景为对图像标注过后,想要对图像进行裁切,但是标签不能裁切,所以将原图像按照标签进行二值化后,将二值化后的图像进行裁切,然后使用opencv对裁切后的图像进行处理,识别出白色区域轮廓&#…

从零开始学习数据结构与算法:Python实现【第139篇—Python实现】

👽发现宝藏 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 从零开始学习数据结构与算法:Python实现 数据结构与算法是计算机科学中至关重要…

FDA: 用于语义分割的傅里叶域自适应

论文链接:https://arxiv.org/abs/2004.05498 代码链接:GitHub - YanchaoYang/FDA: Fourier Domain Adaptation for Semantic Segmentation 机构:UCLA 发表于2020CVPR 这篇文章别的地方略读了,主要看看方法,感兴趣自…

基于Spring Boot的四川火锅文化网站的设计与实现

摘 要 四川火锅文化网站的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品,体验高科技时代带给人们的方便,同时也能让用户体会到与以往常规产品不同的体验风格。 与安卓,iOS相比较起来&…

基于SpringBoot+MYSQL的课程作业管理系统

目录 1、前言介绍 2、主要技术 3、系统流程分析 3.1、操作流程 3.2、添加信息流程 3.3、删除信息流程 4、系统设计 5、数据库设计 6、数据表 6、运行截图(部分) 6.1、管理员功能模块 6.2、教师功能模块 7、源码获取 基于springboot的课程作业管理系统 1、前言介绍 …

代码随想录算法训练营第47天 | 198.打家劫舍,213.打家劫舍II,337.打家劫舍 III

动态规划章节理论基础: https://programmercarl.com/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%92%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%80.html 198.打家劫舍 题目链接:https://leetcode.cn/problems/last-stone-weight-ii/ 思路: 当前房屋偷与…

Vue+OpenLayers7入门到实战:OpenLayers7创建自定义鹰眼控件,自定义鹰眼控件样式,调整鹰眼控件位置、大小、文字和按钮等样式

返回《Vue+OpenLayers7》专栏目录:Vue+OpenLayers7入门到实战 前言 本章介绍如何使用OpenLayers7在地图上创建自定义鹰眼控件,自定义鹰眼控件样式,调整鹰眼控件位置、大小、文字和按钮等样式。 二、依赖和使用 "ol": "7.5.2"使用npm安装依赖npm inst…

RP2040 VSCode C/C++开发环境快速部署

RP2040 VSCode C/C开发环境快速部署 📌安装参考《树莓派(Raspberry Pi) Pico VSCode C/C开发环境配置(无需Visual Studio)》📍Windows环境下 MSYS2一键式部署pico程序包,下载地址:https://github.com/raspberrypi/pico-setup-wind…

以太坊开发学习-solidity(二)值类型

文章目录 第一个Solidity程序编译并部署代码变量值类型1. 布尔型2. 整型3. 地址类型4. 定长字节数组 第一个Solidity程序 开发工具:remix 本教程中,我会用remix来跑solidity合约。remix是以太坊官方推荐的智能合约开发IDE(集成开发环境&#…

Windows系统搭建web网站并结合内网穿透实现公网访问本地站点

文章目录 使用工具1. 本地搭建web网站1.1 下载phpstudy后解压并安装1.2 打开默认站点,测试1.3 下载静态演示站点1.4 打开站点根目录1.5 复制演示站点到站网根目录1.6 在浏览器中,查看演示效果。 2. 将本地web网站发布到公网2.1 安装cpolar内网穿透2.2 映…

阿里云服务器选哪个地域比较好?考虑因素4点分享

阿里云服务器地域选择方法,如何选择速度更快、网络延迟更低的地域节点,地域指云服务器所在的地理位置区域,地域以城市划分,如北京、杭州、深圳及上海等,如何选择地域?建议根据用户所在地区就近选择地域&…

【学习学习】学习金字塔

学习金字塔(Cone of Learning),全称学习吸收率金字塔,是一种现代学习方式的理论。网上流传它是美国缅因州的国家训练实验室(National Training Laboratories)研究成果,用数字形式形象显示了采用…

【机器学习】详细解析Sklearn中的StandardScaler---原理、应用、源码与注意事项

【机器学习】详细解析Sklearn中的StandardScaler—原理、应用、源码与注意事项 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&#x…

JetBrains全家桶激活,分享PyCharm 2024 激活的方案

大家好,欢迎来到金榜探云手! PyCharm 公司简介 JetBrains 是一家专注于开发工具的软件公司,总部位于捷克。他们以提供强大的集成开发环境(IDE)而闻名,如 IntelliJ IDEA、PyCharm、和 WebStorm等。这些工具…

【晴问算法】入门篇—贪心算法—区间选点问题

题目描述 给定n个闭区间,问最少需要确定多少个点,才能使每个闭区间中都至少存在一个点。 输入描述 输出描述 输出一个整数,表示最少需要确定的点的个数。 样例1输入 3 1 4 2 6 5 7输出 2 解释 至少需要两个点(例如3和5&#xff…

Windows系统安装GeoServe结合内网穿透实现公网访问本地位置信息服务

文章目录 前言1.安装GeoServer2. windows 安装 cpolar3. 创建公网访问地址4. 公网访问Geo Servcer服务5. 固定公网HTTP地址 前言 GeoServer是OGC Web服务器规范的J2EE实现,利用GeoServer可以方便地发布地图数据,允许用户对要素数据进行更新、删除、插入…

25考研|北大软微会「爆炸」吗?

软微不是已经爆炸了吗? 大家去看看他的录取平均分就知道了,没有实力千万别碰,现在考软微已经不存在捡漏之说。 110408的复试线已经划到了465分,这个人真的不低了,因为有数学一和408两个比较难的专业课,复…

基于springboot创建mybatis

第一步:创建项目 第二步:添加依赖 第三步:连接MySQL 第四步:添加MySQL配置 #驱动类名称 spring.datasource.driver-class-namecom.mysql.cj.jdbc.Driver #数据库连接的url spring.datasource.urljdbc:mysql://localhost:3306/myb…