Vision Pro“裸眼上车”,商汤绝影全新舱内3D交互亮相

news2024/10/5 14:21:52

2023年,Apple Vision Pro的横空出世让人们领略到了3D交互的魅力,商汤绝影通过深厚的技术研发实力和高效的创新迭代效率,带来两大全新座舱3D交互:3D Gaze高精视线交互和3D动态手势交互。

作为全球首创的能够通过视线定位与屏幕图标进行交互的智能座舱技术,商汤绝影的3D Gaze高精视线交互将让用户通过眼神控制中控图标。3D 动态手势交互是行业领先的支持动态手势和手部微动作识别的智能座舱技术,能让用户通过手势“隔空”进行各类座舱交互。

商汤绝影这两个全新的座舱交互功能相互配合,将给智能座舱的交互带来革命性变革。

3D Gaze高精视线交互:“目控一切,所见即所选”

实体物理按键交互已经无法满足人们对更便捷、更高效交互的需求,采用“非接触式”交互已经成为智能座舱交互革命的必然趋势,而视线交互是最为直接和便捷的方案之一。

行业目前普遍能做到的是视线检测功能。现在车辆普遍搭载的驾驶员监测系统(DMS)就是以视线检测技术为基础。视线检测功能作为商汤绝影领先行业的王牌产品,已成功解决了智能座舱场景下的一系列长尾问题,如遮挡、阴阳脸、墨镜等,并量产落地100多个车型。

但DMS通常只能做到分心监测等舱内大面积区域的识别,受困于精度很难通过它进行具体的交互动作。商汤绝影全球首创3D Gaze高精视线交互,通过提升视线的精度,能精准识别到驾驶员注视中控屏或者后排用户看向后排屏幕的具体的某个图标并进行交互,实现“所见即所选”。

(商汤绝影全球首创3D Gaze高精视线交互,实现“所见即所选”)

因为眼球并不是标准的几何球体,它是一个复杂的器官,包括角膜、虹膜、瞳孔、晶状体、玻璃体等多个结构,不能简单使用几何球体的组合来描述眼球模型,而且每个人的眼球形态、大小、角膜曲率都存在生理上的差异,所以商汤绝影开发出了一套“千人千眼”的高精度三维眼球模型。

商汤绝影使用先进的眼动追踪技术和高精度的眼部成像设备,收集并分析驾驶员的眼部数据,精准为每个人的定制个性化的眼球模型,从而提高视线交互的精度和准确性,进一步提升驾驶的安全性和舒适性。

以“千人千眼”的高精度三维眼球模型为基础,结合创新的亚像素级细节定位和信息融合技术,商汤绝影3D Gaze高精视线交互革命性突破了座舱场景下的视线精度难题,配合手势、语音甚至是眨眼等方式,将给用户带来更智能、更个性化的舱内视觉交互体验。

3D动态手势交互:“掌握一切,所选即所得”

3D手势交互是以超高精的三维手部重建为基础,实时捕捉、识别与分析用户的三维手势动作,实现对车辆功能控制的技术,商汤绝影在北京车展首发座舱内3D手势交互,带来高精度、高稳定性、快速响应的全新交互体验。

相对于2D手势识别,得益于三维空间定位,商汤绝影的3D手势交互能更加精确定位手部的移动位置,并对手指细节进行优化,保证了不同手指间相互作用的准确感知,进而可以识别如捏合、拖拽等复杂动作,实现鼠标级的隔空手势交互操作。

(商汤绝影3D手势交互,实现“所选即所得”)

为了打造能够识别动态手势和手部微动作的3D手势交互,商汤绝影构建了超百万级别的数据规模。

在大量采集真人真实数据的基础上,借助渲染算法,对真实采集中缺少的数据维度以及各种极端场景进行渲染补充,确保数据囊括车舱环境下几乎所有场景。以海量的三维数据为基础,商汤绝影实现了技术从2D到3D的迅速突破,为3D手势交互打下坚强基础。

同时,由于手部动作的灵活性与多样性,3D手势定位与识别往往存在自遮挡、遮挡、动态模糊、运动过快等问题。商汤绝影引入了基于大模型的端到端识别网络。相较于传统的人为规则逻辑,端到端神经网络完全依靠海量数据学习到的知识对感知到的手部动作和手指细节进行判断,带来座舱3D手势交互的全新模式。

通过3D手势操作,用户可以更加直接地通过隔空手势控制导航、音乐、空调等功能,做到“所选即所得”,从而解放身体姿势和双手,享受更加舒适和智能化的驾驶体验。

Apple Vision Pro的操作方式就是将3D高精视线交互与3D手势交互相结合,让用户体验到头戴式MR设备的3D交互魅力。3D Gaze 高精视线交互与3D动态手势交互相结合,将进一步变革舱内交互模式。

商汤绝影已经实现这两大舱内3D交互功能相互配合,如同Vision Pro“裸眼上车”,革命性改变了座舱交互的方式,让用户从传统的物理按键和屏幕触控方式中解脱出来,真正做到“所见即所选,所选即所得”,打造更符合人类直觉的自然交互体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1630945.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

16.Blender 基础渲染工作流程及安装ACES

安装插件和菜单栏设置 在菜单栏的编辑里打开偏好设置 里面的插件界面 搜索node 给第三个打勾 点击安装,导入cat插件 安装完后,一定要打勾,选择上cat插件 这样N窗口才会显示MMD选项 导入场景 点击打开 把输出模式的帧率改为30fps 按…

CSS 之 transition过渡动画

一、简介 ​ CSS 制作 Web 动画有两种方式: 帧动画(Keyframe Animation)和过渡动画(Transition Animation)。针对不同的业务场景中,我们应该选择不同的动画方式,通常来说:对于交互元…

OpenHarmony实战开发-多层级手势事件

多层级手势事件指父子组件嵌套时,父子组件均绑定了手势或事件。在该场景下,手势或者事件的响应受到多个因素的影响,相互之间发生传递和竞争,容易出现预期外的响应。 本章主要介绍了多层级手势事件的默认响应顺序,以及…

MySQL8.0 msi版本安装教程

MySQL8.0 msi 版本安装教程 1> 官网下载安装包 2> 安装MySQL 2.1双击打开下载的安装包,进入到下面这个页面,选择 Custom 选项,之后,点击next 说明: 2.2 选择所需产品,更改安装位置(当然也可以默认安…

公式SUM(A2:C4C2:D5)一共对几个单元格进行求和?

一、公式中的几个问题 1.括号和冒号是双字节的字符。 这个不用多说了,相信题主中是提问时书写笔误,实际在Excel中写公式时肯定用的是英文单字节字符。 2.括号里是两个区域, 但两个区域之间是怎样的运算关系并没有说,或者说是遗…

数据结构之顺顺顺——顺序表

1.浅谈数据结构 相信我们对数据结构都不陌生,我们之前学过的数组就是最基础的数据结构,它大概就长这样: 数组 而作为最简单的数据结构,数组只能帮助我们实现储存数据这一个功能,随着学习的深入,和问题的日渐…

远程控制软件优化(1)

远程控制软件优化(1) 第一版存在以下缺点: 1、四大部分中 Robot States 部分过于简陋,不适合放到论文中 2、Lidar BEV 图像显示效果非常差,显示不全且很稀疏 3、视频流传输延时过高,无法实现远程控制 以…

学python的第二十三天

原文链接:Python 图形化界面设计(Tkinter) - 简书 (jianshu.com) 子窗体(Toplevel) 直接上代码: # 子窗体 from tkinter import *def newwindow():winNew Toplevel(root)winNew.geometry(320x240)winNe…

C语言-atoi和atof函数的使用

人生应该树立目标,否则你的精力会白白浪费。💓💓💓 目录 •🌙知识回顾 🍋知识点一:atoi函数的使用和实现 • 🌰1.函数介绍 • 🌰2.代码演示 • 🌰3.atoi函数的…

《十一》Qt各种对话框之QInputDialog

QInputDialog QInputDialog 用于方便快捷地获取一个用户输入数据,支持整数 int、浮点数 double、文本 QString 三种数据。按照 QInputDialog 内部的输入控件,又可以分为整数输入控件 QSpinBox、浮点数输入控件 QDoubleSpinBox、单行文本输入控件 QLineE…

AI大模型日报#0428:AI聊天半年涨粉1000万、元象发布多模态XVERSE-V、字节发布视觉ViTamin

导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。AI大模型日报今日要点: 今日,AI大模型领域动作频频,多家科技巨头和初创公司展示了其最新研发成果。快手…

暗区突围如何申请测试资格?暗区突围测试申请的方法轻松掌握

游戏中健康系统与其它射击游戏有很大区别,根据受伤部位、伤势的不同,会有不同的表现。除了头部之外,其它部位如果损坏后继续受到伤害,那么伤害将会分摊到身体其它部位。在暗区内或者暗区外都可以对角色进行治疗,角色不…

FebHost:深入分析企业海外市场选通用域名还是国别域名?

企业想进入海外在线市场,非常重要的一个环节是如何选择一个在线品牌域名,很多企业面临着选择.COM还是国别域名。以下是一些需要考虑的因素。 域名可用性 一个网站的域名可以给人留下深刻的品牌印象。新企业更倾向于选择 .com、.net 和 .org 等标准通用顶…

【哔哩哔哩笔试题汇总】2024-04-28-哔哩哔哩春招笔试题-三语言题解(CPP/Python/Java)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新b站近期的春秋招笔试题汇总~ 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢&#x1f497…

由于找不到msvcr120.dll,无法继续执行代码

在日常编程中,缺少关键的msvcr120.dll文件可能会导致代码无法执行,给我们带来不便。针对缺少msvcr120.dll文件的情况,我们可以采取一些有效的解决方法来解决这一问题。通过下载安装或使用Visual C Redistributable工具安装该msvcr120.dll文件…

MySQL/MariaDB 如何查看当前的用户

MySQL 的所有数据库用户信息是存储在 user 数据表中的。 可以在登录成功数据后运行 SQL: MariaDB [(none)]> select user,host from user;就可以查看到数据中的所有用户信息。 MariaDB [(none)]> select user,host from user; ERROR 1046 (3D000): No databa…

K8S哲学 - statefulSet 灰度发布

kubectl get - 获取资源及配置文件 kubectl get resource 【resourceName -oyaml】 kubectl create - 指定镜像创建或者 指定文件创建 kubectl create resource 【resourceName】 --imagemyImage 【-f my.yaml】 kubectl delete kubectl describe resource resourc…

医院敏感文件交互 如何保障安全和效率?

医院会产生大量的敏感文件,这些敏感文件交互时,都需要使用特殊的手段,来保障数据的安全性。 医院的敏感数据主要包括以下几类: 1、患者基本信息:包括患者的姓名、身份证号码、户籍地或现住址、联系方式、文化程度、既…

LeetCode - LCR 179.查找总价格为目标值的两个商品

一. 题目链接 LeetCode - LCR 179. 查找总价格为目标值的两个商品 解法(双指针 - 对撞指针): 算法思路: 注意到本题是升序的数组,因此可以用「对撞指针」优化时间复杂度。 算法流程: 初始化left &#…

el-form 表单设置某个参数非必填验证

html <el-form ref"form" :rules"rules"><el-form-item prop"tiktokEmail" label"邮箱" ><el-input v-model"form.tiktokEmail" placeholder"邮箱" ></el-input></el-form-item&…