浅谈车载测试之智能座舱人机交互

news2024/12/25 8:50:35

1、引言

目前,汽车不仅在动力源、驱动方式和驾驶体验上发生了变化,驾驶舱也告别了传统的枯燥机械和电子空间,智能化水平飙升,成为继家庭和办公室以外人们生活之后的“第三空间”。通过人脸;指纹识别、语音 / 手势交互、多屏联动等高新技术,使当今汽车智能座舱在环境感知、信息采集和处理方面的能力显著增强,成为人类驾驶的“智能助手”。智能座舱告别简单的电子化,进入智能助理阶段的显著标志之一是人与驾驶舱的相互作用从被动式进入主动式,这种“被动的”和“主动的”是以驾驶舱本身为中心定义的。过去的信息交流主要由人发起,现在人和机器都可以启动,人和机器的交互水平已经成为定义智能座舱产品水平的重要标志。

2、人机交互发展背景

从电脑与[url=]手机[/url]的历史可以折射出机械与人互动方法的发展脉络,并从繁杂到单纯简约从抽象的动作到自然的互动。未来最主要的人机交互发展趋势,便是将机械由被动响应进入了主动式交互。沿着这种趋势的延长线来看,人与机器相互作用的终极目标是将机器拟人化,使人与机器的相互作用像人与人的交流一样自然顺畅。也就是说,人机交互的历史就是人从适应机器到通过机械适应人的历史。

智能座舱的发展也有类似的过程。随着电子技术的进展和车主的期望,汽车内外的电子信号和功能也越来越多,以便让车主降低对注意力资源的浪费,从而降低行车分气,汽车互动方法也因此而逐步改变:物理旋钮 / 键盘——数字触摸屏——语言操控—自然状态互动。

2.1 自然交互是下一代人机交互方式的理想模型
 

2.1.1 什么是自然交互

简而言之,即通过动作、目光追踪、语言等实现交流。这里的意识模态更具体地说类似于人的 " 感知 ",其形态中混合着各种感知,并对应了人的视野、聆听、触觉、嗅觉、味觉等五大感知。相应的信息介质包括各种传感器,例如声音、视频、文字和红外、压力、雷达。智能汽车实质上就是一个载人机器人,其最关键的二个功能就是自己控制的以及与人互动的功能,没有其中之一,将无法高效的工作于人。所以,一种智慧的人机交互系统是十分必要的。

2.1.2 自然交互的实现方式

座舱内融合了越来越多的传感器,传感器提高了形态多样化、数据丰富性和准确性的能力。一方面使驾驶舱内的计算力需求飞跃,另一方面也提供了更好的感知能力支持。这一趋势使更丰富的驾驶舱场景创新、更好的互动体验成为可能。其中,视觉处理是驾驶舱人机交互技术的关键。而且融合技术才是真正王道,比如在嘈杂条件下的语音识别时,光靠麦克风是没有的。人在这种情况下能选择性地听某人讲话,不仅靠耳朵,还靠眼睛。因此,通过视觉上确定音源并阅读唇语,能够得到比单纯的声音识别更好的效果。如果传感器是人的五感,那么计算力便是一个自动交互的人脑,AI 算法把视觉与语音结合到一起,通过各种认知方法,能够进行人脸、动作、姿态、语音等多种信号的辨识。由此,可以实现更智能的人的目标交互,包括眼球追踪、语音识别、口语识别联动和驾驶员的疲劳状态检测等。

座舱人员交互的设计通常需要通过边缘运算,而非云运算来完成。三点:安全性、实时性和隐私安全性。云计算依赖于网络,对于智能汽车来说,依赖于无线网络无法保证其连接的可靠性。同时,数据传输延迟不可控,不能保证交互平滑。要确保面向自动运行安全域的完整用户体验,破局之道在于边缘计算。但是,个人信息安全也是面临的问题之一。驾驶室内的私密空间,安全性保障方面尤为明显。现在的个性化声音识别主要都是依靠在云上实现的,里面的声纹等私人生物信息能够更方便的显示私人身份信息。而利用在汽车端的边缘 AI 设计,就能够把图片、声音等私人生物信息,转变成汽车语义信息,再上传到云端,从而有效地保障了汽车的个人信息安全。

2.1.3 自动驾驶时代,交互智能必须跟驾驶智能相匹配

在可预期的未来,无人机协同飞行将成为一个长期存在的现象,座舱的无人机交互成为人掌握主动飞行技能的第一个界面。目前,智能驾驶领域面临进化不均衡的问题,人机交互水平落后于自动驾驶水平的提升,造成自主行车问题的频出,阻碍自动驾驶的发展。人机交互合作行为的特点是人的操作回路上。所以,人机交互功能必须和自动驾驶功能保持一致。否则将导致严重的预期功能安全风险,绝大多数自动驾驶致命事件与此有关。一旦人机交互接口可以提供自己行车的认知结果,可以进一步了解自动驾驶系统的能量边界这将大大有助于提高 L + 级自动驾驶功能的接受度。

当然,目前智能座舱的交互方式主要是手机安卓生态的延申,主要是通过主机屏幕支持。现在的显示器也越来越大,而这其实是由于低优先级的功能占用了高优先功能的空间,带来额外的信号干扰,影响运行安全。在未来,虽然实物显示屏仍然存在,但我相信在未来,取而代之的将是自然人机交互+AR-HUD。如果把智能驾驶系统发展到 L四以上,人将从枯燥疲劳的驾驶中解放出来,汽车也将成为 " 人的第三生活空间 "。这样,未来驾驶室内的娱乐区和安全功能区(人机交互和自动操纵)的位置会进行改变,安全区则变成为主控制区。自动驾驶是汽车与环境的互动,人与人的互动是人与汽车的互动,两者融为一体,完成人、车、环境三者的协同,形成完整的驾驶闭环。第二,自动对话方式+AR-HUD 的对话界面更加安全,在用语言或者手势沟通的情形下,可以避免对驾车者视线的转移,从而提高了行驶安全。在驾驶舱大屏幕上根本就无法实现这一点,而 ARHUD 则能够在显示自动行驶感知信号的同时规避了这一问题。第三,自然交谈方法是一个隐性的、简洁的、具有感情的自然交谈方法。你不能过分占有车里宝贵的物理空间,但你可以随时随地陪伴自在者周围。所以,未来智慧行车和智慧驾驶舱的域内结合是一种更加安全的发展方式,最后发展的是汽车中央的系统。

2.2 人机交互实战原理
 

2.2.1 触控交互

早期的中控台屏幕只是显示收音机的信息,大部分面积都容纳了超多的物理交互按钮,这些按钮基本上都是通过触觉交互来实现与人类的沟通。

随着智能交互的发展,出现了中央控制的大屏幕,物理交互按钮开始逐渐减少。中控大屏幕越来越大,占据越来越重要的位置。中控台的物理按键已经减少到没有了,此时乘员已经无法用触觉与人进行交互,但在这个阶段逐渐转变为视觉交互,人们不再用触觉与人进行沟通,而是主要用视觉进行操作。但如果只用视觉与智能座舱的人类进行对话,人们将绝对不方便。特别是在驾驶过程中,90% 的人类视觉注意力必须投入到路况的观察中,才能长期将视线投入到画面之上,与智能座舱对话。

2.2.2 语音交互

(1)语音交互的原理。

自然语音的理解——语音识别——语音转化语音。

(2)语音交互需要的场景。

语音控制的场景应用主要有二个要素,一是能够代替在触摸屏上没有提示的功能,与人机界面自然对话,二是最小化了人机界面手动控制所带来的影响,提高安全性。

第一,当你下班回家的时候,你想在开车的过程中快速控制车辆,查询信息,查询空调、座椅等。在长途旅行中,中途调查服务区和加油站,调查日程。第二个是用语音把一切链接起来。车上的音乐、子屏幕娱乐都能迅速唤起。所以我们要做的就是快速控制车辆。首先就是对汽车实现快速操控,基本功能包括调整车内氛围灯光、调整音量、调控车内空调温度控制、调节窗户、调节后视镜,快速控制车辆的本意是让驾驶员更快速地控制车辆,减少注意力分散有助于增加安全运行系数。远程语言交互是实现整个系统的重要入口,因为系统必须了解司机的语音指令,提供智能导航。我们不但能够被动接受任务,而且还能够为您提供关于目的地介绍和日程安排等的附加服务。接着,是车辆和驾驶员的监视,在实时运行中,能够随时询问轮胎压力、箱的温度、冷却剂、发动机油等车辆的性能和车辆的状态。实时信息查询有助于驾驶员提前处理信息。当然到达警戒临界点的时候也要实时注意。除了对内监控外当然也需要对外监控,生物识别和语音监控的混合监控可以监控驾驶员的情绪。在适当的时候提醒驾驶员打起精神来避免交通事故的发生。以及长时间行驶的疲劳声音的注意事项。最后,在多媒体娱乐方面,开车的场景、播放音乐和广播是最高频的操作和需求。除了简单的播放、暂停、歌曲切换等功能外,还等待着收藏、账号注册、播放历史的开启、播放顺序的切换、现场互动等个性化功能的开发。

2.2.3 容纳错误

语音对话中必须允许容错机制。基本的容错也按场景进行处理。一是听不懂,此时让用户再说一遍,二是听了但没有处理问题的能力,三是识别为错误信息,这可以再确认。

2.2.4 人脸识别

(1)人脸识别的原理。

驾驶舱的人脸特征识别技术一般包含以下三方面:人脸特征检查、模式识别。随着互联网整体信息的生物化,多平台输入人脸信息,汽车作为万物互联的一个重点,随着更多移动终端使用场景移动到车内,账户注册、身份认证需要在车内进行。

(2)人脸识别使用场景。

行驶前,必须上车验证车主信息,注册应用 ID。行走中,面部识别是行走中闭眼疲劳的主要工作场景,电话提醒,无眼前,打哈欠。

单纯的相互作用可以让驾驶员更不方便。例如,仅凭语音,容易发生误指令、单纯触摸操作,驾驶员无法满足 3 秒的原则。只有语音、手势、视觉等多种交互方式融合在一起,智能系统才能更加准确、方便、安全地在各种场景中与驾驶员进行沟通。

2.3 人机交互挑战与未来
 

2.3.1 人机交互的挑战

理想的自然互动是从使用者感受入手,创造安全、顺畅、可预见的互动感受。但不管人生如何丰富,总要脚踏实地的从事实出发,目前的挑战依然很多。

目前自然交互的误认仍然很严重,全工况、全天候的可靠性、准确性还远远不够。因此,在手势辨识中,依靠视觉的手势识别率目前仍很低,所以必须研发各种算法来提高辨识的精度与速率。无意中打手势,或许会被人误认为是命令动作,但其实这只是无数误认之一,在移动情况下,对光线的投射、振动、遮挡等都是重大技术的问题。因此,配合运转场景,采用多传感器融合验证方式、声音确认等方式,为了降低误识别率,需要综合性地加持各种技术手段。其次,目前自然交互的流畅性问题仍是当前必须克服的困难,要求更先进的传感器、更强大的能力、更高效率的计算。同时,自然的语言处理能力与意图表达还处在起步阶段,还需算法技术的深入研究。

2.3.2 未来,座舱人机交互走向虚拟世界与情感连接

消费者愿意为汽车移动之外附加的智能化功能买单的原因之一是对话和体验。我们在上面提到,未来智能座舱的发展是以人为本的,它将在人们的生活中演化为第三个空间。

这种人机交互绝不是简单的呼叫响应,而是多渠道、多级、多模式的交流感觉。从乘员视角,未来的智能座舱人机交互系统将以智能语言为主要交流手段,并以触摸、手势、动态、表情等为辅助交流手段,解放乘员手与眼睛,以减少驾驶员操控风险。

随着驾驶舱内传感器的增加,人机交互服务对象以驾驶员为中心向全车乘客服务转移是一种确定性趋势。智能座舱构建虚拟空间,人与人的自然互动将带来全新的沉浸式扩展现实娱乐体验。强大的配置,结合驾驶舱强大的互动设备,可以构建车内的元宇宙,提供各种沉浸式游戏。智能座舱可能是原太空的好载体。

人机的自然互动也带来情感上的联系,驾驶舱成为人的伴侣,更智能的伴侣,学习车主的行为、习惯、偏好,感知驾驶舱内的环境,结合车辆当前的位置,在需要时积极提供信息和功能提示。随着人工智能的发展,在我们有生之年,有机会看到人类的情感联系逐渐渗透到我们的个人生活中,确保技术向善,也许是那时我们必须面对的另一个重大问题。但无论如何,技术都会朝这个方向发展。

3、智能座舱人机交互总结

在当前惨烈的汽车产业竞争中,人工智能座舱系统已然变成了实现整机厂功能差异性的关键问题,因为驾驶舱人机交互系统和人的交流行为、语言文化等都息息相关,所以需要高度本地化。智能车辆人机交互是中国智能车辆企业品牌升级的重要突破口,是中国智能车辆科技引导世界技术发展趋势的突破口。

这些相互作用和相互作用的整合,未来将提供更全面的沉浸体验,继续推动新的互动方式和技术的成熟,期望从目前的体验提升功能演化为未来智能座舱的必备功能。未来智能座舱交互技术无论是基本安全需求还是更深层次的归属感、自我实现心理需求,都有望涵盖多种多样的出行需求。

最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

 

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你!有需要的小伙伴可以点击下方小卡片领取 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/385763.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【线程-J.U.C】

Lock J.U.C最核心组件,Lock接口出现之前,多线程的并发安全只能由synchronized处理,但java5之后,Lock的出现可以解决synchronized的短板,更加灵活。 Lock本质上是一个接口,定义了释放锁(unlock&…

解决:centos7如何解决网络不可达和wget: 无法解析主机地址 “downloads.mysql.com”

遇到此类问题可能会有多重解决方法,需要一个一个的去排除。 1、查看自己的网络设置是不是设置的NAT模式,设置完成后再去ping一下网络地址。 2、ping一下百度看能不能拼成功,下图是ping成功的样式。(如果不行继续往下走&#xff0…

牛客sql题目练习

Sql3描述 题目:现在运营需要查看用户来自于哪些学校,请从用户信息表中取出学校的去重数据。 示例:user_profile iddevice_idgenderageuniversityprovince12138male21北京大学Beijing23214male复旦大学Shanghai36543female20北京大学Beijing42315femal…

PowerShell攻击指南

文章目录一:PowerShell简介1.1:基本概念1.2:执行策略与绕过1.3:常用命令二:PowerSploit2.1:PowerSploit安装2.2:PowerSploit攻击实战2.2.1:直接shellcode反弹meterpreter shell2.2.2…

【C/C++每日一练】总目录(不断更新中...)

C/C 2023.03 20230303 1. 字符串相乘 ★★ 2. 单词拆分 II ★★★ 3. 串联所有单词的子串 ★★★ 20230302 1. 个位数是6,且能被3整除的五位数共有多少个? ☆ 2. 不同方式求n的阶乘 ★ 3. 报数游戏 ★☆ 20230301 1. 冒泡排序法排序 ★ …

视频号频出10w+,近期爆红的账号有哪些?

回顾2月,视频号持续放出大动作,不仅进行了16小时不间断的NBA全明星直播,还邀请国际奥委会入驻,分享奥运的最新资讯。视频号成为越来越多官方机构宣传推广的有效渠道。官方积极入驻,内容创作生态也在同步繁荣发展&#…

中村成洋《垃圾回收的算法与实现》PDF 读书笔记

观前提醒 为了能够锻炼自己,我会查阅大量外文不停的修改内容,少部分会提示成中文。 可能有误,请见谅 提示:若是觉得阅读困难,可以看如下内容 脚本之家可获取,若失效可私信浏览器的沙拉查词扩展&#xf…

Shell脚本学习指南 - 第二章入门篇

shell脚本的第一行#! #! /bin/awk -f 内核会扫描文件开头的#!后面内容,跳过所有空白符号,寻求可以用来执行程序的解释器的full path和option(option后面的空格会识别) ; shell用分号隔开多条语句 & 后台执行该命令&#xff…

ChatGPT解答:JavaScript保存当前网页页面图片为pdf文件或者word文件,前端用vue2,给出详细的方案和代码

ChatGPT解答:JavaScript保存当前网页页面图片为pdf文件或者word文件,前端用vue2,给出详细的方案和代码 ChatGPTDemo Based on OpenAI API (gpt-3.5-turbo). JavaScript保存当前网页页面图片为pdf文件或者word文件,前端用vue2&am…

Python 操作Redis

在 Python中我们使用 redis库来操作 Redis数据库。Redis数据库的使用命令这里就不介绍了。 需要安装 redis库。检查是否安装redis: pip redis 如果未安装,使用 pip命令安装 redis。 pip install redis #安装最新版本 一、Redis连接 Redis提供两个类 Re…

CEC2021:鱼鹰优化算法(Osprey optimization algorithm,OOA)求解CEC2021(提供MATLAB代码

一、鱼鹰优化算法简介 鱼鹰优化算法(Osprey optimization algorithm,OOA)由Mohammad Dehghani 和 Pavel Trojovsk于2023年提出,其模拟鱼鹰的捕食行为。 鱼鹰是鹰形目、鹗科、鹗属的仅有的一种中型猛禽。雌雄相似。体长51-64厘米…

2023年“楚怡杯“湖南省职业院校技能竞赛“网络安全”竞赛任务书

2023年“楚怡杯“湖南省职业院校技能竞赛“网络安全”竞赛任务书 一、竞赛时间 总计:360分钟 竞赛阶段竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 A模块 A-1 登录安全加固 180分钟 200分 A-2 本地安全策略配置 A-3 流量完整性保护 A-4 事件监控 …

技术官方文档中的代码是用什么展示的?代码高亮插件总结

****内容预警****菜鸟教程***大佬绕道我们经常看到各种技术官方文档,有很多代码展示的区域,用于我们复制粘贴代码,比如vue 的官网当我们需要自己实现这么一个网站的时候,我就开始手忙脚乱,这到底是咋实现的&#xff1f…

如何使用ChatGPT快速构建一个网站模板?

欢迎来到令人兴奋的自然语言处理和机器学习世界!今天,我们将探索 ChatGPT 的功能,它是由 OpenAI 公司开发的目前最先进的人工智能工具。当然,你也可以将其看作是一个智能机器人。ChatGPT 最令人印象深刻的功能之一是它能够根据简单…

如何获取或设置CANoe以太网网卡信息(SET篇)

CAPL提供了一系列函数用来操作CANoe网卡。但是,但是,首先需要明确一点,不管是获取网卡信息,还是设置网卡信息,只能访问CAPL程序所在的节点下的网卡,而不是节点所在的以太网通道下的所有网卡 关于第一张图中,Class节点下,有三个网卡:Ethernet1、VLAN 1.100、VLAN 1.200…

我的 System Verilog 学习记录(8)

引言 本文简单介绍 SystemVerilog 的接口。 前文链接: 我的 System Verilog 学习记录(1) 我的 System Verilog 学习记录(2) 我的 System Verilog 学习记录(3) 我的 System Verilog 学习记…

哪个牌子的蓝牙耳机音质好?公认音质最好的真无线耳机推荐

现如今,使用蓝牙耳机的人越来越多,更多的蓝牙耳机品牌出现在大众视野。哪个牌子的蓝牙耳机音质好?最近看到很多人问音质。都说蓝牙耳机的音质比不上有线耳机的音质,但经过那么多年的技术进步,蓝牙耳机在音质上也有着不…

CSS - 扫盲

文章目录1. 前言2. CSS2.1 css 的引入方式2.2 选择器2.3 CSS 常用属性2.3.1 字体属性2.3.2 文本属性2.3.3 背景属性2.4 圆角矩形2.5 元素的显示模式2.6 盒子模型2.7 弹性布局1. 前言 上文我们简单 将 HTML 过了一遍 , 知道了 HTML 知识表示页面的结构和内容 &#x…

【NLP相关】Transformer模型:从Seq2Seq到自注意力机制(Transformer原理、公式推导和案例)

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

逆向练习之 mingyue.exe wp

目录 一.查壳 二.主函数 三.operate函数 四.storage函数及4618和4620指针功能的解释 五.judge函数 六.求解flag 七.其他--ida字符识别问题 一.查壳 64位无壳 二.主函数 1.这里的pointer_4618和4620是两个相邻的八字节内存单元,其中4620是字符串链表表头head 2.puts和s…