ASR+LLM+TTS在新能源汽车中的实战

news2024/11/14 13:55:03

ASR+LLM+TTS在新能源汽车中的实战解决方案,已经在路面上大规模应用,下面简单介绍一下:

实战案例

以下是一些国内新能源车机里 ASR+LLM+TTS 的案例:

  1. 蔚来
    • 蔚来的车机系统在智能语音交互方面有较为出色的应用。其 ASR 技术能够准确识别车主的语音指令,即使在车内有一定背景噪音的情况下,也能保持较高的识别准确率。例如,车主说“导航到最近的充电站”,系统可以快速准确地识别该语音指令。
    • 通过 LLM 对指令进行理解和分析,车机系统能理解指令的意图,不仅可以准确导航到最近的充电站,还能根据车辆当前的电量、路况等信息,提供最佳的充电方案建议。
    • TTS 技术则将系统的反馈信息以清晰自然的语音播报给车主,让车主在驾驶过程中无需分心查看屏幕,就能获取所需信息,提高了驾驶的安全性和便捷性。
  2. 小鹏
    • 小鹏汽车的车机语音助手也应用了 ASR+LLM+TTS 技术。在语音识别方面,它可以识别多种方言和不同的语速、语调,满足不同地区用户的使用需求。比如,用户用带有地方口音的普通话发出指令“打开车窗”,系统能够准确识别。
    • 借助 LLM 的强大理解能力,车机系统可以处理复杂的指令和问题。例如,用户问“明天天气怎么样,我适合开车去海边吗”,系统会先通过网络获取明天的天气信息,然后根据天气情况和车辆的相关信息(如续航里程、周边充电桩分布等)进行综合分析,给出是否适合开车去海边的建议。
    • TTS 语音合成的效果自然流畅,声音富有亲和力,让用户在与车机交互时感觉更加舒适。
  3. 理想
    • 理想汽车的车机系统同样具备优秀的语音交互功能。ASR 技术可以快速识别用户的语音指令,无论是控制车辆的功能(如调节空调温度、打开座椅加热等),还是获取信息(如查询股票行情、播放音乐等),都能准确识别。
    • 通过 LLM 的深度理解,车机系统能够根据用户的习惯和偏好提供个性化的服务。例如,如果用户经常在下班后开车回家的路上听某一类型的音乐,系统会在相应的时间自动推荐类似的音乐。
    • TTS 的语音播报清晰准确,能够及时将系统的处理结果反馈给用户,让用户随时了解车辆的状态和相关信息。
      以下是国内新能源车机里其他的 ASR+LLM+TTS 案例:
  4. 埃安
    • 广汽埃安的部分车型在车机系统中也应用了相关技术。其 ASR 系统能够准确识别车主的语音指令,无论是在日常驾驶过程中对导航、音乐、空调等功能的控制,还是查询车辆的状态信息等,都能快速响应。通过 LLM 对指令进行深度理解和分析,比如当车主说“我有点冷”,系统会理解其意图并自动调节空调温度。TTS 技术则为车主提供清晰的语音反馈,告知操作是否成功或提供相关的信息提示。
  5. 哪吒
    • 哪吒汽车的车机智能语音交互系统也运用了 ASR+LLM+TTS 技术。在语音识别方面,能够适应不同的口音和语言习惯,提高了语音交互的准确性和便捷性。借助 LLM 的能力,车机可以理解复杂的语义,例如当车主询问“附近有哪些评分高的餐厅并且有充电桩”这样的综合问题时,系统可以准确分析并给出合适的答案。TTS 的语音合成效果自然,让车主在驾驶过程中能够轻松获取信息。
  6. 威马
    • 威马汽车的车机系统同样具备类似的功能。ASR 技术可以快速准确地识别语音指令,无论是简单的操作指令还是较为复杂的查询请求。通过与 LLM 的结合,车机能够智能地理解用户的需求,例如在导航时,用户可以说“避开拥堵路段,找一条风景好的路线去目的地”,系统会根据实时交通信息和地图数据进行规划。TTS 技术则将导航信息等以语音的形式播报给用户,方便用户在驾驶过程中获取信息。
  7. 比亚迪
    • 比亚迪的部分高端新能源车型也在不断强化智能语音交互功能。其 ASR 技术可以准确识别多种语言和方言,方便不同地区的用户使用。LLM 技术能够对用户的指令进行深度理解,比如用户说“我明天要去接人,帮我规划一下行程和充电安排”,系统会综合考虑行程距离、车辆电量、充电桩分布等因素,提供合理的建议。TTS 技术则以清晰、自然的语音将结果反馈给用户。

发展趋势

新能源车机里的 ASR+LLM+TTS 技术的发展趋势如下,必将随着自动驾驶技术走进更多人的视野:

  1. 更高的准确性和鲁棒性
    • 语音识别准确性提升:随着深度学习算法的不断优化和大量训练数据的积累,ASR 技术在复杂车内环境下对各种语音指令的识别准确率将不断提高。例如,对于带有方言、口音、模糊发音的语音,以及在高速行驶时的风噪、胎噪等背景噪音干扰下,仍能保持较高的识别准确率,减少误识别和漏识别的情况。
    • 语言理解能力增强:LLM 会不断进化,能够更好地理解自然语言中的语义、意图和上下文信息。对于新能源车机用户复杂、多样化的指令和问题,系统可以更准确地理解并给出合适的回应和操作建议,提高交互的有效性和准确性。
    • 抗干扰能力加强:车内环境复杂多变,各种噪音、振动等因素会影响技术的性能。未来,相关技术会在硬件和算法层面进行改进,增强对车内环境干扰的抵抗能力,确保在各种恶劣条件下也能稳定工作。例如,采用更先进的降噪算法、多麦克风阵列技术等,提高语音信号的质量和识别的可靠性。
  2. 个性化和定制化服务
    • 用户偏好学习:系统能够根据用户的使用习惯、偏好和历史数据,进行个性化的学习和分析。例如,记住用户经常使用的功能、喜欢的音乐类型、常用的导航目的地等,主动为用户提供个性化的服务和推荐,提高用户体验的满意度。
    • 定制化交互界面:车机系统可以根据用户的需求和喜好,提供定制化的语音交互界面和操作方式。用户可以自定义语音指令的关键词、唤醒词,设置不同的语音提示风格和音量大小等,满足不同用户的个性化需求。
    • 多用户识别与个性化服务:新能源车通常会有多个用户使用,未来的技术将能够准确识别不同的用户身份,并根据每个用户的个性化设置和偏好提供相应的服务。例如,不同用户上车后,车机系统自动切换到该用户的个性化设置和服务界面。
  3. 与车辆系统的深度融合
    • 与车辆控制的紧密结合:ASR+LLM+TTS 技术将与新能源车的车辆控制系统实现更深度的融合,不仅可以控制车内的娱乐、导航等功能,还能参与到车辆的驾驶辅助、安全控制等重要系统中。例如,通过语音指令实现自动泊车、自适应巡航控制、紧急制动等操作,提高驾驶的便利性和安全性。
    • 与车辆传感器数据的协同工作:结合车辆上的各种传感器数据,如车速、加速度、环境温度等,为用户提供更精准的信息和服务。例如,根据车辆的行驶状态和环境信息,自动调整语音提示的内容和频率,或者在车辆出现故障时,及时通过语音告知用户并提供相应的解决方案。
  4. 多模态交互融合
    • 语音与手势、眼神等交互方式的结合:未来的新能源车机系统将不仅仅依赖语音交互,还会与手势识别、眼神追踪等多模态交互方式相结合。用户可以通过语音、手势、眼神等多种方式与车机系统进行交互,提高操作的灵活性和便捷性。例如,用户在语音指令的同时,通过手势来强调或补充某些信息,使交互更加自然和高效。
    • 与车载显示屏的互动增强:TTS 技术生成的语音信息将与车载显示屏上的图像、文字等信息进行更好的结合和互动。例如,在导航过程中,显示屏上显示地图和路线信息的同时,通过语音提示用户下一步的行驶方向和注意事项,使用户能够更直观地理解和掌握相关信息。
  5. 云端与本地协同计算
    • 云端计算的优势发挥:云端拥有强大的计算能力和丰富的资源,可以对大量的语音数据进行快速处理和分析,为新能源车机提供更准确、更智能的服务。例如,通过云端的大数据分析和机器学习算法,不断优化语音识别模型和语言理解模型,提高系统的性能和智能化水平。
    • 本地计算的实时性保障:在一些对实时性要求较高的场景下,如紧急制动、快速导航等,本地计算可以确保系统能够快速响应,不受网络延迟的影响。未来的车机系统将实现云端与本地计算的协同工作,根据不同的场景和需求,自动选择合适的计算方式,提高系统的整体性能和可靠性。
  6. 智能化程度不断提高
    • 自主学习和进化能力:系统将具备更强的自主学习和进化能力,能够不断地从用户的使用过程中学习新的知识和技能,不断优化自己的性能和服务。例如,随着用户使用时间的增加,系统对用户的语音习惯和需求的理解会越来越准确,提供的服务也会越来越贴合用户的实际需求。
    • 智能对话和场景理解:能够实现更智能的对话和场景理解,根据用户的对话上下文、当前的驾驶场景等因素,进行更加准确的回应和操作。例如,当用户在行驶过程中询问“附近有哪些适合休息的地方”,系统会结合当前的位置、时间、交通状况等信息,为用户推荐合适的休息场所。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2239401.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Elasticsearch中什么是倒排索引?

倒排索引(Inverted Index)是一种索引数据结构,它在信息检索系统中被广泛使用,特别是在全文搜索引擎中。倒排索引允许系统快速检索包含给定单词的文档列表。它是文档内容(如文本)与其存储位置之间的映射&…

excel-VLOOKUP函数使用/XVLOOKUP使用

多个窗口同时编辑表格,方便对照操作 使用开始-视图-新建窗口 将战区信息表的三列数据匹配到成交数据表上 可以使用VLOOKUP函数 有4个参数(必须要查找的值, 要查找的区域,要返回区域的第几列数据,一个可选参数查找匹…

netcore 静态文件目录浏览

环境:Net6 string dirPath "C:\\Users\\15298\\Pictures"; var fileProvider new PhysicalFileProvider(dirPath); app.UseStaticFiles(new StaticFileOptions {FileProvider fileProvider,RequestPath new PathString(("/files")) }); // …

1Panel修改PostgreSQL时区

需求 1Panel安装的PostgreSQL默认是UTC时区,需要将它修改为上海时间 步骤 进入PostgreSQL的安装目录 /opt/1panel/apps/postgresql/postgresql/data打开postgresql.conf文件 修改: log_timezone Asia/Shanghai timezone Asia/Shanghai保存后重启…

函数式接口和stream

函数式接口(Functional Interface)是Java 8引入的一个新特性,它只有一个抽象方法的接口。这意味着你可以将一个函数式接口作为参数传递给方法,或者将其实现为一个lambda表达式。函数式接口的主要目的是允许你以声明性方式处理操作…

Oracle 高水位线和低-高水位线(High Water Mark Low High Water Mark)

在Oracle的逻辑存储结构中(表空间-段-区-块),数据是存在数据段中的,通常一个表就是一个数据段,而段最终又由许多数据块组成。当数据存入数据块时,需要对块进行格式化,高水位线(High …

科技资讯|Matter 1.4 标准正式发布,低功耗蓝牙助力其发展

连接标准联盟(CSA)宣布推出最新的 Matter 1.4 版本,引入了一系列新的设备类型和功能增强,有望提高包括 HomeKit 在内的智能家居生态系统之间的互操作性。 设备供应商和平台能够依靠增强的多管理员功能改善多生态系统下的用户体验&…

python练习-Django web入门

python -m pip install --user requests使用API调用请求数据 处理API响应 import requestsclass Requests:def request(self):url "https://www.toutiao.com/stream/widget/local_weather/data/?city北京"headers {"Accept": "application/json;…

元器件封装

元器件封装类型 为什么越来越多用贴片元件,而不是插件元件 为什么越来越多用贴片元件,而不是插件元件 1.体积小、质量小、容易保存和运输; 2.容易焊接和拆卸。抗震效果好。 贴片元件不用过孔,用锡少。直插元件最麻烦的就是拆卸&a…

[SaaS] 数禾科技 AIGC生成营销素材

https://zhuanlan.zhihu.com/p/923637935https://zhuanlan.zhihu.com/p/923637935

自顶向下逐步求精解决LeetCode第3307题找出第K个字符II题

3307.找出第K个字符II 难度:困难 问题描述: Alice和Bob正在玩一个游戏。最初,Alice有一个字符串word"a"。 给定一个正整数k和一个整数数组operations,其中operations[i]表示第i次操作的类型。 现在Bob将要求Alice按…

v-html 富文本中图片使用element-ui image-viewer组件实现预览,并且阻止滚动条

效果 导入组件 import ElImageViewer from "element-ui/packages/image/src/image-viewer"; components:{ ElImageViewer },模板使用组件 <el-image-viewerv-if"isShowPics":on-close"closeViewer":url-list"srcList"/>定义两…

Redis - 哨兵(Sentinel)

Redis 的主从复制模式下&#xff0c;⼀旦主节点由于故障不能提供服务&#xff0c;需要⼈⼯进⾏主从切换&#xff0c;同时⼤量 的客⼾端需要被通知切换到新的主节点上&#xff0c;对于上了⼀定规模的应⽤来说&#xff0c;这种⽅案是⽆法接受的&#xff0c; 于是Redis从2.8开始提…

使用wordpress搭建简易的信息查询系统

背景 当前有这样的一个需求&#xff0c;要实现让客户能够自助登录系统查询一些个人的信息&#xff0c;市面上没有特别符合我的需求的产品&#xff0c;经过一段时间的研究&#xff0c;想出了一个用wordpress实现简易信息查询系统&#xff0c;有两种方式。 方式一&#xff1a;使…

探索 Python HTTP 的瑞士军刀:Requests 库

文章目录 探索 Python HTTP 的瑞士军刀&#xff1a;Requests 库第一部分&#xff1a;背景介绍第二部分&#xff1a;Requests 库是什么&#xff1f;第三部分&#xff1a;如何安装 Requests 库&#xff1f;第四部分&#xff1a;Requests 库的基本函数使用方法第五部分&#xff1a…

【青牛科技】 GC6153——TMI8152 的不二之选,可应用于摇头机等产品中

在电子工程领域&#xff0c;不断寻求性能更优、成本更低的解决方案是工程师们的永恒追求。今天&#xff0c;我们要为广大电子工程师带来一款极具竞争力的产品 —— GC6153&#xff0c;它将成为 TMI8152 的完美替代之选。 一、产品背景 随着科技的飞速发展&#xff0c;电子设备…

基于yolov8、yolov5的番茄成熟度检测识别系统(含UI界面、训练好的模型、Python代码、数据集)

摘要&#xff1a;番茄成熟度检测在农业生产及质量控制中起着至关重要的作用&#xff0c;不仅能帮助农民及时采摘成熟的番茄&#xff0c;还为自动化农业监测提供了可靠的数据支撑。本文介绍了一款基于YOLOv8、YOLOv5等深度学习框架的番茄成熟度检测模型&#xff0c;该模型使用了…

艾体宝干货丨微突发流量检测与分析:IOTA让网络监控更精准

网络流量中的微突发问题常常难以察觉&#xff0c;但它们可能对网络性能产生显著影响。这篇文章深入探讨了如何利用IOTA来捕捉和分析微突发&#xff0c;帮助您快速有效地解决网络中的突发流量问题。 什么是微突发&#xff08;Microburst&#xff09;流量&#xff1f; 微突发是…

论文略读: ALPAGASUS: TRAINING A BETTER ALPACA WITH FEWER DATA

ICLR 2024 1 背景 大模型通常需要在有监督指令数据集上进行指令微调来加强指令遵循能力 但是广泛使用的数据集包含许多具有不正确或不相关响应的低质量样本&#xff0c;这对大模型微调具有误导性——>论文提出了一种简单有效的数据选择策略&#xff0c;使用ChatGPT自动识别…

【Android】ANR监控治理技术方案

一、 背景 1、 bugly针对crash监控做的比较好&#xff0c;但是对anr监控&#xff0c;早期版本监听 /data/anr 目录的变化可以拿到数据&#xff0c;但是现在高版本已经没有权限监听此目录&#xff0c;当前数据非常少&#xff0c;结合历次数据来看对我们解决ANR问题没有任何帮助…