GPT上车只为人车交互?车企还在憋大招

news2024/9/28 1:21:26

ChatGPT改造汽车的序幕已经拉开,奔驰率先出手。

不久前,梅赛德斯-奔驰将ChatGPT集成到了车机上,开启了为期三个月的测试,结果显示,它的语音助手不仅可以完成简单地指令,还能进行连续多轮对话,理解能力和响应质量都有较大提升。

理想、创维、蔚来等汽车厂商随即蜂拥而入,用前沿的GPT能力让车机智能化程度更上一层楼。车机也彻底从最初的“收音机”变成了功能丰富的智能终端,加上GPT“大脑”后,又开始从木讷、鸡肋的机器向行车伙伴转变。

而人车交互不是AI上车的尽头,自动驾驶才是未来。以往的自动驾驶解决方案过于依赖高精地图,一旦地图更新跟不上瞬息万变的路况,行车安全将受到威胁。AI大模型的进化升级,让车企们看到了机会。

让AI主动感知和决策,放弃对高精地图的依赖,正在成为一种主流趋势。几天前,理想汽车开启城市NOA(导航辅助驾驶)内测,它将BEV(Bird’s eye view,鸟瞰图)大模型作为主要解决方案,让汽车模仿人类“脑回路”驾车。通过连续学习,城市NOA还能被训练成用户通勤路线上“代驾”。

接棒互联网,AI正在对汽车进行更深层次的改造,四个轮子的大家伙越来越神似变形金刚。

车机+GPT 奔驰先出手

一场由内而外的“变形记”正在席卷汽车圈,从传统燃油动力到新能源,从驾驶工具到智能化产品。多年以来,科技驱使下,汽车不断变幻着外貌和内在,互联网改造汽车后,人工智能又来了。

梅赛德斯-奔驰在这股新浪潮中一马当先,要把ChatGPT移植进车机。

6月16日,奔驰为期3个月的ChatGPT测试计划在美国启动,它与微软合作,通过 Azure OpenAI 服务将ChatGPT集成到车机中。车主可以通过Mercedes me APP选择使用ChatGPT,还有更直观测试方式——直接在车内使用语音命令“Hey Mercedes,我想加入测试计划”,奔驰的MBUX 信息娱乐系统就会将语音助手“Hey Mercedes”自动接入ChatGPT。

过往,Hey Mercedes可以提供体育、天气等信息,并回答有关车辆周围环境的问题,还能控制用户的智能家居,这都是制式化的。ChatGPT加入把问答变灵活了,用户能询问目的地详细信息,获得晚餐建议,可以不断提出问题,连续收到回复。这是ChatGPT的看家本领。

 奔驰将ChatGPT集成到车机系统

当前,仅在美国地区约90万辆配备MBUX的奔驰汽车可以优先测试ChatGPT,奔驰打算利用这个初始测试期深入了解用户提出的请求,来确定未来开发的优先事项,以及调整不同市场和语言的推出策略。

关于接入ChatGPT这事儿,奔驰给了一个充满感性的声明,“一切目标都围绕着重新定义您与梅赛德斯的关系。”奔驰要让ChatGPT重塑人车交互体验,更形象的类比是,车机从一个木讷的注重功能性的机器“活”起来了,向着车内生活伙伴的角色转变。

奔驰之后,国内的汽车厂商率先跟上。

6月19日,理想汽车推出了自研的认知大模型“Mind GPT”,这个大模型由理想的空间算法团队研发。据说大模型训练的开始日期早在ChatGPT发布之前,Mind GPT基于数10 TB的原始训练数据,使用了1.3万亿个Token进行基座模型训练,能识别声纹和语音内容,还能听懂方言,同时能为车主提供出行规划,甚至具备AI绘画和AI计算等功能。

理想透露,Mind GPT发布后,理想汽车将新增LUI(用户语言界面)交互方式,“比如你想吃个火锅,只需要呼叫理想同学,车机界面就会生成火锅的图片供你选择,随后自动算好出行路线。”

创维汽车也在近日宣布,旗下两款车型创维EV6Ⅱ及创维HT-iⅡ在智能车机上集成了ChatGPT,此外,长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企都在上个月申请了GPT相关商标。

GPT上车成为一股潮流。奥纬咨询董事合伙人张君毅认为,GPT技术的接入能够提升车的人机交互能力和综合环境问题的互动能力。今后车企在同一价位段的硬件方面的品牌差异会越来越小,当舒适性、安全性、动力和续航里程上竞争难以产生太大的差异时,卷智能就成了必然选择。

给智能座舱装上“大脑”

ChatGPT上车又是汽车进化史上可书的一笔,最前沿的自然语言处理大模型应用到了人类的出行工具上,更丰富的车内生活体验将会出现。

回望30多年前,车载娱乐功能和车机智能化,尚是一片空白。第一代车机诞生于上世纪80-90年代,当时人们普遍的关注点还是汽车的发动机、底盘和变速箱“三大件”,突然有一些车型不仅能听收音机,还能吞进磁带,自由播放音乐,汽车有了一些第二生活空间的影子。

第二代车机则加入了DVD播放、MP3,娱乐性凸显的同时,汽车又向驾驶体验迈了一步,加入了车载导航。此时,解决“路盲”问题成为一个主流趋势。许多老司机一定记得,在没有车联网的时代,凯立德车载导航成了高端车型的标配,它使用GPS卫星定位和存在车机里的地图包数据,实现相对准确的导航精度。

 古早期的车机中控屏

但除了导航和听歌、收音之外,当时的人们并不对车机抱有太多期待,车机也往往不是决定购车与否的主要因素。

进入21世纪,电子数码技术不断发展,手机的形态先变了。循着这个进化思路,车机上出现大屏,智能化成为新卖点。基于linux、WinCE、安卓等系统的车机陆续被汽车厂商采用,而后汽车不仅可以免费实时导航,还具备全景可视系统、汽车驾驶辅助系统,比如360度影像等。

当汽车连了网,一切由变得更不一样。在线观影、路书、语音控制、预约保养、远程诊断等功能被加入车机,中控台的屏幕越来越大,功能越来越多,一些厂商直接在驾驶室装上了比平板电脑还大的显示屏,甚至厂商们近来卷起了“全面屏”,就连副驾和后排都要装上屏幕。

终于,“第三块屏”的概念越来越显眼,主机厂们希望,车机能够成为继电脑和手机之后,影响人类生活的第三代智能终端。用富含科技感的车机占领用户心智,拓展更多的商业模式,成为现在的车企们攻坚的方向。

现在,“车机”这一原始概念逐渐被“智能座舱”所替代。蔚来甚至造出了“第二起居室”的新词,不仅车机越来越智能化,车企们开始卷内饰用料、音响系统、灯光系统,蔚来还发布了一款AR眼镜,支持随车巨幕观影;理想L9甚至配备了一个后排冰箱,让汽车成了可移动的房子。

但无论是车机还是智能座舱,语音对话一直都是发展相对滞后的功能,考虑到驾驶安全性,语音操控又十分必要。

过去近十年来,几乎所有车企和大量的AI创业公司,在自然语言处理领域投入颇多,希望优化车内的语音交互体验。许多车机都能回答简单的预设命令,比如调高温度、预报天气等,升级和创新围绕拓宽自然语言口令展开,比如当用户说“有点热”后,车机可以打开空调制冷或调低温度。

但想让车机听懂更多“人话”,比如用各种方言规划路线、甚至找餐馆,可能还真不如车主自己用手机地图和大众点评来得有效,更丰富的语音式人车交互陷入瓶颈,直到ChatGPT出现。

自然语言大模型产品(ChatGPT、文心一言、通义千问等)直接开放给C端使用,使智能座舱的开发者们看到了曙光。强大的理解能力和逻辑推理能力,有望让车机成为行车助手,暗藏商业可能。

比如,车主可以告诉语音助手,“帮我找出目的地附近有团购优惠、评分超过4.5的火锅店,一会有5个人用餐,给我预定一下位置,再看一下哪里停车方便。”放在以前,车机绝对无法一次性理解如此多的信息,但对ChatGPT来说,这只是它的基操,只要实时数据源足够多,需求被满足的可能性能够无限大。

GPT的加入并不只是让对话更流畅了,而是让车机具有了“大脑”,不仅能回答问题,还能理解需求并生成答复。至于智商有多高、反应有多快,取决于汽车厂商对上车大模型的训练能力,以及敢不敢“氪”金上更牛的硬件(芯片)。

AI如何让自动驾驶“脑回路”更像人?

车内生活的丰富,让汽车逐渐成长为一个充满温情的载体,它不再是枯燥、冰冷的代步工具,转而成为一个舒适的生活空间。

而AI主导的汽车进化还不止于GPT上车,它对自动驾驶的技术推动更加意义重大。

传统的自动驾驶研究方法是通过采集大规模的驾驶数据、测试更长的驾驶里程来覆盖所有可能的驾驶场景,以确保发生突发状况时汽车有预先设定的应对方案。但突发状况的复杂程度往往难以预料,一旦系统中没有应对某种特殊突发状况的预案,驾驶安全就将受到极大的威胁。

这也是为什么当前的辅助驾驶系统,必须要求驾驶员手扶方向盘以应对实时突发情况。而AI的学习能力将有可能改变这个现状。

不久前,清华大学研究团队提出了自动驾驶“可信持续进化”技术,该技术是基于动态评估AI的可信赖程度进行学习训练,保证自动驾驶汽车在遇到陌生新场景时,其驾驶能力可从基础性的主动避让开始持续提升,在确保安全前提下达到更好的驾驶表现。

简单理解,利用AI,自动驾驶功能的汽车能主动学习、熟悉各种新遇到的场景,进行持续进化,随着驾驶里程与数据量的累积,性能得到持续提升。

理想汽车正将AI大模型用到自动驾驶领域。6月17日,理想宣布开启城市NOA(导航辅助驾驶)内测,并将在下半年向用户开放通勤NOA功能。与常规解决方案不同的是,理想采用了BEV(Bird’s eye view,鸟瞰图)大模型,来实时感知和理解环境中的道路结构信息,让汽车更能模仿人类驾驶员的操作习惯。

以往多数汽车上的辅助驾驶系统,大多是采用高精地图方案,相当于实时把路况投喂给自动驾驶系统,让其做出决策。但在复杂的城市道路中,总会有高精地图无法覆盖和无法及时更新的区域,这成为了该方案的一大缺点。而采用BEV大模型后,相当于AI主动感知实时路况,自主决策驾驶操作。

当然,BEV也有缺点,例如在一些跨度较大的路口,通行车辆较多,传感器视野容易被遮挡,导致车端实时感知的结果会丢失局部的信息。为了弥补这一不足,理想据称搭配了神经先验网络(NeuralPriorNet,简称NPN)和端到端的信号灯意图网络,前者的作用相当于每当车走过自动驾驶车队走过的路口,都有图像参考;后者则是学习大量人类司机在路口对于信号灯变化的反应,帮助自动驾驶系统理解交通信号。

 使用NPN网络弥补BEV模型缺陷

根据实际的测试反馈,理想城市NOA还不能够完全实现自动驾驶,它存在转弯不够及时和不擅长超车的问题,此外,面对一些特殊障碍物,算法无法做出决策,必须进行人工接管。

不过,相比于传统的训练方式,大模型的引入最大的改变还是让自动驾驶系统有了更强的学习能力,这意味着自动驾驶能力会逐渐提升。典型的案例是,理想汽车推出了通勤NOA功能,在开启该功能之前,车主需要先设定通勤路线,通过日常通勤时的自动化训练积累NPN特征,大约1至3周时间后,AI可以成长为通勤路段的“代驾”。

这个过程体现了AI大模型加持下的自动驾驶汽车操作思路:先学习和熟悉路况,再进行辅助驾驶,“脑回路”更像人类了。

用AI大模型研发自动驾驶鼻祖不是理想,而是特斯拉。早在2021年,特斯拉就曾推出基于Transformer架构的BEV感知方案,随后华为、百度等企业也在“BEV+Transformer”上展开布局,目前,特斯拉、小鹏汽车、问界汽车等都在落地和不断优化类“城市NOA”功能。

大模型的持续进化,很可能让车企们找到了自动驾驶技术的突破方向,摆脱对高精度地图的依赖是第一步。现在的自动驾驶还停留在“辅助驾驶”阶段,未来,你很有可能会将你的交给AI接管。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/712221.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CSS 高阶小技巧 - 角向渐变的妙用!

本文将介绍一个角向渐变的一个非常有意思的小技巧! 我们尝试使用 CSS 绘制如下图形: 在之前,类似的图案,其实我们有尝试过,在 单标签实现复杂的棋盘布局 一文中,我们用单标签实现了这样一个棋盘布局&#x…

从0到1:一对一交友app开发的步骤和技巧

今天与大家分享一下一对一交友app开发的步骤和技巧。 步骤 步骤一:确定目标用户群 在开发一对一交友app之前,首先需要确定目标用户群。这是非常重要的一步,因为只有了解目标用户的需求和偏好,才能更好地开发出一款满足他们需求…

C# 元组

文章目录 C# 元组Tuple 类ValueTuple 类ValueTuple 与 Tuple的区别System.ValueTuple 类型的值是可变的System.Tuple 类型的值是不可变的System.ValueTuple 类型的数据成员是字段 System.ValueTuple 与匿名类在使用Linq查询时,如何权衡使用元组还是匿名类权衡主要区…

爆肝整理,性能测试-测试工具选型(各个对比)卷起来...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 性能测试和功能测…

cf 比赛 04

2021.04.30 训练地址 B. The Number of Pairs 令 u g c d ( a , b ) u gcd(a, b) ugcd(a,b),设 l c m ( a , b ) k ∗ u lcm(a, b) k * u lcm(a,b)k∗u,则原式可写为 u ∗ ( k ∗ c − d ) x u * (k * c - d) x u∗(k∗c−d)x,那么…

leetcode 222. 完全二叉树的节点个数

2023.7.3 用层序遍历遍历一遍二叉树&#xff0c;然后遍历的每个节点都进行一次计数&#xff0c;直接上代码&#xff1a; class Solution { public:int countNodes(TreeNode* root) {queue<TreeNode*> que;int ans 0;if(root nullptr) return ans;que.push(root);while…

speech_recognition + PocketSphinx 实现语音唤醒

文章目录 前言环境下载中文包制作激活词 编码实现唤醒 前言 这玩意是干啥的呢&#xff0c;主要的话就是最近有个小项目&#xff0c;需要在ros上面实现一个语音唤醒的操作。同时要求&#xff0c;离线操作&#xff0c;只能使用离线的SDK。然后逛了一圈&#xff0c;发现科大讯飞的…

22.RocketMQ之NameServer启动流程

NameServerController启动流程总览 启动类&#xff1a;org.apache.rocketmq.namesrv.NamesrvStartup#main java public static void main(String[] args) { main0(args); } java public static NamesrvController main0(String[] args) { try { //创建NamesrvController Names…

因Spring与SpringMVC配置信息写反导致Spring无法自动托管对象实例

因Spring与SpringMVC配置信息写反导致Spring无法自动托管对象实例 异常提示 03-Jul-2023 11:25:24.491 警告 [RMI TCP Connection(3)-127.0.0.1] org.springframework.context.support.AbstractApplicationContext.refresh Exception encountered during context initializat…

【485. 最大连续 1 的个数】

目录 一、题目解析二、算法思路三、代码实现 一、题目解析 二、算法思路 三、代码实现 class Solution { public:int findMaxConsecutiveOnes(vector<int>& nums) {int ret0;int left0,right0;for(;right<nums.size();right){if(nums[right]!1){retmax(ret,right…

SQL高级教程

SQL TOP 子句 TOP 子句 TOP 子句用于规定要返回的记录的数目。 对于拥有数千条记录的大型表来说&#xff0c;TOP 子句是非常有用的。 注释&#xff1a;并非所有的数据库系统都支持 TOP 子句。 SQL Server 的语法&#xff1a; SELECT TOP number|percent column_name(s) F…

BOSHIDA DC电源模块在自动化设备中的应用

BOSHIDA DC电源模块在自动化设备中的应用 DC电源模块是一种用于提供电源的设备&#xff0c;可以将交流电转换为直流电&#xff0c;并提供稳定、可靠的电源输出。在自动化设备中&#xff0c;DC电源模块常用于驱动直流电机、控制电磁阀等各种设备。以下是DC电源模块在自动化设备…

初学Spring boot (四) JSR303数据校验及多环境切换

学习回顾&#xff1a;初学Spring boot &#xff08;三&#xff09; yaml配置注入 一、JSR303数据校验 1、先看看如何使用 Springboot中可以用validated来校验数据&#xff0c;如果数据异常则会统一抛出异常&#xff0c;方便异常中心统一处理。我们这里来写个注解让我们的name只…

MySQL数据库第二课----------认识简单命令-----悄悄的变大牛

作者前言 欢迎小可爱们前来借鉴我的gtiee秦老大大 (qin-laoda) - Gitee.com ——————————————————     ———————————— 目录 操作系统 桌面操作系统 服务器操作系统 嵌入式操作系统 移动设备操作系统 常用 Linux 命令的基本使用 为什么要学…

一个11g RAC到单机dg数据不同步问题

客户通过监控发现&#xff0c;主库dest_id2&#xff08;主库往dg库传输&#xff09;归档错误&#xff0c;归档无法从主库传到dg库。 登录主库&#xff0c;查询dest_id2的error&#xff0c;报错提示主库两个节点都无法登录到备库。 以前也遇到过这种情况&#xff0c;一般从主库复…

系统的灵活所在——扩展性

什么是扩展性&#xff1f; 在保持软件不变的情况下&#xff0c;计算机系统性能可以随系统规模扩充而提高的特性。它以添加新功能或修改完善现有功能来考虑软件的未来成长。可扩展性是软件拓展系统的能力。 我们都知道企业在选型时会从多个方面进行综合评估&#xff0c;主要包括…

Python入门教程+项目实战-14.5节-函数装饰器

目录 14.5.1 理解函数装饰器 14.5.2 理解闭包函数 14.5.3 使用闭包进行功能扩展 14.5.4 更优雅的做法&#xff1a;装饰器语法糖 14.5.5 知识要点 14.5.6 系统学习python 14.5.1 理解函数装饰器 在进入正题前&#xff0c;先看一段有关"装饰"的词语解释&#xf…

设计模式第20讲——备忘录模式(Memento)

目录 一、什么是备忘录模式 二、角色组成 三、优缺点 四、应用场景 五、代码实现 5.0 UML类图 5.1 EditorMemento——备忘录&#xff08;Memento&#xff09; 5.2 Editor——源发器&#xff08;Originator&#xff09; 5.3 History——管理者&#xff08;Caretaker&a…

java常见算法篇【完整版】

14-常见算法 基本查找/顺序查找 从0索引依次向后查找 二分查找/折半查找 前提条件&#xff1a;数组中的数据必须是有序的核心逻辑&#xff1a;每次排除一半的查找范围 package io.xiaoduo.arithmetic;public class Test1 {public static void main(String[] args) {int[…

2023年10个最佳商业WordPress主题(经过测试和专家挑选)

正在寻找最好的商业WordPress主题&#xff1f; 为了帮助您找到适合您业务的完美主题&#xff0c;我们浏览并测试了15个最受欢迎的商业WordPress主题……然后将列表缩减为10个&#xff0c;为您提供最好的。 您需要制作一个成功的商业网站&#xff0c;以激发对潜在客户的信任并…