AI大模型如何赋能智能座舱

news2024/11/24 12:03:47

AI 大模型如何赋能智能座舱

从上海车展上,我们看到由于智能座舱配置性价比较高,已经成为车企的核心竞争点之一,随着座舱硬件规模化装车,蔚小理、岚图、极狐等新势力开始注重座舱多模态交互,通过集成语音/手势/触控打造智能化差异体验。车展期间,百度、商汤、华为等拥有大模型的厂商相继推出智能座舱产品,我们认为 AI 大模型的落地,将加速赋能座舱语音助手向“AI 智能管家”升级,有望推动座舱人机主动式交互时代的到来。

智能座舱演进到了什么阶段?——全面朝 4.0 多模态阶段迈入

我们将汽车座舱从机械时代到智能时代的发展划分为 5 个阶段,可以看到现阶段下座舱正处于从 3.0(以特斯拉 Model3/Y 的简配为代表)到 4.0(以理想 L9 的高配为代表)的演进阶段。该阶段重要特征即视听触多模块硬件加速升级,丰富汽车座舱智能生态。我们参加了 2023 年上海国际车展,车展中我们看到造车新势力、传统车企、Tier1 等新产品的展出和发布。我们看到智能座舱配置的性价比推动其渗透率快速提升,已经由原先造车新势力“一骑绝尘”的方式,转换全行业“齐头并进”。搭载方案转向座舱视听触多模态硬件全方位升级,印证了 4.0 时代加速到来,

大模型如何赋能座舱?——“AI 管家”打造差异化体验

我们认为目前多模态交互的背后仍是通过“语音+触摸屏”来实现控制,靠乘客主动发起方能实现的指令识别型“被动式交互”。大模型的落地,将加速软件能力升级,推动座舱 5.0 人机主动式交互时代的到来。

大模型有望:

(1)通过赋能语音助手对于乘客的语音语义理解能力。打通其在视觉、听觉、触觉等多模态应用上的操控力,形成深度的乘驾人机主动式互动体验。

(2)摆脱座舱硬件堆栈同质化。通过大模型赋能语音助手或将成为“AI 智能管家”,因算法不同而具有不同的特色和功能,进而形成车企自身独特的智能化差异,构筑核心竞争力。

比较看好的产品方向:

(1)视觉:传统车载 TFT-LCD 显示技术的快速迭代,逐步趋向大屏、高清化。此外 HUD 结合 AR 技术兴起,法规允许 E-Mirror 上车,多态显示技术交互。我们测算 23-30E 全球车载显示硬件规模有望达 1723 亿元,CAGR 为 10.2%。

(2)听觉:通过搭载更多数量/不同区位扬声器实现环绕体验,增加数字功放/低音炮等器件提升听觉质感。我们测算 23-30E 全球座舱声学硬件规模有望达到约 483 亿元,CAGR 为 14.2%。

(3)触觉:3DTOF 作为最适合 AI 视觉的传感器,用于支持手势交互/DMS/乘客识别功能,目前已经在理想、问界、BBA 等率先上车,大模型发展有望驱动需求快速提升.

智能座舱:4.0 至 5.0,从多模态到大模型

如果我们将汽车座舱从机械时代到智能时代的发展划分为 5 个阶段,我们认为现阶段下座舱正处于从 3.0(以特斯拉 Model3/Y 的简配为代表)到 4.0(以理想 L9 的高配为代表)的全面演进阶段。该阶段重要特征即视听触多模块硬件加速升级,丰富汽车座舱智能生态。

(1)座舱 1.0-2.0:最开始座舱的 1.0 时代,仅有机械仪表盘和车载收音机等寥寥数个车载元件,座舱主要以功能性为主。行至座舱 2.0 时代(20 世纪 80 年代后),随着信息技术革命,中控屏应运而生,可以初步显示行车信息及实现舱内控制功能,同时电气式仪表盘广泛应用,为驾驶员提供更多辅助信息。车载 DVD 功能的出现开启了汽车座舱娱乐化属性的重要一步。

(2)座舱 3.0-4.0:后随着汽车实现区域集成架构,高性能、高集成、高扩展性的座舱域控制器以开始助推智能化加速。我们认为在座舱 3.0 时期(2010 年后),中控屏、液晶仪表盘、音响等基础视听硬件,以及车灯、座椅等均得到了全方位升级;此外 Carplay 等应用上车也开启了车机互联的时代。随后国内造车新势力不断推进座舱往 4.0 时代发展(2020 年后),我们看到 HUD、副驾/后排屏、电子后视镜开始陆续上车,杜比音效、AI语音及手势交互甚至 VR 眼镜等功能不断创新,快速丰富座舱智能化体验。

(3)座舱 5.0:展望未来座舱 5.0 生态,在中央集成架构下,整车智能化水平将达到一个新的高度。我们认为随着大模型的赋能,AI 语音助手将加速转变为“AI 智能管家”,进行深度人机情感交互。此外,参考 2023 年 CES 大会上宝马 i Vision Dee 概念车的构思:全息投影、透明显示、车灯投影、电子墨水、裸眼 3D 等元素或进一步升级。

图片

2023 年上海国际车展看到造车新势力、传统车企等新产品的展出和发布。智能座舱的渗透已经由原先造车新势力“一骑绝尘”的方式,转换全行业“齐头并进”,行业搭载方案转向座舱多模态升级,印证了 4.0 时代加速到来。具体而言包括:1)视觉:车载屏幕向大屏化、多屏化、高清化的方向发展,HUD 加速上车。2)听觉:扬声器、功放数量增加,致力于打造沉浸式听觉享受。造车新势力:蔚来发布第二代数字座舱,搭载于 EC7、ET7、新款 ES8;理想:L7 延续L9/L8 亮眼座舱配置,打造家庭座舱体验;极狐:20.3 英寸中控屏与副驾/仪表/HUD 多屏交互,装载哈曼卡顿音响;广汽埃安:Hyper GT14.6 寸 2.5k 中控屏+23 个 HIFI 扬声器实现 3D 环绕立体声场。

传统车企:宝马:X1 搭载第 8 代 BMW iDrive 操作系统,配备 10.7 寸悬浮式曲面屏及HUD,满足驾乘者的个性化需求;大众:新车型 ID.7 VIZZION 主打智能乘坐空间,内置15 英寸 2k 悬浮中控屏及 AR-HUD,配备哈曼卡顿音响。

图片

4.0 阶段是座舱往多模态演进的时期,硬件升级>软件升级。目前多模态硬件的堆栈背后仍是通过“语音+触摸屏”来实现控制,主要交互停留在“命令识别”层面,靠乘客主动发起方能实现的“被动式交互”,各模态之间仍互为独立。

往后随着硬件逐步上车,座舱交互性和操控便捷性的重要程度逐步凸显。车企开始探索舱内智能化交互,“语音助手”或成为核心交互载体。看到目前新势力在座舱交互上已经有所突破。例如智能化领先的小鹏语音助手小 P 可以支持多指令识别、离线响应。蔚来人车交互系统 NOMI 具有较强的学习功能和语音指令识别功能,此外还能根据不同状况表现出相对应的情感,与车主进行简单对话。而理想的“理想同学”同样属于可以由关键词触发,能够执行语音/手势/触控命令的初级智能 AI。

往后看大模型的落地,或将加速软件能力升级,推动座舱 5.0 人机主动式交互时代的到来。大模型有望:(1)通过赋能语音助手对于乘客的语音语义理解能力,提升全功能操控力。打通其在视觉、听觉、触觉等多模态应用上的操控力,形成深度的乘驾人机主动式互动体验。(2)打造智能生态差异化,摆脱座舱同质化。通过大模型赋能语音助手或将成为“AI智能管家”,因算法不同而具有不同的特色和功能,进而形成车企自身独特的智能化差异。

商汤日日新大模型亮相车展,大模型接入座舱。4 月 18 日上海车展上,商汤亮相了其“日日新 Sensenova”大模型,并展示了其中文语言模型“商量 SenseChat”以及“如影 SenseAvatar”等与座舱的结合,我们看到通过大模型可以赋予座舱多种生成式 AI 能力,提供包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,应用场景也可以拓展到娱乐、办公、购物、休息等。

1) AI 数字人:根据乘客偏好设置,形成数字虚拟人与乘客进行交流,形象趋近于“AI 座舱管家”,是乘客与车机的交互对象。

2)信息查询强化:通过语音询问乘客可以获得具体信息查询输出,此外还包括关于餐厅推荐、旅行路径规划、给儿童创造读物的创意性输出。

3)图片自动生成:类似 Midjourney 可以为乘客自动生成各种各样的图片。

4)安全识别:可以根据乘客是否登记分为嘉宾/主人,可以根据不同乘客的记录的偏好推荐其合适的内容产品。同时具备更好的 DMS(驾驶员监测)、OMS(乘客检测)、儿童滞留等功能体验。

5)API 接入:支持外接第三方应用,协助实现会议管理、购物、差旅等功能。

图片

百度推出座舱产品车载 OS 和语音 SDK,文心一言于多家用户开展内测。百度 Apollo 在上海车展前夕举办汽车智能化发布会,发布了全新升级的驾舱图产品矩阵,座舱方面百度发布车载 OS 和语音 SDK。其中,语音 SDK 基于大模型的本地化部署,具有全双工和毫秒级响应的优点,可以为车企提供更先进而出色的智能座舱体验。百度 SDK 突出优势包括:(1)将一切座舱功能集成到语音助手,可以通过语音实现舱内全功能调节;

(2)支持“多路对话”,不同的乘客可以在同一时间与语音助手展开交流并下达指令。目前包括集度、吉利、长城、红旗、岚图、东风启辰等主机厂已经宣布接入基于文心大模型的生成式对话产品文心一言(ERNIE Bot),开启自身座舱大模型的内测。

华为积极布局座舱 AI,大模型于秋季首发 M9 上落地。华为盘古大模型基于鲲鹏和昇腾算力底座,由 NLP(中文语言)大模型、CV(视觉)大模型、科学计算大模型、多模态大模型和 Graph(图网络)大模型 5 个模型组成。4 月 17 日车展前夕,在华为 nova11 系列及全场景新品发布会上,余承东宣布 2023 年秋季发布 AITO 问界 M9 将搭载 AI 大模型。

其语音助手“小艺”通过领先的多模态自适应技术,针对语速、语音、文本,对用户指令进行多维度综合判断,可以实现类似人与人的主动交流。目前“小艺”已经能够:

(1)根据日常通勤的情况自动提供通勤道路异常的提醒;(2)判断长途驾驶场景时,检测到车主有疲劳驾驶状态主动打开座椅按摩;车内午休/通勤回家后打开自动小憩模式,记录用户喜欢的氛围。(3)推荐适应当前车辆情况的驾驶模式;(4)停车找位的好帮手。

图片

据高工智能汽车研究院,2022 年中搭载智能数字座舱(大屏+语音+车联网+OTA)前装标配交付 795.05 万辆,搭载率为 39.89%,仍有较高渗透空间。市场规模方面,根据 IHSMarkit 预测,全球智能座舱市场规模将从 2021 年的 420 亿美元增长到 2030 年的 681 亿美元,2022-2030 年 CAGR 为 5.52%。IHS 预测国内智能座舱市场增速领先全球,国内规模从 2021 年 99 亿美元预计提升至 2030 年 247 亿美元,2022-2030 年 CAGR 为 10.69%,我国智能座舱规模全球占比将从 2021 年 24%左右上升到 2030 年的 36%。

图片

现阶段下智能座舱已经处于全面向 4.0 阶段发展的时期,已经从新势力领军转换

为行业内齐跑。硬件的装载是实现软件层交互的基础,座舱硬件已率先迎来大规模上车机遇,首先看好视听触多模态硬件:显示、音响以及 AI 视觉硬件 TOF 模组等快速装车,车端业务有望高速增长。在智能座舱大模型生态发展下,拥有大模型和机器视觉技术布局的软件层企业同样有望受益。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1689962.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue速成学习笔记

这两天速成了一下Vue,在这里记录一下相关的笔记,之后有时间详细学Vue的时候再来回顾一下! 一、Vue理解 1、Vue的核心特征:双向绑定。 在网页中,存在视图和数据。在Vue之前,需要使用JavaScript编写复杂的逻…

电脑同时配置两个版本mysql数据库常见问题

1.配置时,要把bin中的mysql.exe和mysqld.exe 改个名字,不然两个版本会重复,当然,在初始化数据库的时候,如果时57版本的,就用mysql57(已经改名的)和mysqld57 代替 mysql 和 mysqld 例如 mysql -u root -p …

Redis(十二) 持久化

文章目录 前言Redis实现数据的持久化Redis实现持久化的策略RDB手动触发RDB持久化操作自动触发RDB持久化操作 AOFAOF重写机制 前言 众所周知,Redis 操作数据都是在内存上操作的,而我们都知道内存是易失的,服务器重启或者主机掉电都会导致内存…

面试八股之MySQL篇4——事务篇

🌈hello,你好鸭,我是Ethan,一名不断学习的码农,很高兴你能来阅读。 ✔️目前博客主要更新Java系列、项目案例、计算机必学四件套等。 🏃人生之义,在于追求,不在成败,勤通…

生命线上的高效传递:了解下医院内、外网文件交互方式的革新之路

在医院的日常运营中,普遍采用内外网隔离的建设方式。内网集信息管理、通讯协作、资源共享、业务流程管理于一身,承载了医院的医疗核心业务,如HIS(医院信息系统)、LIS(实验室信息系统)、EMR&…

如何灵活运用keil工具进行问题分析(1)— 解决日常程序卡死问题

前言 (1)如果有嵌入式企业需要招聘湖南区域日常实习生,任何区域的暑假Linux驱动实习岗位,可C站直接私聊,或者邮件:zhangyixu02gmail.com,此消息至2025年1月1日前均有效 (2&#xff0…

山脉数组的峰顶索引 ---- 二分查找

题目链接 题目: 分析: 我们很明显, 可以从峰值位置将数组分成两段, 具有"二段性", 所以可以用二分查找因为arr是山峰数组, 不存在相等的情况如果arr[mid] > arr[mid 1], 说明mid的位置可能是峰值, 移动right mid如果arr[mid] < arr[mid 1], 说明mid的位置…

Java基础之异常(简单易懂)

异常 1.JAVA异常体系 &#xff08;1&#xff09;Throwable类(表示可抛)是所有异常和错误的超类&#xff0c;两个直接子类为Error和Exception,分别表示错误和异常;其中异常类Exception又分为运行时异常和非运行时异常&#xff0c;这两个异常有很大区别&#xff0c;运行时异常也…

【分享笔记】符尧:预训练、指令微调、对齐、专业化——论大语言模型能力的来源

分享时间&#xff1a;2023.2 目录 模型家族scaling law和涌现能力模型不同阶段pretrainingintruction tuningalignment upper bound和lower bound 模型家族 看模型要从演化家族来看&#xff0c;而不能单独看&#xff0c;很多人认为一些能力并不是RLHF激发出来的&#xff0c;而…

【区块链】智能合约漏洞测试

打开Ganache vscode打开智能合约漏洞工程 合约内容 pragma solidity >0.8.3;contract EtherStore {mapping(address > uint) public balances;function deposit() public payable {balances[msg.sender] msg.value;emit Balance(balances[msg.sender]);}function with…

前端工程化07-常见的包管理工具npm、yarn、cnpm、npx、pnpm

8、包管理工具 8.1、包管理工具概述 npm包管理工具、在安装node的时候这个东西就已经安装过了&#xff0c;通过npm去管理包的时候这个时候回有一个配置文件叫做package.json,他是以json的方式来书写对应的一个配置文件&#xff0c;这个配置文件是可以添加特别多的一些字段的&…

d3dx9_41.dll是个什么东西?d3dx9_41.dll文件丢失的解决方法

随着软件技术的不断发展&#xff0c;电脑用户可能会遇到各种系统错误和问题&#xff0c;其中之一就是动态链接库&#xff08;DLL&#xff09;文件的丢失。d3dx9_41.dll文件丢失是一个常见的问题&#xff0c;它通常会在运行依赖于DirectX图形技术的游戏或应用程序时被报告。这个…

MySQL中如何知道数据库表中所有表的字段的排序规则是什么?

查看所有表的字段及其排序规则&#xff1a; 你可以查询 information_schema 数据库中的 COLUMNS 表&#xff0c;来获取所有表的字段及其排序规则。以下是一个示例查询&#xff1a; SELECT TABLE_SCHEMA, TABLE_NAME, COLUMN_NAME, COLLATION_NAME FROM information_schema.COL…

影视解说5.0版零基础视频课程

课程简介 现在还能做解说吗、不会写解说文案怎么解决、不会配音怎么解决、如何找到合适的素材资源、如何变现…这是很多想做解说的伙伴最关心的几大问题。比如文案&#xff0c;我们推荐一个网站&#xff0c;10分钟搞定一篇文案&#xff0c;配音可以真人配音也可以软件配音。5.…

Windows11的这个地方暴露着你的隐私,把它关掉避免尴尬

前言 现在的电脑真的是越来越智能化&#xff01;现在有很多小伙伴都是用着Windows11的吧&#xff01;用习惯了Windows11之后&#xff0c;突然发现它还是挺顺手的。 但不知道你有没有发现&#xff0c;Windows11上面有个地方暴露着你的隐私。这个隐私可能是某个小姐姐的图片&am…

Android 12系统源码_多窗口模式(二)系统实现分屏的功能原理

前言 上一篇我们具体分析了系统处于多窗口模式下&#xff0c;Android应用和多窗口模式相关方法的调用顺序&#xff0c;对于应用如何适配多窗口模式有了一个初步的认识&#xff0c;本篇文章我们将会结合Android12系统源码&#xff0c;具体来梳理一下系统是如何触发多窗口分屏模…

StringMVC

目录 一&#xff0c;MVC定义 二&#xff0c;SpringMVC的基本使用 2.1建立连接 - RequestMapping("/...") ​编辑 2.2请求 1.传递单个参数 2.传递多个参数 3.传递对象 4.参数重命名 5.传递数组 6. 传递集合 7.传递JSON数据 8. 获取url中数据 9. 传递文…

mysql实战——异步复制(gtid复制)

一、搭建前准备 主库 192.168.1.76 从库 192.168.1.78 二、搭建 1、编辑配置文件 主库 server-id76 gtid_modeon enforce_gtid_consistencyon log_binmaster-binlog log-slave-updates1 binlog_formatrow 从库 gtid_modeon enforce_gtid_consistencyon server_id7…

huggingface笔记:LLama 2

1 前提tip 1.1 使用什么数据类型训练模型&#xff1f; Llama2模型是使用bfloat16训练的 上传到Hub的检查点使用torch_dtype float16&#xff0c;这将通过AutoModel API将检查点从torch.float32转换为torch.float16。在线权重的数据类型通常无关紧要&#xff0c;这是因为模型…

基于springboot+vue+Mysql的校园台球厅人员与设备管理系统

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…