BEV+Transformer架构加速“上车”,智能驾驶市场变革开启

news2024/11/26 4:28:57

BEV+Transformer成为了高阶智能驾驶领域最为火热的技术趋势。

近日,在2023年广州车展期间,不少车企及智能驾驶厂商都发布了BEV+Transformer方案。其中,极越01已经实现了“BEV+Transformer”的“纯视觉”方案的量产,成为国内唯一量产“纯视觉”智驾方案的厂商。

预计明年1月,极越01将在BEV+Transformer的基础上通过OTA升级更新OCC占用网络技术,极大提升异形障碍物识别能力和场景泛化能力,并实现BEV+Transformer+OCC的“纯视觉”高阶智驾完整技术体系。

除此之外,蔚来、小鹏、理想、百度、华为等主流主机厂、自动驾驶方案商在此前也推出了基于BEV+Transformer的智驾方案。

据了解,Nullmax就围绕BEV+Transformer技术架构进行了大量的工作,包括开发了一套强大的平台化BEV-AI整体技术架构。

这种技术可以在感知层面同时融合时间信息和空间信息,从而更好地支持多传感器、多任务的协同工作。通过支持多平台、多产品,以及任意传感器配置,为快速完成车企各项功能和任务的开发提供了可能性。

对于以量产见长的Nullmax来说,BEV+ Transformer这套技术架构可以说是打造易于部署、性能优秀、持续升级的行泊一体量产方案的根本。

现阶段,各大主机厂已经进入了城市NOA的规模化竞争周期,“高性价比”的高阶智能驾驶方案成为了各大主机厂决胜智能化下半场的关键点。

根据高工智能汽车研究院最新发布数据显示,2023年1-9月,中国市场(不含进出口)乘用车前装标配(软硬件)NOA交付新车37.73万辆,同比上年同期增长151.20%。未来几年内,NOA(从高速到城区)的普及化将是高阶智能驾驶市场的主旋律。

传统的智能驾驶技术主要依靠的是分析表达式和二进制编码交通规则算法来感知环境、规划轨迹和控制车辆,但这些方法在处理动态目标、遮挡等复杂环境时,往往面临着诸多的挑战。

图片

而BEV+Transformer方案能够很好地融合多传感器的特征,将多传感器收集到的图像信息转换成3D视角,从而提高感知和预测的准确率,进而成为了高阶智能驾驶的主流方案。

毫无疑问,伴随着BEV+Transformer的大规模应用,从芯片到传感器、软件算法、数据、模型部署等都将发生改变,整个智能驾驶供应链体系正在发生新一轮的重构。

高阶自动驾驶进入2.0时代

基于BEV+Transformer方案,高阶智能驾驶正在进入2.0时代。

一方面,伴随着智能驾驶感知系统进入新一轮的变革周期,“重感知、轻地图”成为了行业主流趋势。根据《高工智能汽车研究院》监测数据显示,目前市面上的智能驾驶系统,多摄像头依然是感知组合的必选项,而4D毫米波雷达、激光雷达则以辅助感知和冗余决策为主。

在这样的背景之下,车载摄像头作为智能驾驶感知系统的主力传感器,正在进入了全新的爆发式增长周期。根据《高工智能汽车研究院》数据显示,2023年1-6月中国市场(不含进出口)乘用车前装标配前向ADAS摄像头589.23万颗,同比增长29.29%;侧视ADAS摄像头225.64万颗,同比增长107.13%;舱内摄像头标配搭载量达到225.50万颗,同比增长82.40%。

与此同时,车用传感器也进入了快速迭代演进与技术升级的发展阶段,高性能、低成本、小体积成为了新一代传感器产品的主流发展趋势。以车载摄像头为例,其性能要求正在不断被提升,比如环视/侧视摄像头,传统的360环视更多只是解决人机交互的问题,图像的现实和拼接仅仅是辅助驾驶员的感知和决策,但BEV却对摄像头的分辨率与暗光成像等性能提出了更高的要求。

BEV+Transformer对于传感器的测量精度、鲁棒性、性价比和数量等都提出了更高的要求。”元橡科技相关负责人表示,双目立体视觉系统内专用深度引擎,直接输出图像+深度信息,在同等目距、像素条件下,具备测距更远、精度更高等独特的竞争优势。

据介绍,元橡科技的双目立体视觉系统通过双目系统识别道路类型,扫描前方路面信息得到高精度路面3D点云,不依赖激光和高精地图,是有效应对城市、高速等复杂NOA需求的高性价比解决方案。同时,双目立体视觉系统还可以与主动悬架系统结合,从而实现 “魔毯”垂向控制技术。

目前,元橡科技的“主动悬架路面预瞄系统”已经获得国内多家一线乘用车企前装定点,成为国内首家基于双目立体视觉的主动悬架路面预瞄系统的前装量产供应商。此外,元橡科技针对多种场景定制立体视觉解决方案来解决行业痛点,满足各类需求,也降低传感器使用门槛,从硬件、软件、平台、应用多层级与合作伙伴共建立体视觉新生态。

“仅提供硬件产品已经无法满足主机厂的需求,新一代传感器需要配套软件算法、测试验证等服务,为主机厂提供全方位的服务。”有企业人士表示,具备自主学习能力且能够支持AI技术处理大模型数据的新一代智能传感器,未来市场空间巨大。

另一方面,由于BEV+Transformer方案面临着大数据量的处理,对于大算力芯片的需求也在日益增强。在地平线看来,以数据为驱动、大规模并行运算的智能计算正取代逻辑计算,成为车载计算的核心。因此,如何在有限的面积、有限的功耗及成本下,实现更大的算力,已经成为巨大的挑战。

为此,地平线专门自主研发设计了具备“智能进化”能力的BPU创新性智能计算架构,有望在未来几年做到一至两个数量级的有效算力提升。

目前,经三代架构迭代、超400万片前装量产验证,地平线已经推出了最新一代智能驾驶加速引擎——BPU纳什,专为大参数量Transformer、大规模交互式博弈而设计,具有超异构计算架构,可显著增强算力多样性,是智能汽车时代的最优选择。

除此之外,地平线还推出了基于征程5的纯视觉BEV感知原型方案,并提出“感知决策一体化”的自动驾驶通用算法框架(UniAD),将智驾流程融合到基于Transformer的端到端网络框架中。

而近期,地平线还发布了新一代系列车载智能计算方案——征程6,基于统一的BPU纳什计算架构而来,是业界首款能够覆盖从低到高全阶智能驾驶需求的系列车载智能计算方案。

据了解,征程6旗舰专为新一代城区高阶智驾而生,拥有高集成度、高算力、高效率、高处理能力、高接入能力以及高安全等特点,算力高达560 TOPS,对BEV、Transformer等先进模型的支持效率在业界处于领先地位。

地平线相关负责人介绍,征程6旗舰搭载的BPU纳什架构实现了软硬结合的极致优化,专为大参数Transformer而生,面向高阶智驾前沿算法赢得最佳计算效率。同时,在强大计算性能的加持下,单颗征程6旗舰即可支持感知、规划决策、控制、座舱感知等全栈计算任务。

总体来看,伴随着高阶智能驾驶进入2.0时代,从芯片、传感器乃至智能驾驶系统的每一个模块都在发生“震动”。

新机会已经显现

尽管BEV+Transformer的技术路线优势众多,但是目前仍然面临着诸多的挑战。不过,这也意味着全新的市场机会已经显现。

一方面,由于Transformer训练与迭代需要海量数据做支撑,催生出了海量的数据采集、数据标注以及数据闭环打造的需求。

觉非科技联合创始人与技术合伙人刘斌表示,数据闭环是决定自动驾驶下半场竞赛的胜负关键。Transformer算法特性对数据的质量有较高的要求,需要设计多种渠道的数据采集闭环通道。除了动态目标感知数据闭环之外,还需要配合基于环境感知数据闭环的运用。

众所周知,BEV+Transformer方案可以将静态道路信息与动态道路信息统一到了同一个坐标系下,通过实时感知与转换,在行驶中即可实时生成“活地图”。

觉非科技认为,在BEV+Transformer架构下,道路数据越来越重要。“单车BEV实时感知范围较小,且许多特殊场景出现频率低等因素影响,很难实现所有驾驶场景数据的全覆盖。”刘斌表示,高精地图具备超视距等能力,在复杂路口、恶劣天气等复杂与极端场景下,地图与车端BEV感知数据闭环进行有效互补,才能提升高阶智能驾驶的安全性和驾驶体验。

另一方面,Transformer必将推动AI芯片市场格局进一步发生重构。资料显示,传统AI芯片主要针对CNN模型设计,常使用INT8量化操作来减少存储和计算的使用,对于精度的要求较低。但Transformer模型需要在较高的精度下进行,要求硬件具备高性能的浮点运算能力。

此外,由于Transformer模型的体量庞大,对于芯片性能要求严苛,除了需要进行底层软件等优化之外,SOC层面还需对缓存与带宽空间进行提升。

在这样的背景之下,爱芯元智、后摩智能等芯片厂商已经针对Transformer模型推出了相应的产品,率先抢跑AI大模型时代的新机会。

比如,爱芯元智自研了爱芯智眸®AI-ISP和爱芯通元®混合精度NPU两大核心技术,不仅可以对传感器特性做精细化建模、对影像处理策略进行极致优化设计,还可以充分利用AI算法的数据驱动特性,来获取更高维度的效果“助推”,全面提升智能驾驶疑难场景下的表现力。

目前,爱芯元智已基于自研的两大核心技术爱芯智眸®AI-ISP和爱芯通元®混合精度NPU,研发了M55和M76两个系列智驾芯片。

其中,爱芯元智推出的车规级主控芯片M55H,其在图像处理、算力、安全性和功耗等关键指标实现了全面突破。比如M55H首创了AI ISP技术,实现黑夜成像、防抖除模糊、去雾除紫边等多项图像增强,大幅提升复杂环境感知能力,保障出行安全。而其采用自研混合精度NPU,算力性能可达同级产品的两倍,有力支撑智能驾驶算法的演进。

爱芯元智汽车事业部总裁龚惠民强调,得益于爱芯智眸®AI-ISP的加持,车企可以用更具性价比的传感器方案来降低系统成本。此外,爱芯元智的开发平台和工具链也可以帮助客户快速开发,实现降本增效。

而在后摩智能看来,在AI大模型时代,定制化的AI芯片已经难以满足以Transformer为代表的网络模型的需求,存算一体芯片的性能优势逐步凸显。

后摩智能的存算一体技术,采用非冯·诺依曼架构,打破了芯片设计的“存储墙”及“功耗墙”,实现计算单元与存储单元的集成,在存储单元内完成部分或者全部的运算。

今年5月,后摩智能发布了业内首款存算一体智驾芯片鸿途™H30,以12nm制程实现最高物理算力 256TOPS,典型功耗 35W,成为国内率先落地存算一体大算力AI芯片的公司。

可以预见,伴随着BEV+Transformer的大规模上车应用,一个全新的智驾市场格局正在到来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1257747.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

当OLAP碰撞Serverless,看ByteHouse如何建设下一代云计算架构

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 作为云计算的下一个迭代,Serverless 可以使开发者更专注于构建产品中的应用,而无需考虑底层堆栈问题。伴随着近年来相关技术成熟度的增加&am…

Node——npm包管理器的使用

Node.js使用npm对包进行管理,其全称为Node Package Manager,开发人员可以使用它安装、更新或者卸载Node.js的模块 1、npm包管理器基础 1.1、npm概述 npm是Node.js的标准软件包管理器,其在2020年3月17日被GitHub收购,而且保证永…

Python3基础

导包 在 python 用 import 或者 from...import 来导入相应的模块。 将整个模块(somemodule)导入,格式为: import somemodule 从某个模块中导入某个函数,格式为: from somemodule import somefunction 从某个模块中导入多个函数,格式为&#…

【Linus】进程的等待

进程等待的必要性 如果子进程退出了,父进程没有对子进程进行回收,子进程就会进入僵尸进程,占用内存,导致内存泄漏如果程序进入僵尸状态,那么kill -9 也无法强制杀死进程子进程是父进程创建出来,完成父进程…

介绍比特币上的 sCrypt 开发平台

最强大的基础设施和工具套件,可轻松构建和扩展您的 dApp 杀手级应用在哪里? 尽管比特币在小额支付、国际汇款和供应链管理等广泛用例中具有颠覆性潜力,但在推出 14 年后,我们还没有看到一款非常受欢迎并被主流采用的杀手级应用。 …

Star History 十月开源精选 |AI for Postgres

在 2023 年 Stack Overflow 开发者调查中,Postgres 顶替了 MySQL 被评为最受欢迎的数据库。一个重要因素应该是 Postgres 支持扩展:可扩展的架构 Postgres 仍然由社区拥有,Postgres 生态近年来蓬勃发展。 扩展可以看作是内置功能&#xff0c…

基于SpringBoot的超市信息管理系

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 随着我国经济的不断发…

使用 OpenCV 发现圆角矩形的轮廓

OpenCV - 如何找到圆角矩形的矩形轮廓? 问题: 在图像中,我试图找到矩形对象的圆角轮廓。然而,我对两者的尝试 HoughLinesP 并 findContours 没有产生预期的结果。 我的目标是找到一个类似于以下形状的矩形: 。 代码: import cv2 import matplotlib.pyplot as plt…

深入理解Transformer,兼谈MHSA(多头自注意力)、LayerNorm、FFN、位置编码

Attention Is All You Need——集中一下注意力 Transformer其实不是完全的Self-Attention结构,还带有残差连接、LayerNorm、类似1维卷积的Position-wise Feed-Forward Networks(FFN)、MLP和Positional Encoding(位置编码&#xf…

H5标签的contenteditable属性在项目种的使用

介绍 contenteditable 是 HTML5 中的新属性。属性值为true 可以编辑元素内容&#xff0c;false 无法编辑元素内容。 简单说: div标签&#xff0c;加上这个属性&#xff0c;就变成可以编辑状态。 <p contenteditable"true">这里可编辑</p>属性可以开发的…

SAP Smartforms设计

第八章 SMART FORMS设计 要点列表 概览&#xff1b; Form&#xff08;表格&#xff09;&#xff1b; Smart Styles&#xff08;样式&#xff09;&#xff1b; Text Module&#xff08;文本模块&#xff09;&#xff1b; 使用标准表方式打印&#xff1b; 使用模板方式打印…

C语言基础篇5:指针(二)

接上篇&#xff1a;C语言基础篇5&#xff1a;指针(一) 4 指针作为函数参数 4.1 指针变量作为函数的参数 指针型变量可以作为函数的参数&#xff0c;使用指针作为函数的参数是将函数的参数声明为一个指针&#xff0c;前面提到当数组作为函数的实参时&#xff0c;值传递数组的地址…

java中SPI机制

一&#xff1a;作用 SPI的作用其实就是&#xff0c;在系统内部&#xff0c;定义一个能力接口&#xff0c;该接口可以满足自己的业务需要&#xff0c;比如发送短信&#xff0c;定义一个发送短信的接口&#xff0c;至于用什么方式实现&#xff0c;可以交给短信服务提供商去实现&…

[C/C++]数据结构 堆排序(详细图解)

一:前言 在[C/C]数据结构 堆的详解中,介绍了什么是堆,并且完成了堆的实现和一系列接口,包括向上调整法和向下调整法等,接下来小编介绍一个有点量级的排序方法------堆排序,时间复杂度为O(n*lgn) 二:堆排序详解 2.1 方法介绍 1.首先将待排序数组建为大堆,此时堆顶元素就为数组…

肖sir __数据库练习__001

建表语句&#xff1a; create table student ( id int(4),age int(8),sex int(4),name varchar(20), class int(4), math int(4)) DEFAULT charsetutf8; INSERT into student VALUES(1,25,1,‘zhansan’,1833,90); INSERT into student VALUES(2,25,1,‘lisi’,1833,67); INSER…

Windows安装Docker、自定义安装目录

目录 前言一、Docker安装包下载二、自定义Docker安装路径、设置到其他盘三、安装Docker四、安装后配置1.修改镜像保存路径2.自定义镜像源 五、Docker运行验证1.docker/welcome-to-docker2.MySQL服务 总结 前言 Docker是一种开源的容器化平台&#xff0c;可以让开发者使用容器的…

异步爬虫提速实践-在Scrapy中使用Aiohttp/Trio

在构建爬虫系统时&#xff0c;提高爬虫速度是一个关键问题。而使用异步爬虫技术可以显著提升爬取效率。在本文中&#xff0c;我将与大家分享如何在Scrapy中利用Aiohttp或Trio库实现异步爬取&#xff0c;以加快爬虫的速度。让我们开始吧&#xff01; 1. 安装所需的库 首先&…

MyBatis-Plus及多数据源入门教程

开发环境配置 JDK 1.8、Maven 3.8.8、 IDEA CE 2023.2、MySQL 8.0.34 框架介绍 MyBatis-Plus&#xff08;简称 MP&#xff09;是一个 MyBatis的增强工具&#xff0c;在 MyBatis 的基础上只做增强不做改变&#xff0c;为简化开发、提高效率而生。MyBatis 是一款非常优秀的开源…

企业级应用场景中,LLM 的数据特性剖析及处理对策

编者按&#xff1a;今年以来&#xff0c;大语言模型&#xff08;LLM&#xff09;在消费者(2C)市场崭露头角&#xff0c;同时也吸引了大量企业的关注。但是直接将这些面向消费者的模型引入企业环境&#xff0c;可能会面临一些风险。今天我们为大家带来的这篇文章&#xff0c;作者…

GPTs 初体验 - 1 分钟就能创建一个自己的 ChatGPT? | 京东云技术团队

就在 11.10 号早上&#xff0c;ChatGPT 已经偷摸的把GPTs功能&#xff0c;开放给所有尊贵的 Plus 用户了。 随着这波的功能开放&#xff0c;界面也是改了不少。点击左侧的 Explore 或者左下角的用户处&#xff0c;就可以直接进入新的 GPTs 功能&#xff1a; 这里可以看到我们…