年内BEV落地之战:华为遥遥领先,还是蔚小理登上王座?

news2024/11/28 0:35:57

作者 | 张祥威

编辑 | 德新
115031cf86de8adf9f8956d225925d1c.jpeg落地城市NOA,是今年最重磅的自动驾驶大战。而BEV感知,目前看来是 通往城市NOA的必经之路
年内落地BEV,已经是国内自动驾驶头部玩家的共识。
其实,BEV是很早就提出的算法,又称鸟瞰图或上帝视角。直到近几年,特斯拉将其用于自动驾驶领域,国内车企随之布局,才受到更多关注。
国内涉足BEV的,造车新势力有小鹏、蔚来、理想等,科技公司有百度、华为、毫末智行等。
尤其今年4月,国内新能源汽车龙头比亚迪宣布年内落地BEV,将大戏推向高潮。
为何要落地BEV?主要是自动驾驶场景发生了变化。
高速场景相对简单,城市场景更为复杂,感知任务规模大幅增加,需要更多地利用深度学习。
感知层面,传统的2D检测已经力不从心,只有BEV能更好地完成城市场景感知任务,并为下一环节的规划、控制打好基础。
落地BEV,最直观的检验就是城市NOA功能能否在多个城市大规模推送。这场感知算法的重大转变,考验的是车企的 算法自研功底
 

一、进入城市,BEV感知算法兴起

故事从特斯拉重写Autopilot软件代码开始。
2019年,特斯拉推出高速场景下的NOA(Navigate on Autopilot),小鹏、蔚来等造车新势力紧随,兴起了一小股高速NOA技术潮。
afe88f395da48d78aaea37619008122e.jpeg
直到2020年8月,马斯克透露,团队正在重写Autopilot的底层代码。
又过了两个月,特斯拉推出FSD Beta,可以支持在城市道路场景下的NOA。支撑城市NO功能的,便是全新的BEV感知算法。
为什么会出现这一变化?
毫末智行技术副总裁艾锐告诉HiEV,“在特斯拉推出BEV之前,大家使用的是前视相机,周视用的很少。高速上,车密度不大,侧后方用一些雷达也够了。进入城市后,车流量开始密集,仅看正前方也不够了。BEV的出现, 核心在于 需要 做360度的感知
”特斯拉重写代码的同年,蔚来和小鹏也开始转向。
蔚来引入原Momenta研发总监任少卿,任的背景是计算机视觉研发,加入蔚来后负责算法团队,开始在Mobileye方案外启动自动驾驶自研。
小鹏也开始研发基于XNet的BEV感知架构。2021年的1024科技日上,吴新宙透露,在过去6个月里,每一个预测和规划代码全是重写的。
对于两家重写代码这件事,均胜电子副总裁郭继舜向HiEV表示,“周期性重写代码是对产品和系统认知提升后的必然阶段。在工程化方面,该踩的坑基本都要踩一遍,大家都需要阶段性更新代码和架构。
”从已有信息看,基于BEV研发全新算法,小鹏们的做法相似。大家均是从静态BEV网络算法、动态BEV网络算法部署算法。
静态BEV解决的是道路结构还原,感知对象是车道线、道路边界、停止线,可以解决部分摄像头被遮挡、车道线模糊等问题。
动态BEV解决的是交通参与者的还原和预测,感知对象车辆位置、姿态、尺寸、速度,可以在车辆同时出现在多颗摄像头视野内,可以稳定地追踪和感知出物体的距离和速度。
在BEV出现前,传统2D检测的好处是整个计算非常直观,但整个投影过程都是使用软件的方式,没办法形成端到端,会出现信息丢失、误差等问题。
BEV的到来,将让小鹏们获得更强的360度感知能力。不过,这里面的难度并不小。
 

二、复杂的代码,以及昂贵的数据标注

BEV,全称 Bird’s eye view本质上多个目标前融合感知方案
简单理解,它是将摄像头等传感器采集的2D为主的图像数据,转化为3D坐标空间下的数据,从而实现对物理世界的真实还原。
特斯拉的做法大致是:
312a03b32bbf3c88807a8d68da3de131.jpeg
基于纯视觉,利用8个摄像头采集数据,通过深度学习的主干网络Backbone对各个摄像头进行特征提取,再通过Transformer将2D图像转化为3D空间。
应用的技术并不新潮。
Backbone的本意是人的脊梁骨,在深度学习中被引申为主干网络的意思,其主要作用是就是提取图像的特征。
Transformer最早在2017年由谷歌提出,是利用注意力机制(Attention)来提升模型训练速度的模型。将Transformer发扬光大的是GPT,也就是Generative Pre-trained Transformer。
通过 BEV和Transformer,特斯拉开始获得全新的“上帝视角”下的数据。并在此基础上为数据加上了时间戳,形成了4D空间。
以用于对目标物测速,乃至对目标物的运动轨迹进行预测。
可以说,BEV改进了自动驾驶看物理世界的视角,可以更高效、准确地获取感知数据,这为后面的规划和控制提供了基石。
国内的自动驾驶玩家已经认可了这种方式,并且纷纷布局。
与特斯拉不同的是,国内玩家之前的方案中,在摄像头之外增加了更多的传感器和定位系统,比如超声波雷达、激光雷达、高精度地图等。
方法论相似,挑战在于融合困难,以及更多的代码量、数据标注工作。写代码是一项繁重的任务。
小鹏汽车自动驾驶副总裁吴新宙披露,城市NGP的代码量是高速NGP的6倍、感知模型数量是4倍、预测、规划、控制相关代码量是88倍。
9779569a14851afe6ff6fff3c6a6ddee.jpeg
为BEV的数据进行标注,同样需要大量的工作。
举个例子,要构建实时语义地图,需要对数据进行结构性训练,基于BEV模型做数据的标注、分割、分类。仅标注一项,根据毫末智行CEO顾维灏预测,BEV的模型大概 需要标注 1亿公里的数据
据了解,数据标注行业单人单月的综合成本约为四千元,千人规模的标注团队一年成本要达到1亿元。
一位从事数据标注的业内人士向HiEV表示,“要标注1亿公里的数据,实际上会有失效率,按照50%的失效率计算,假定都是简单场景,每人每天标注2km,需要一万人的团队标注至少四年的时间。
”好在,特斯拉已经探了路。
早前,特斯拉有一支千人规模的人工标注团队,后来开始增加自动标注和虚拟仿真等工具。
对此,上述数据标注从业人士表示,“特斯拉的自动标注是行业风向标,其预标注技术目前行业最优。加入自动化标注模型后,假定可以提效80%,可以将1万人团队的标注时间缩减到一年。
”小鹏、毫末智行等已经感受过人工标注的成本之昂贵,开始探索自动标注。其他各家,也可以进行借鉴。
 

三、BEV带来的变化:方案“减配”,芯片合作更紧密

BEV带来的第一个变化,是 让自动驾驶配置开始缩减。
在没有布局BEV之前,国内车企是最早通过高精地图来实现自身定位。车规级激光雷达成熟后,车企又加入了激光雷达。
布局BEV算法后,一些车企们开始由原来的堆砌配置,转为缩减配置。
大家发现,BEV可以实时生成语义地图,进而替代高精度地图,甚至还可以去掉超声波雷达。
d99e47c65db47577c137e76477a87ff6.jpeg
事实上,小鹏早期并不打算去高精度地图。
吴新宙曾提到,对于城市场景,高精地图的鲜度非常关键,小鹏汽车正在和高德地图一起努力,希望发布的时候能够做到天级更新高精度地图的能力。
不过,耗资几千万可以买下高速道路的高精度地图,但要买下城市场景下的高精度地图,费用又是另一个级别。
更何况,获取地图审批资质的效率,也会耽误自动驾驶向多个城市推送的进程。最终,车企们不得不进入自动驾驶的纵深地带,利用技术甩掉高精度地图的拐杖。
这里面也有一定挑战。
“BEV去高精度地图,很多公司不一定能搞定,需要做大规模的云端场景重建、自动化的元素提取。另外,纯拓扑的任务还是很难,很多时候会因为遮挡、车道线不清晰而难以实现。”宏景智驾高级工程经理柴可宁告诉HiEV。
至于BEV是否会去掉激光雷达?
特斯拉的答案是, 利用Occupancy占用网络,以及4D毫米波雷达的点云信息,就能替代激光雷达
国内是另一重景象。
国内目前尚未兴起去激光雷达的苗头。艾锐认为,激光雷达不会由于BEV算法的出现而被替代。
“在夜间,摄像头根本看不见。激光雷达是一个物理传感器,可以主动发射信号。对高端车型来说,可以让车辆多一重安全性。对于中低端产品来说,成本相对较高,只有追求极致性价比,才会去传感器。”他解释道。
be4f3dc5152939bdddee420209d5676d.jpeg
其实,基于纯视觉还是多模态,本质上不是技术问题,而是一个商业成本问题。从技术角度,多模态的效果肯定更好,但从成本角度,多模态的上车搭载量会少。
BEV带来的第二个变化,是需要芯片厂商更好地适配,与车企形成深度合作。
因为,BEV方案比较考验芯片对于算子的支持能力。
除了特斯拉采用自研FSD芯片外,头部自动驾驶玩家更多地 基于英伟达Orin X落地BEV方案,且以双Orin X为主,算力高达508TOPS。
对此,艾锐表示,“英伟达的芯片基础计算单元是CUDA,非常小,也非常灵活,对算子的支持能力非常强。”
而如果算力小了,要实现同样的帧率,就需要做特别的算子优化。
事实上,一套标准的BEV算法,现在的很多芯片都不支持,大家在用各种各样的算子去替换它们,这就需要芯片厂商和主机厂深度配合。
今年4月,比亚迪在上海车展宣布基于地平线征程5的自研BEV方案将在年内量产。目前,地平线可以向车企提供BEV参考算法,且正在布局Occupancy占用网络。双方的合作,将是基于征程5落地BEV的首个案例。
最后,BEV技术的强大感知能力,不仅吸引了乘用车竞相布局,也在商用车里面开始应用。
比如,挚途科技的BEV方案,便针对商用车型车身长、检测盲区较大的特点,向车企提供摄像头选型和安装位置方案,可以实现前方300米范围的检测,且增加了车身和近距离的感知冗余。
头部车企闯关BEV感知时,其他传统车企会面临更大的压力。

四、后来者,自研还是外包?

对于BEV方案,发力较晚的车企其实有着更多选择。
一种是自研
要做BEV方案,方向大致已定。需要选一套传感器方案,基于大算力芯片进行开发。另外,还需要自动标注闭环系统,以及用于数据训练的智算中心等等。
时间上,做BEV的周期相对造车更短。
“主机厂从传统2D检测转到BEV感知,如果要把数据准备都算上,快的话需要一年时间。”艾锐说。
投入事项明确,周期相对较短,这决定了车企可以进行自研。
我们也注意到,除上述几家布局BEV的车企外,其他玩家也在准备入局。
今年1月,长安汽车智算中心GPU算力扩容集成项目开始招标。2月,吉利星睿智算中心在湖州长兴揭牌。
另一种是与供应商合作
如果看整个国内汽车市场,会发现自动驾驶方案供应商也有其存在价值。
除了造车新势力覆盖的30万以上的高端市场外,中低端市场十几万以上30万以下的车,仍然是主流。
bbd36238595f182b87cec236ff4ba304.jpeg
据HiEV了解,毫末智行将基于十几TOPS的芯片运行BEV算法,“硬件成本上, 几千块钱就可以做到城市NOA,类似的产品很快也会出现。
”一些之前布局L4的科技公司,比如小马智行、元戎启行、商汤绝影等,也在推出BEV的方案。这些公司做BEV,优势在于之前的算法更易于迁移。
理论上,这些公司不会面临华为向车企提供解决方案时的“夺走灵魂”的质疑。
“华为太大了,它有能力做任何事,包括造车。我们很小,而且非常开放,车企不需要担心失去灵魂。”一位自动驾驶解决方案供应商的高管表示。
“在BEV上,我们愿意赋能车厂,是服务者的心态。很多时候,车厂对我们感兴趣的就是真值系统,它一年有几千万的标注预算,搭载真值系统后,可以降到几百万,肯定会感兴趣。整体上,车企对我们的感知算法很感兴趣。”柴可宁说。
“从技术演进趋势看,不是零和博弈。作为一个解决方案供应商,我们的算法、云端中心还是有一定的领先性。”商汤绝影量产行车智能驾驶研发负责人蒋沁宏表示。
如果车企不想重复造轮子,至少在可见的一段时间,与解决方案供应商合作,尽早进入自动驾驶的赛道是一个好的选择。
 

五、基于BEV的城市NOA,年内将落地百城

还记得2020年下半年,蔚来推出基于Mobileye的高速NOP功能,小鹏则基于英伟达Xavier推出了高速NGP。
如今,三年时间不到,大家又开始比拼基于BEV感知架构落地城市NOA的效率。
一个例子可以看出各家竞争的激烈。
最近,小鹏发布了一项名为“通勤模式”的功能,又被称为 微缩版城市NGP,可以在无图方案的四五线城市使用。
“听说我司预告城市通勤模式之后,有两家友商已经快速决策分别从宣传和实际行动上致敬一下子。”小鹏汽车自动驾驶产品高级总监刘毅林在社交平台上发文表示。
今年以来,各家陆续公布基于BEV的城市NOA落地计划。
  • 小鹏计划今年下半年,将在大部分无图城市开放变道、超车、左右转能力;

  • 蔚来已经推送的Banyan2.0.0版本,切换为了BEV架构,下半年将推出带有城区能力的NAD Beta版本;

  • 理想的城市NOA将在第二季度内开启推送,并于年底前完成100个城市的落地推送;

  • 其他玩家,毫末智行、华为、比亚迪,也将在今年落地BEV方案。

中国有600多个城市,按照各家计划,年内将有接近六分之一也就是近百家城市可以使用城市NOA功能。
对于这些大力投入的玩家来说,有的需要维护一早立起的自动驾驶一哥的江湖地位,有的蓄势通过城市NOA规模落地打一个后来居上的漂亮翻身仗,也有的要证明自己在自动驾驶领域也是遥遥领先,也有的要借助车企,为更大的市场立一个标杆产品,一切都将在下半年出现定论。
各家竞逐城市NOA落地时,还有一家真正的巨头正在候场。目前, 特斯拉FSD Beta已经在海外城市范围内推送,进入国内只是时间问题。
如王传福所说,新能源汽车的上半场是电动化,下半场是智能化。

在电动化竞争阶段,大家还有传统造车工艺可供依仗,智能化的竞争阶段,将是包括BEV感知、规划、控制,以及智能座舱等在内的各个点位的全方位竞赛,更加考验车企的软件研发能力。经历BEV算法落地大战后,车企的核心技术将再次重塑。

bab00e0dfd51a20ea6d18f03f7ac3f80.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/620631.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

R730调整风扇转速

整整一个月没有写文章了,一是因为最近太忙,有点休息的时间就想躺着;二是买了Tesla P40显卡,想写个安装教程,结果快一个月了,安装还是失败。 大家如果谁懂在R730的ESXi上,用直通方式安装Tesla&am…

MMPretrain代码课

安装注意事项 训练时需要基于算法库源码进行开发,所以需要git clone mmpretrain仓库。如果只调用,则pip install 即可。 from mmpretrain import get_model, list_models,inference_model分别用于模型的获取、例举、推理 此时还没加载预训练权重 tor…

Redis-Cluster集群架构

Redis-Cluster 1.哨兵模式和redis-cluster模式的区别 哨兵模式的问题:1.只有一个master节点可以提供写的操作,qps 最多10w,对于高并发特别高的大型互联网系统 ​ 2.单节点不会内存太大,内存很大会给主节点造成压力,…

如何用数据资产管理,解锁数据新价值

数字经济和数字化转型的发展有什么共通点吗?这个问题的答案也很明显,数据就是数字经济数字化转型的基础,也是推动两者快速发展的核心要素。数字化时代,数据已经成为了个人、机构、企业乃至国家的重要战略资产,所以如何…

CnOpenData数字经济专利及引用被引用数据

一、数据简介 自人类社会进入信息时代以来,数字技术的快速发展和广泛应用衍生出数字经济。与农耕时代的农业经济、工业时代的工业经济大有不同,数字经济是一种新的经济、新的动能、新的业态,并引发了社会和经济的整体性深刻变革。现阶段&…

Nginx网络服务——页面优化与安全

Nginx网络服务——优化与防盗链 一、Nginx的网页优化1.Nginx的网页压缩2.Nginx的图片缓存3.Nginx的连接超时设置4.Nginx的并发设置 二、Nginx的页面安全1.查看Nginx版本的方式2.隐藏版本号 三、Nginx的日志分割1.编写日志分割脚本2. 执行脚本进行测试3. 将日志脚本添加至计划性…

InnoDB - 行格式

文章目录 InnoDB - 行格式1. 什么是行格式2. 四种行格式3. Compact行格式 InnoDB - 行格式 1. 什么是行格式 我们平时是以行记录为单位向表中插入数据的,这些数据在磁盘上的存放方式被称为行格式或者记录格式。 InnoDB引擎中支持四种行格式:Compact、…

Java8 Stream详解及中间操作方法使用示例(一)

Java 8 引入了 Stream API,提供了一种新的处理集合和数组的方式。Stream API 可以让我们更加便捷、灵活地处理数据,尤其是大规模数据。在这里,我将详细介绍 Java 8 中的 Stream API。 什么是 Stream Stream 是 Java 8 中引入的一个新的概念&…

vs2022配置pcl1.13.1

下载 下载PCL预编译安装程序PCL-1.13.1-AllInOne-msvc2022-win64.exe 和要安装的PCL组件(例如pcl-1.13.1-pdb-msvc2022-win64.zip) 安装 双击 PCL-1.13.1-AllInOne-msvc2022-win64.exe进行安装。到图1的步骤时,选择第二项。 图1 下一步&am…

串口助手(布局,图标,串口号,隐藏界面,显示实时时间)

文章目录 前言一、串口助手布局二、设置软件的标题,图标三、显示可用串口号四、隐藏,显示面板五、显示实时时间总结 前言 从这篇文章开始 教大家自己制作一个串口助手软件,并实现基本的功能。学做一个 串口助手可以一边回顾复习 QT 的相关知…

《面试1v1》G1垃圾回收器

我是 javapub,一名 Markdown 程序员从👨‍💻,八股文种子选手。 《面试1v1》 连载中… 面试官: G1垃圾收集器?听说很牛逼的样子! 候选人: 是的,G1是JDK9默认的垃圾收集器,代替了CMS收集器。它的目标是达到…

4.运算符|Java学习笔记

文章目录 运算符介绍算术运算符关系运算符(比较运算符)逻辑运算符赋值运算符三元运算符位运算符 运算符优先级Java命名规范关键字保留字 进制十进制转(二/八/十六进制)原码、反码、补码 运算符介绍 运算符是一种特殊的符号&#…

【Linux】认识Linux下的编译器gcc/g++ | 认识动静态库

本文思维导图: 文章目录 前言tips: 关于前两篇文章所提到的sudo指令 一、gcc/g编译器的认识和使用tips 1.预处理2. 编译3.汇编4.链接关于预编译,编译,汇编阶段的指令记忆方法 二、gcc/g指令汇总三、认识动静态库1.库的认知库的命名规则静态库…

C++ ---- 继承

目录 继承概念及定义 继承概念 继承定义 语法 继承关系和访问限定符 继承基类成员访问方式的变化 规律总结 以公有继承为例测试 基类和派生类对象赋值转换 继承中的作用域 派生类的默认成员函数 构造函数 析构函数 拷贝构造 赋值重载 继承与友元 继承与静态成员…

ESP8266调用NTP服务器进行时间校准

一、背景知识 【1】什么是NTP服务器? NTP是网络时间协议(Network Time Protocol,简称NTP),是一种用于同步计算机时间的协议。NTP服务器指的是提供NTP服务的计算机或设备。NTP服务器的主要功能是保证网络上的所有设备…

Linux下信号量使用总结

目录 1.Linux下信号量简介 2.POSIX信号量 2.1 无名信号量 2.2 有名信号量 3.System V信号量 1.Linux下信号量简介 信号量是解决进程之间的同步与互斥的IPC机制,互斥与同步关系存在的症结在于临界资源。 临界资源是在同一个时刻只容许有限个(一般只有…

ble系统知识介绍(较为完整,持续更新中)

BLE学习 现在网上关于BLE系统的学习资料实在是太少了,因此本文希望能够聚集一些资料能够系统的入门BLE,本文翻译自Bluetooth_LE_Primer_Paper,还有一些网上的一些资料,如果侵害到了某些作者的权益请及时联系我 参考资料和链接 Bluetooth_LE_Primer_Paper_3MtXws-zP…

GitOps 实践之渐进式发布

本文作者:陈钧桐 腾讯云 CODING DevOps 高级解决方案架构师,从事多年技术布道工作,对于云原生时代下企业数字化转型、IT 与 DevOps 建设、价值流体系搭建等有丰富的经验,曾为多家大型企业提供咨询、解决方案以及内训服务。既关注工…

【Python小技巧】加密又提速,把.py文件编译为.pyd文件(类似dll函数库),你值得拥有!

文章目录 前言一、常见的Python文件格式有哪些?二、准备编译环境1. 安装cython2. 安装Microsoft C 生成工具 三、编译.py文件为.pyd文件1. 编辑原始.py文件2. 准备setup.py文件3. 进行编译 四、测试总结 前言 Python的脚本文件是开源的,若直接发布&#…

i.MX RT1010跨界MCU上手体验(上)

由于项目需要性价比高一些的高性能MCU,了解到NXP的RT1010主频高达500MHZ的MCU,半个月以前已经拿到官方Demo板了,今天抽空上电体验下,在此记录。这颗芯片的优势是主频高,功能全,价格合理,但是需要…