走向大模型、大算力、大数据:特斯拉与毫末的自动驾驶AI路径寻踪

news2024/7/6 18:58:13

5a62aa71b7abc1b1ec576a8ba0235286.jpeg

2022行至年终,各种年度总结也纷至沓来。要说最近的大事件,一定少不了:自动驾驶又双叒寒冬了。

大量“报忧不报喜”的新闻,说明2022年自动驾驶行业确实出现了一定程度的波动:激光雷达鼻祖德国ibeo和独角兽Argo.ai相继破产;不少自动驾驶公司传出裁员和组织架构调整,Waymo的估值大幅下跌,起火撞车等负面舆论不断……这些事件都引发了悲观情绪,让“寒冬说”显得有理有据。

但如果我们去仔细探究就会发现:第一,人工智能永远是在泡沫和寒冬中振荡,自动驾驶寒冬的论调其实早在几年前就出现了,但主机厂、科技企业、资本市场对自动驾驶的投入并没有冰封,参与者众多;第二,调整和波动也不一定就意味着悲观,寒冬期往往也是优胜劣汰,比如此次调整后很多厂商都将目光转向了L2级别的辅助驾驶技术,大浪淘沙始见金,这正是具有领先技术优势的AI公司展露生命力的时机。

更进一步,中美公司作为自动驾驶领域中AI技术的头部选手,其所面临的背景和挑战实际上也有差异,中国自动驾驶企业接下来走向何处,恐怕不能简单地依靠海外独角兽的境遇来判断。

所以,我们需要抛开情绪,回归事实,去对比一下,中美在自动驾驶技术模式上究竟有哪些异与同,开往春天的自动驾驶又需要穿越哪些障碍?

目前,以国外的特斯拉、国内的毫末智行等为代表的渐进式自动驾驶公司,都已经实现了乘用车辅助驾驶产品规模量产和商业化落地。前不久,毫末智行和特斯拉也相继举办了第六届HAOMO AI DAY、2022Tesla AI Day,公布了各自的最新产品和技术成果。

近日,毫末在其三周年内部信中新发布了其愿景“让机器智能移动,给生活更多美好”,这其实也透露出一个信号,那就是自动驾驶AI技术其实可以广泛复用在各种场景的机器人上。因此,自动驾驶的前景不言自明,所以,最终的关键就在于自动驾驶技术是否能抵达规模落地的终局?

深入对比两家在自动驾驶AI技术的探索,我们可以发现,两家正在积极拥抱以大数据、大算力、大模型为标志的自动驾驶3.0时代,同时在技术及产品等多个方面,也展现出中美自动驾驶发展模式的一些异同。

我们用一张图进行简单对比:

367aa44389524a709ed49ab2de638b96.jpeg

可以看到,自动驾驶行业正在迎来一个深刻的产业之变,如何穿越寒冬、巩固王城,我们可以从这两家企业的技术探索的步履中找到线索。

5ab2537b41c1c69ff708a349ada35dbc.png

高阶自动驾驶“降维”

与智能辅助驾驶“升级”同时进行

无论媒体、企业还是大众,可能都被这一场突如其来的自动驾驶“寒冬”风波惊吓得不轻。但平静下来,会发现这场风波其实早有征兆。

一方面,L4及以上的自动驾驶技术非常困难,道路漫长,技术前景模糊,2019年初,时任Waymo首席执行官约翰·克拉夫奇克就曾公开表示“自动驾驶汽车可能永远无法在全路况条件下行驶”,算是预言了这场高阶自动驾驶技术的“寒冬”。

另一方面,商业化落地遥遥无期,让投入巨大的自动驾驶公司很难在短期内实现盈利,去年头豹研究院发布的一份研报就认为,Robotaxi模式是处在“伪概念”阶段,相关公司仍深陷“量产地狱”。

客观来说,对于高阶自动驾驶的质疑早已非一日之寒,而大量高阶自动驾驶的企业也开始主动“降维”,发力辅助驾驶。传统主机厂如福特和大众停止Argo AI的投入之后,转而集中资源做L2+高级驾驶辅助系统和L3自动驾驶系统的开发。一批优秀的L2级别自动驾驶相关企业开始蚕食传统博世、大陆、奥托立夫等公司的份额。而博世也投资了文远知行以展开乘用车的L2-L3级自动驾驶软件开发。

近年来,智能辅助驾驶与特定场景下的高阶自动驾驶商用车,展现出较强的商业化前景。特斯拉、毫末智行等都已实现了规模化量产,市场正在加速打开。

随着更多竞争者的加入,以及AI技术的发展,自动驾驶正在进入以大数据、大算力、大模型为标志的新时代,智能辅助驾驶也开始沿着以数据驱动的大数据、大模型技术路线进行升级。其中,特斯拉已经是特斯拉是进入自动驾驶3.0阶段的领跑者,中国自动驾驶企业如毫末智行也在加速冲刺。

cb3d499421b2b80a6b04719ceed4c3b8.png

高阶自动驾驶“降维”与智能辅助驾驶“升级”同时发生,是产业转折期出现的新变化。总的来说,以渐进式路线作为核心战略的头部自动驾驶企业,破解了困扰自动驾驶的商业化难题,是比较值得关注的。

与此同时,中美自动驾驶的技术趋势、基础设施、政策引导、产业链情况也各有不同,所以尽管美国的特斯拉和中国的毫末智行,同为渐进式自动驾驶企业,但在进入3.0阶段,对于大数据、大算力、大模型的战略部署与落地应用,也出现了一定的差异。

以特斯拉和毫末智行为例,在核心战略与技术路线上是高度对齐的,都专注于渐进式技术路线,打造智能辅助驾驶产品,比如特斯拉的Autopilot、毫末智行的HPilot智能辅助驾驶产品,并积极推动自动驾驶3.0阶段的到来,在大数据、大模型、大算力这三大技术能力上做了大量工作。

简单形容双方的异同,就是前往同一目的地,但彼此会乘坐不同交通工具。接下来我们就分析一下二者的异同,可能对接下来自动驾驶行业的发展带来不少启发。

目的地一:

增强感知能力,大模型“出奇迹”

b8df3b4e2820d8def789756730250e10.png

自动驾驶技术架构与解决方案,需要同时包含感知、决策、执行这三部分。其中,传统的自动驾驶感知系统是由各类传感器组成的,包括激光雷达、毫米波雷达及各类摄像头。

特斯拉采用了纯视觉感知路线,即去掉毫米波雷达等感知器,完全依靠车载AI摄像头收集数据,作为自动驾驶算法的决策依据。这种模式的好处是,减少了激光雷达的使用,大大降低了自动驾驶汽车的整体造价,视觉方案对行人、交通标志标线等细节有很强的感知能力,成本优势明显,有助于商业化进展。但少了传感器的辅助,会影响到自动驾驶系统的可靠性。

中国城市场景更加复杂,毫末智行则采用视觉+雷达等多模态融合感知,其中视觉摄像头负责细节感知,而雷达传感器提供对环境距离、速度等的精准感知,这种方案为自动驾驶提供冗余感知,在可靠性、安全性上更胜一筹,更容易满足城市管理者及居民对自动驾驶的要求,减少事故发生率,对产业良性发展带来助益。

为此,毫末从第一性原理出发思考自动驾驶感知的最优落地方案,选择了“重感知”这一路线,在城市导航辅助驾驶场景,实现只依赖和人类驾驶员一样的普通导航地图而不依赖业界常用的高精地图,从而避免了高精地图覆盖范围、鲜度更新以及维护成本等挑战。

选择“重感知”路线的背后,其实是毫末更注重大模型算法的投入,即通过数据智能体系MANA建立强感知的时空理解能力,通过使用时序的transformer模型在 BEV 环视空间上构建实时局部空间,通过这种方式让车道线的感知输出更加稳定和准确。通过强大的实时感知能力,整个过程只需要普通导航地图里面的相对可靠的拓扑信息即可,最终让车辆像我们人类自己开车一样进行环境感知。

感知系统的发展进化,也使得数据规模不断提升,将高维数据抽象成感知能力,这就需要高效的AI模型,进行分析预测和控制,这也是自动驾驶系统的核心技术。

1265b45fd5367de5cb28f4dd81fff21e.png

总体来说,特斯拉和毫末智行都积极布局大模型的落地应用,将Transformer引入自动驾驶系统中,来提升AI模型效果,实现自动驾驶系统感知智能和认知智能的大幅优化,从而减少对高精度地图的依赖。

e322c3d80b42299c71a861657b99fed6.png

特斯拉使用Transformer与CNN、3D模型等相结合,组成综合的神经网络系统,对汽车AI摄像头所采集的图像数进行跨时间的图像融合,来实现基于语言模型的车道线感知、基于向量空间的路径规划等功能。

408ba12ee08e0ff42db6cb083f23b489.png

毫末智行从2021年7月开始,就启动了对Transformer的研究和落地尝试,也是中国第一家应用Transformer的自动驾驶公司。借助Transformer实时建模能力,对多模态融合感知数据进行数据前融合,搭建具有时序特征的立体场景,让自动驾驶系统具有强大实时感知能力,在城市环境中不依赖高精地图,也能应对道路模糊、复杂路口、环岛等道路感知挑战。比如毫末智行自研的BEV Transformer,就在城市道路上实现了多传感器融合车道线识别。

90673536bf9829f392a621c1da28a463.png

此外,AI系统还需要在仿真环境中进行验证、训练和迭代,场景构建会直接影响到模型训练。特斯拉是基于虚幻4引擎渲染的仿真环境,来测试自动驾驶系统在极端情况、复杂环境中的效果。毫末智行则选择与阿里及德清政府合作,将真实交通流导入到仿真引擎中,用于路口场景的调试验证。二者的区别在于,特斯拉的虚拟仿真环境只用于复杂情况测试,训练效率高;毫末智行的真实仿真环境,对自动驾驶系统的现实表现提升帮助很大,但场景重复度比较高。

21a9d62a02d3942fa13b7b3600735b34.png

目前来看,Transformer为代表的大模型,凭借对大数据优势的释放、强大的序列建模能力、全局信息感知能力,以及为算法开发提质增效等优势,正在成为自动驾驶企业的主流选择,而特斯拉、毫末智行也因为先行先试,取得了领先优势。

9cd2e9a04b2b1291c425bdb72537f91a.png

目的地二:

降本增效,让大数据“纵享丝滑”

大模型需要海量数据的“喂养”,自动驾驶感知系统的升级使得数据规模激增。数据量一方面是自动驾驶企业的核心竞争力之一,另一方面也带来了标注、处理、分析、存储等压力和成本。因此,在自动驾驶3.0阶段,大数据的降本增效将成为自动驾驶企业的关键赛点。

33f8c235ebd57e02a28388e8f41a81fc.png

正如毫末智行CEO顾维灏所说:“样本标注的时间成本和金钱成本还是很高,我们需要有一种能够直接使用大量无标注数据的方法,这样才能更高效地发挥出毫末在数据规模方面的优势”。

特斯拉和毫末智行都很重视大数据的降本增效,不过,由于历史积累不同,双方的大数据解决方案也各有侧重。

8af5f5e5dd69c20678e4ccaddc258d67.png

特斯拉发展较早,数据规模远远领先其他自动驾驶厂商,依靠数据引擎Data Engine,实现了数据验证、标注、训练、部署的闭环,充分发挥大数据的价值。不过,早期无监督学习尚不成熟,特斯拉也依赖人工标注与自动化标注同时进行,自建了超千人的数据标注团队,也难免会遇到人工标注效率低的问题。目前,特斯拉也在积极提高数据自动标注的质量和效率,引入无监督学习,来对海量道路信息进行标注。

6da1a9fc2dbb19c30bbf54dd08609436.png

毫末智行创业初期,就很重视数据价值和数据效率,选择使用无数据标注的自监督学习,高效发挥出毫末在数据规模方面的优势。构造了一个增量式的学习训练平台MANA,通过标注过程的自动化,提高数据利用的效率。截至目前,数据智能体系MANA的学习时长已经超过40万小时。

ec4aa62a473187cc524ad601643dd2f6.png

大数据的降本增效,直接影响到自动驾驶企业的商业化潜力。特斯拉和毫末智行依据各自的发展状况、先天基础、技术路线、产业环境,已经找到了各自的解法。

目的地三:

持续投入,让大算力“供给自由”

4a711a3ac8fd30db857ff917dffed4a3.png

基于大数据、大模型的自动驾驶系统,需要澎湃算力的支撑,算力因此成为决定自动驾驶系统天花板的关键要素。如何为自动驾驶汽车和系统提供源源不断的大算力,也是特斯拉、毫末智行等头部企业所重点布局的领域。

目前来看,特斯拉和毫末智行都采取了自研硬件+超算中心的解决方案。

硬件方面,端侧计算平台来满足自动驾驶系统对计算实时性、低延迟性的高要求,来保障实时分析决策和操作指令的及时执行。特斯拉FSD 1.0能够提供144 TOPS算力,能够满足L2/L3级别自动驾驶的需求;毫末智行推出的硬件计算平台小魔盒3.0,算力则达到了360 TOPS,为后续的软硬件升级留下了更多空间。

9afce5d0128030925edb3cb2ff1c00b7.png

通过云端算力处理大量回传数据,训练迭代算法模型,更具成本优势和性能优势,特斯拉和毫末智行也都开始建设智算中心,为自动驾驶大模型训练、大数据分析处理提供算力支撑。智算中心需要一定的建设周期,且投入较大,特斯拉由于布局更早,已经研发出了专门用于自动驾驶训练的云端AI芯片D1以及计算中心Dojo,其云端超算中心Dojo计划在2023年投入使用。

b22feee67a8ff6ce98120e9dd6627fdc.png

毫末智行则是正在紧锣密鼓地推出中国自动驾驶公司的首个智算中心——毫末智算中心,率先开启了行业基础设施的探索和布局。毫末智算中心的核心目标是满足千亿参数大模型的训练需求,处理数据规模100万clips,整体训练成本降低200倍。大算力资源的持续投入,将使得数据训练和模型迭代实现“算力自由”。

fc2abc5f6746e5713ffcb09411f29fd4.png

可以看到,大算力是一个时间工程,不是一朝一夕能够建立起竞争壁垒的,需要引起自动驾驶企业的高度重视,特斯拉、毫末智行这样先知先觉的发力者,则更有可能在接下来的自动驾驶市场竞争中占据优势身位。

8c6deb95ef1cba2bb8914cff07c70dce.png

拨云见月:

自动驾驶商业化的半程风景

经过大模型、大数据、大算力的一路闯关,特斯拉和毫末智行最终殊途同归,都实现了成本更优基础上的规模化量产,展现出自动驾驶3.0阶段的商业化能力。

具体来说,特斯拉有着堪称“生产狂魔”的量产能力,依托高度自动化、模块化的超级工厂,使其电动汽车的市场占有率一骑绝尘。毫末智行也依托智能驾驶产品的规模化量产,以及智能驾驶产品流程化、异步并行开发的工程能力,实现了产品稳健迭代与交付,拿下中国量产自动驾驶第一名。

从这个角度看,尽管中美自动驾驶的AI技术路线在细节上有所不同,但根本目标都是一致的,那就是推动自动驾驶技术成长,让自动驾驶产业成为数字经济的核心支柱产业之一。而这个终极目标最需要的努力也是有共性的:

1.技术能力的强势崛起。毫末智行能够加速冲刺3.0时代,靠的是底层技术的厚积薄发,中国首个自动驾驶数据智能体系MANA,中国最大规模的认知智能场景库,让可行、可靠、可商用的自动驾驶成为现实,也让同赛道选手很难超越。

2.商业市场的广泛认可。领先的技术能力和产品基础,为毫末智行和特斯拉带来了市场的信任,又得以在场景中促进数据能力的迭代,从而能生产出更好的产品,形成良性循环,构筑了市场领先性。

3.无人区的自主探索。如果说,技术与市场都有发展参照物,那么自动驾驶作为一个与城市空间、社会经济生活深度结合的技术,也需要中国企业担负起一些新问题的探索,比如安全性的保障、参与自动驾驶法律法规行业标准、电动汽车的产业链共荣、低碳绿色的社会责任、东数西算工程的发展等,将自动驾驶技术的商业价值与社会价值进一步释放,毫末智行为代表的中国厂商正在路上。

在所谓的“寒冬”里,特斯拉和毫末为代表的自动驾驶企业反而踏上了开往春天的高速路。

2022年有一个特别打动我的场景,是毫末智行的董事长、CEO等高层都是亲自下场,跟技术团队一起,走在城市的一条条街道上路测,从白天走到黑夜,从白皮肤晒成了黑脸庞……这个画面说明,中国自动驾驶产业的路,只能由中国企业一步一个脚印地从土地里踩出来。

正是无数这样的步履,让我们相信,中国AI、中国企业,一定会在自动驾驶的舞台上不断抵达未来。

f16b4979250f9fe04ab42636a18f584a.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/74163.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

less基础

less基础 1、维护CSS的弊端 CSS是一门非程序语言,没有变量、函数、SCOPE(作用域) 等概念 CSS需要书写大量看似没有逻辑的代码,CSS冗余度是比较高的不方便维护及扩展,不利于复用CSS没有很好的计算能力非前端开发工程师来讲,往往会因…

[附源码]Python计算机毕业设计Django作业查重系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

AirPods Pro 2用户反馈出现耗电严重情况,Find My功能是其最大亮点

多位 AirPods Pro 2 用户反馈,在升级安装最新版本之后出现了耗电严重的情况。AirPods Pro 2 充电盒的电池即使在不使用的情况下也会出现耗电情况。受影响的用户反馈在不使用状态下,一晚上可以消耗 10% 的电量。 这些受影响的 AirPods Pro 2 用户反馈&…

业界认可+1!网易云信入选首批智慧教育产品和服务供应商名录

近日,2022(第二十一届)中国互联网大会在深圳成功召开。大会期间,由中国互联网协会智慧教育工作委员会、中国信息通信研究院合办的智慧教育论坛如期举行,论坛以“数智启新聚势,教育点亮未来”为主题&#xf…

Android AOSP和Android-X86源码下载编译终极普法

Android AOSP和Android-X86源码下载编译终极普法 引言 最近有朋友在询问怎么下载Android AOSP源码和Android-X86源码,编译学习!其实这个说简单也简单,说复杂吗也不复杂。但是难在真的干起来!凯子哥的风格吗,既然朋友们…

JavaSe

软件: 一系列按照特定顺序组织的计算机数据和指令的集合、有系统软件(window、linux)和应用软件(QQ、微信)之分。 人机交互方式: 图形化界面(GUI)鼠标直接点击(简单直观…

留学Assignment写作方法和步骤整理

Assignment主要讨论的是研究性话题,深入剖析和研究主题,对于Assignment的主题进行探讨,从而更深入的了解,科技类Assignment偏向科技实用性,而对于文科类Assignment则偏向于探讨。要让Assignment更具价值,应…

【LSTM时序预测】基于卷积神经网络结合BiLSTM实现时序数据预测附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

最佳实践 | 如何基于GitHub Actions创建 DolphinScheduler Python API的CI/CD?

点亮 ⭐️ Star 照亮开源之路https://github.com/apache/dolphinscheduler01.DolphinScheduler 和 Python API 介绍Apache DolphinScheduler 是一个分布式、可扩展的工作流调度器平台,具有强大的 DAG 可视化界面。它可以帮助用户更轻松地构建和维护任何规模的工作流…

计算机毕业设计springboot+vue基本微信小程序的二手车交易平台

项目介绍 首先,论文一开始便是清楚的论述了小程序的研究内容。其次,剖析系统需求分析,弄明白“做什么”,分析包括业务分析和业务流程的分析以及用例分析,更进一步明确系统的需求。然后在明白了小程序的需求基础上需要进一步地设计系统,主要包罗软件架构模式、整体功能模块、数据…

木字楠后台管理系统开发(2):SpringBoot项目代码生成以及基础接口测试

🎶 文章简介:木字楠后台管理系统开发(2):SpringBoot项目代码生成以及基础接口测试 💡 创作目的:为了带大家完整的体验木字楠后台管理系统模版的开发流程 ☀️ 今日天气:一场秋雨一场寒,天气越来…

云原生之使用Docker部署docker-compose-ui工具

云原生之使用Docker部署docker-compose-ui工具一、Docker Compose UI介绍二、检查本地docker环境1.检查系统版本2.检查docker状态三、下载Docker Compose UI镜像四、部署Docker Compose UI服务1.新建安装目录2.创建Docker Compose UI容器3.检查Docker Compose UI容器状态4.查看…

3 - 线程池 Java内置的线程池

1、ExecutorService的介绍 ExecutorService 接口继承了Executor 接口,是Executor 的子接口。 Executors类 提供工厂方法用来创建不同类型的线程池。Executors是工具类,他提供对ThreadPoolExecutor的封装,会产生几种线程池供大家使用。 关于…

20 个超级实用的 CSS 技巧,帮助你成为更好的开发者

在开发项目中,修改输入占位符样式,多行文本溢出,隐藏滚动条,修改光标颜色,水平和垂直居中等等,这些都是我们非常熟悉的开发场景!前端开发者几乎每天都会和它们打交道,因此&#xff0…

Visual Studio 平台下基于 C# /.NET 的 Android 开发

文章目录Part.I IntroductionChap.I 环境搭建Part.II ExamplePart.I Introduction 因为想尝试一下移动端的开发,所以在网上简单搜了一下移动端开发可以使用的语言,发现 Java, C# 等都可以。虽然用Java的居多,但是笔者对C#较为熟悉一些&#x…

TikTok变现冲不冲?这些TikTok选品方法赶快用上

TikTok电商商家们通常最忧愁的就是不知道如何有效进行TikTok选品。有时候因为选到难卖的产品,就会导致库存积压、资金紧缺等问题。今天,为TikTok电商商家们分享一些好用、有效的TikTok选品方法~ TikTok选品方法一——利用电商平台数据选品 除了一些偏地…

[附源码]JAVA毕业设计文物管理系统(系统+LW)

[附源码]JAVA毕业设计文物管理系统(系统LW) 项目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术&…

速卖通官方公告:“不活跃商品”管理规则,将于12月12日生效!

最新平台动向:速卖通“黑色星期五”大促开始。作为海外最火的促销购物节黑五与世界杯重叠,速卖通上热销海外的国货有了显著的新趋势:越来越多具有更高科技含量的国货在海外走红。其中,速卖通上国产VR眼镜成为今年最火的商品&#…

Kubernetes 调度器详解

kube-scheduler是 kubernetes 系统的核心组件之一,主要负责整个集群资源的调度功能,根据特定的调度算法和策略,将 Pod 调度到最优的工作节点上面去,从而更加合理、更加充分的利用集群的资源,这也是我们选择使用 kubern…

构建高性能内存队列:Disruptor yyds~

Java中有哪些队列 ArrayBlockingQueue 使用ReentrantLockLinkedBlockingQueue 使用ReentrantLockConcurrentLinkedQueue 使用CAS等等 我们清楚使用锁的性能比较低,尽量使用无锁设计。接下来就我们来认识下Disruptor。 Disruptor简单使用 github地址:P…