手握智算中心“绿洲”,毫末跑在中美自动驾驶长跑第一线

news2025/1/14 18:26:54

作者 | 白日梦想家

编辑 | 王博

38e3aa23fd68f8a23eb87d7b3634fb4d.jpeg


2022年过去,数据驱动成为自动驾驶演进共识。沿着数据驱动这条路线,自动驾驶加速迈入智算时代。

智算中心应运而生。

实际上,将智算引入自动驾驶的开先河者是特斯拉,其率先发布了专用于自动驾驶训练的超级计算中心Dojo,此后,一众玩家如毫末、小鹏等纷纷宣布建立智算中心。

各大智算中心比拼什么?

答案是,如何用低成本且高效的方式实现海量数据的闭环驱动。

“自动驾驶大模型加速降低开发成本,数据更接近人驾环境。基于量产实车数据的仿真技术将与自动驾驶云端超大模型结合,迎来新突破。超算中心成为自动驾驶的入门配置。”毫末智行董事长张凯在2023十大自动驾驶趋势预测中表示。

1月5日,在第七届HAOMO AI DAY上,毫末智行正式发布了由其与字节跳动旗下火山引擎联合打造的智算中心雪湖绿洲(MANA OASIS),这也是中国自动驾驶公司首个设立的智算中心。

“绿洲”登场,为我们揭开了智算时代的战场一角,也让毫末成为对阵特斯拉中最有看点的自动驾驶公司之一。


自建智算中心,剑指数据闭环

这应该是目前中国自动驾驶行业最大智算中心了。

每秒浮点运算可达67亿亿次,存储带宽每秒2T,通信带宽每秒800G,毫末官方在介绍MANA OASIS时给出这样一组数据。

22de0decba85e9b70cef09f75bf2bb6b.jpeg

基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现了计算、存储、通讯能力,可让数据更快速转化成知识。

有了这一新利器,毫末智行CEO顾维灏宣布,预计2024年上半年,毫末城市NOH落地将达到100城,2025年实现全无人驾驶。

MANA OASIS的出现是有其背景的。

随着感知技术与计算平台的逐渐成熟与趋同,影响高阶自动驾驶落地的关键因素,不再是解决常见的一般案例,而是解决“路口”问题,也即各类不常见,但不断出现的“长尾问题”,

作为一种模仿人类的科学,AI自动驾驶与人类认知世界的逻辑基本一致,想让汽车更好地理解世界,就需要构建更精准的模型。但算法模型的建立并非一劳永逸,自动驾驶车辆在行驶过程中总会遇到各种陌生场景。

因此,如何对新场景数据进行大规模高效处理并快速优化算法模型,即成为自动驾驶技术迭代的关键。换言之,构建基于数据驱动的自动驾驶数据闭环,让数据实现高效流动,是实现高阶自动驾驶的必由之路。

为满足实现数据闭环的所需要的超大算力数据中心,MANA OASIS出现了。

它的直接任务,便是为毫末智行的MANA数据智能体系提供超级算力,帮助MANA的五大模型实现低成本且高效的迭代。

1c99e69013fa3b475429a383d9b17ec0.jpeg

MANA OASIS具备4大核心能力,包括以稳健系统架构保证高效存储和网络通讯、数据管理能力、算力优化能力以及训练加速能力。

顾维灏介绍,基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现的计算、存储、通讯能力,可以让GPU不再等待数据,数据转化成知识的速度也会更快。毫末数据、算力、训练效率也迎来全面提升。

具体来看,在数据管理能力方面,为充分发挥智算中心价值,让GPU持续饱和运行,毫末历经2年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500us

算力优化方面,毫末与火山引擎合作,部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。

训练效率方面,基于Sparse MoE,通过训练平台的持续优化,毫末可实现单机训练百亿参数大模型,以及实现跨机共享expert的方法,完成千亿参数规模大模型训练,训练成本降低到百卡周级别,训练效率提升100倍。

d80d88439df7b0a713c1a8d3ffa4a485.jpeg

那么,MANA OASIS是怎么提升毫末的数据闭环效率的呢?


帮助MANA五大模型升级,更低成本、更高效

基于MANA OASIS智算中心,MANA数据智能体系的五大模型迎来了升级。

这五大模型包括:视频自监督大模型、3D重建大模型、多模态大模型、动态环境大模型以及人驾自监督认知大模型。

25e1c79301826f2d5c57072f79361b80.jpeg

其中,视频自监督大模型、3D重建大模型的应用目的是为了降低成本,另外三个大模型的应用是为了提升数据流转效率。

具体来说,毫末智行视频自监督大模型主要做数据标注工作,能够让毫末 4D clip 标注实现 100%自动化,人工标注成本降低 98%。

806efd719e3cb0b295fb3dafb25957cb.jpeg

3D 重建大模型可以实现以低成本获取 normal case,生成各种高成本 corner case,其生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低,增加 NeRF 生成的数据后,还可将感知的错误率降低 30%以上。

c51783b73c1a9bda8133e556cc1b6340.jpeg

多模态互监督大模型,能够精准识别异形障碍物。毫末智行通过引入激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达,而通用结构的检测,可以很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。

81d2e6b3de9acf6dd5e5c53e8381bba7.jpeg

动态环境大模型,可以精准预测道路的拓扑关系,让车辆始终行驶在正确的车道中。

1204ca93df778242ebecd2339ee27f0b.jpeg

毫末智行通过在 BEV(鸟瞰图)的 feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将 BEV 特征,解码为结构化的拓扑点序列,实现车道拓扑预测,从而使毫末智行在感知能力上能够像人类一样在标准地图的导航提示下就可以实现对道路拓扑结构的实时推断。

毫末智行认为,解决了路口问题实际就解决了大部分城市 NOH 问题,目前在保定、北京,毫末对于 85%的路口拓扑推断准确率高达 95%。即便是非常复杂、非常不规则的路口,毫末也能准确预测。

人驾自监督认知大模型,能够掌握高水平司机的开车技法,让驾驶决策更聪明。

0f5a5c6357c71e3d7a1e09f4d76fc16c.jpeg

在探索“使用大量人驾数据,毫末智行全新引入用户真实的接管数据,同时用 RLHF(从人类反馈中强化学习)思路先训练一个 reward model(奖励模型)来挑选出更好的驾驶决策。通过这种方式,使毫末智行在掉头、环岛等公认的困难场景中,通过率提升 30%以上。

此外,基于绿洲的支持,MANA最新的车端感知架构,从过去分散的多个下游任务都集成到一起,形成一个更加端到端架构,包括红绿灯、局部路网、预测等任务,实现了跨代升级。

以上这些,意味着毫末的感知能力更强,自动驾驶功能有了更大的可挖掘空间。


 2025年实现全无人驾驶,毫末的底气是什么?

此次AI DAY上,毫末智行正式宣布将在2025年实现全无人驾驶。

毫末智行的底气在是什么?顾维灏给出的答案,是重感知的技术路线、大模型的技术应用。

这里有一个先后顺序,需要先有大量数据,再进行数据的处理和应用。

在智算中心之前,毫末智行率先引入Transform等新技术,确立以数据闭环驱动形式的数据智能体系MANA,其已经成为毫末智行所有产品迭代的核心动力,截止目前,其学习时长已经超过42万小时,虚拟世界驾龄相当于人类司机5.5万年的驾龄。

当前,毫末智行已经完成数十万全要素、多模态CLIPS的标注,在场景库积累方面已经建设完成300万小时中国道路驾驶认知场景库,可以真正做到感知智能和认知智能的有效协同。

9a6b9021e9d1114792c4dd4ea3b7b1b4.jpeg

之后,怎么更好的处理数据。

智算中心的建立,能够让毫末智行在实现数据高效流转闭环的同时,还能够降低整个研发成本,从而促进自动驾驶系统快速实现量产落地。

值得一提的事,毫末智行自研的AEB算法助力魏牌、欧拉、坦克共计四款车型获得ENCAP、ANCAP五星安全,毫末是中国首个自研AEB算法落地海内外的公司,毫末也成为第一个出海欧洲、澳洲的自动驾驶公司。

在专利方面,截止到2022年12月,毫末拥有专利证书146件,全面覆盖数据融合、智能感知、智能决策、控制执行、模型算力提升等领域。

实际上,毫末还有一重优势,那就是背靠长城的量产优势。

毫末智行能够快速实现量产能力,也是能够反哺其自动驾驶技术快速升级迭代的重要因素之一。

目前正在陆续交付中的车型有摩卡DHT-PHEV激光雷达版、欧拉闪电猫、欧拉芭蕾猫、全新一代长城炮等。

这些车型上市之后,也能够为毫末智行提供越来越多的高质量的自动驾驶数据,助力其自动驾驶系统不断迭代升级。

截止2022年底,毫末HPilot搭载车型近20款,已经搭载上市车型包括魏牌摩卡、魏牌拿铁、魏牌玛奇朵、坦克300、坦克500、哈弗神兽、拿铁DHT-PHEV等。用户辅助驾驶行驶里程突破2500万公里。

c8804eb8aed0d767d40f3fac8cda8faf.jpeg

城市辅助驾驶上,毫末智行的城市NOH软件达到交付状态,目前已经开启多城路测,毫末城市 NOH 是中国第一个可大规模落地的城市导航辅助驾驶,搭载毫末城市 NOH 的车型将在 2023 年上市。预计在2024年上半年落地城市达到100个。

毫末智行虽然成立仅三年时间,但已经稳居中国量产自动驾驶第一名。凭借此次发布的智算中心绿洲,毫末在自动驾驶领域的身位将持续靠前。


技术路线殊途同归,自动驾驶决战2025

自动驾驶行业已经进入以商业化量产为主的下半场竞争。

据不完全统计,除北上广之外,深圳、重庆、长沙等40多个省市,都积极出台相应管理办法或实施细则,从载人测试、道路测试、示范运营到无人化等多个阶段开展探索,大力推进自动化驾驶。

同时,据《中国自动驾驶乘用车市场数据追踪报告》发布的数据显示,2022年1季度国内L2级自动驾驶在乘用车市场的新车渗透率已达23.2%。

汽车之家研究院最新的一组报告预测,到2025年,中国L2级以上智能汽车销量将超过1000万辆,相应的智能汽车渗透率将达到49.3%。

与数据形成对比的,则是国内企业在自动驾驶赛道中激进的态度。

除了毫末外,百度此前宣布将于2023年打造全球最大无人驾驶服务区,华为计划将在2025年成为中国自动驾驶领导者。小马智行则表示2025年无人驾驶讲迎来真正的商业化应用。

与此同时,随着自动驾驶商业化落地竞争的开始,不管是走渐进式路线,还是跨越式路线,亦或者是纯感知路线,或多传感器融合路线,最终大家的目的都在殊途同归,即加速自动驾驶技术的量产落地,抢占自动驾驶决赛入场资格。

有业内人士表示,预计到2025年,自动驾驶行业的入场券将会截止。而作为国内走在自动驾驶量产前列的企业,毫末智行无疑已经获得2025决赛入场资格证。

张凯曾提到,数据是驱动自动驾驶成熟的核心要义,渐进式路线是数据积累的最佳路径。如今,随着智算中心绿洲的出现,毫末对数据和大模型的应用越来越娴熟,自动驾驶再进一步已是顺理成章。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/145508.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

登录与授权

目录 1.获取用户信息 1.button.open-type.getUserInfo 2.open-data组件 3.wx.getUserProfile(Object object) 头像昵称填写功能 2.登录 登录的流程图 sessin_key 3.授权 wx.openSetting wx.getSetting wx.authorize 手机号授权 登录与授权是两个不关联的事情&…

[Leetcode] 相同的树、对称二叉树

相同的树和对称二叉树都可以使用递归实现。相同的树题目链接:https://leetcode.cn/problems/same-tree/solution/xiang-tong-de-shu-by-leetcode-solution/1.1 递归、深度优先搜索使用递归,将问题转换为 --> 判断当前节点是否相同 判断左右子树分别是…

以前不知道字节面试难在哪,现在体验到了,被虐的很惨...

人们都说,互联网寒冬来了,这个时候还在大面积招人的公司,必然是牛逼的公司。而这个时候勇敢跳槽的人,必然是牛逼的人。于是我开始了字节跳动的社招面试。 为了这天,我前一天排老长的队,理了个利落的发型&a…

蚂蚁帮路由器Antbang A3s V2.0刷入OpenWrt/LEDE

参考资料路由器基本常识_冰色阳光的博客-CSDN博客_路由器bootloader是什么https://www.right.com.cn/forum/thread-3191610-1-1.html已知问题刷入OpenWrt/LEDE后,似乎路由器的Reset键不起作用。路由器在启动时,正常会先运行引导程序Breed,然后…

LinuxC—文件系统学习笔记

文件系统 1 目录和文件 1.1 获取文件属性信息stat 相关函数 stat() 得到file指向的文件并将其属性回填到buf中,面对符号链接文件时获取的是所指向的目标文件的属性 /* Get file attributes for FILE and put them in BUF. */ extern int stat (const char *__res…

Jetson nano 入手系列之5—远程可视化访问:jupyter lab与VNC连接

Jetson nano 入手系列之5—远程可视化访问:jupyter lab与VNC1. jupyter lab1.1 安装jupyter lab1.2 配置jupyter_lab1.3 打开jupyter lab1.3.1 ip地址方式打开1.3.2 cmd中ssh方式打开2. vino与VNC Viewer2.1 vino的安装2.2 Desktop Sharing配置与设置2.3 启动vino s…

ICG-DBCO;吲哚菁绿-二苯基环辛炔,荧光染料标记DBCO

中文名:吲哚菁绿-二苯基环辛炔 英文名:ICG-DBCO,ICG-Dibenzocyclooctyne 分子式: C63H64N4O5S 分子量: 989.27 g/mol 外观:绿色粉末 激发发射波长:785/821nm 结构式: ​ 溶解度:有机溶剂/水 储藏方法…

使用无人机 LiDAR 的重叠树冠的新型植被点云密度树分割模型

Paper题目:A Novel Vegetation Point Cloud Density Tree-Segmentation Model for Overlapping Crowns Using UAV LiDAR Abstract 由于常用的冠层高度模型(CHM)的局限性,在具有高密度和重叠树冠的森林生态系统中检测和分割单个树木经常会导致偏差。针对…

Flink 第3章 反压策略

概述Flink 中文网站的讲解https://flink-learning.org.cn/article/detail/138316d1556f8f9d34e517d04d670626涉及内容:网络流控的概念与背景TCP的流控机制Flink TCP-based 反压机制 1.5之前Flink Credit-based 反压机制 1.5及以后总结与思考网络流控的概念与背景为什…

AtCoder Beginner Contest 283 E - Don‘t Isolate Elements

E - Dont Isolate Elements (atcoder.jp)题意:题意:定义孤独的数为,该数上下左右的数都和它相反给定一个01矩阵,每次操作可以把某一行的数取反,问你把该矩阵变成没有孤独的数的最少操作次数是多少思路:一开…

AI降噪的N种数据扩增方法

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已 基于统计信号处理的传统噪声抑制方法是通过检测持续的背景声,来估计背景噪声,然后通过估计到的背景噪声计算增益因子对带噪语音进行抑制。但这种方式针对规律的稳态噪声比较…

【算法笔记】最近公共祖先(LCA)算法详解

0. 前言 最近公共祖先简称 LCA(Lowest Common Ancestor)。两个节点的最近公共祖先,就是这两个点的公共祖先里面,离根最远的那个。 这种算法应用很广泛,可以很容易解决树上最短路等问题。 为了方便,我们记…

企业内训方案|领导力与执行力/TTT内训师/管理者情商修炼

企业内训方案|领导力与执行力/TTT内训师/管理者情商修炼 》》领导力与执行力 从精兵到强将 高绩效团队协作与跨部门沟通 核心人才的管理与激励 卓越管理者的胜任力提升 MTP中层管理技能提升训练 打造高绩效团队 高效沟通技巧 高绩效团队管理(中高层/中基层&#xf…

CRM帮助企业实现销售自动化

随着互联网技术的发展,各家企业都善用互联网优势发布各种信息,导致潜在客户被各种推销信息所淹没,销售周期延长,企业可以借助CRM有效规范销售流程,帮助企业实现销售自动化。 前言 各行各业的业务流程中似乎都少不了销…

OSPF综合实验(1.5)

目标: 1、首先进行基于172.16.0.0/16的ip地址规划 首先题中有5个区域和一个RIP共需要5个网段 可以借3位划分为8个网段 172.16.0.0/19 area 0 然后将172.16.0.0/19再借6位分为172.16.0.0/25---172.16.31.128 25作为其中前一个骨干ip网段 172.16.0.0/25在用于只…

TCP滑动窗口机制(附图例)

文章目录前言一、滑动窗口的引出二、流量控制2.1 16位窗口大小2.2 发送缓冲区2.3 逐步解析滑动窗口运作三、快重传机制四、拥塞控制(仅供参考)五、延迟应答与捎带应答(略)总结前言 博主个人社区:开发与算法学习社区 博…

测开-刷笔试题时的知识点

圈复杂度(暂缓)复杂度越大,程序越复杂计算公式:V(G) E - N 2E代表控制流边的数量,n代表节点数量V (G) P 1p为判定节点数几种常见的控制流图:Linux文件权限具有四种访问权限:r(可…

进程信号理解3

进程信号理解3 1.什么叫做信号递达 实际执行信号的处理动作叫做信号递达,比如默认,忽略,自定义动作 2.什么叫做信号未决? 信号产生到信号递达的状态叫做信号未决 3.进程被阻塞和进程被忽略有什么区别? 进程被阻塞属…

iPhone更换字体教程,无需越狱,支持所有苹果设备!

上周开始,技术大神zhuowei 发现了一个iOS系统更换字体的漏洞,经过不断修正,现在已经可利用上了! 先来看看更换字体后的效果,更换之后,所有App上的字体都得到更改,下图是打开文章的效果 下图是聊…

excel查重技巧:如何用组合函数快速统计重复数据(上)

统计不重复数据的个数,相信不少小伙伴在工作中都遇到过这样的问题。通常的做法都是先把不重复的数据提取出来,再去统计个数。而提取不重复数据的方法之前也分享过,基本有三种方法:高级筛选、数据透视表和删除重复项。其实使用公式…