为什么是毫末智行成为了DriveGPT的破壁人?

news2024/10/4 18:29:59

作者 | 魏启扬

来源 | 洞见新研社

毫末智行有着天生的紧迫感。

很多科技公司一年才举办一次的品牌日活动,毫末智行硬是办成了一个季度一次,活动频次的提高,则意味着组织内部新陈代谢的提速,从研发到落地乃至运营,都要跟上步点节奏。

毫末智行用这样一种方式来鞭策自己在自动驾驶道路上的进取之心。

4月11日结束的第八届HAOMO AI DAY,活动规格再上台阶,吸引了中国汽车芯片联盟联席理事长、中国电动汽车百人会副理事长董扬,同济大学教授、汽车安全技术研究所所长朱西产,清华大学车辆与运载学院教授曹东璞、华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇等业内大咖参会。

在影响力持续扩大的同时,毫末智行再次更新了自己在技术、产品和生态上的进展,其中城市NOH即将量产上车与毫末DriveGPT 雪湖·海若的发布成最大亮点。

前者是中国首个重感知、不依赖高精地图的城市NOH,将最先落地北京、上海、保定等城市,后者则是全球首个自动驾驶生成式大模型。

NOH量产上车,毫末智行过去就曾做过预告,此次确定了更具体的落地时间,算是兑现了之前“夸下的海口”。

至于雪湖·海若 ,在GPT火热的当下,参与其中的自动驾驶公司也不少,为什么是毫末智行率先发布,成为很多人心中的谜团。

01 自动驾驶大考年,毫末智行冲在最前线

毫末智行加快推进NOH的落地进程,很大一部分原因在于智驾产品已经进入到全线爆发的前夜。

来自工信部和高工智能汽车研究院的数据显示,2021年乘用车L2级智驾产品的搭载率是23.5%,全年共交付了476万辆。

到了2022年,乘用车上车的智驾产品升级到L2级以上,搭载率提升到29.4%,全年了交付了585.99万辆。

按照这一趋势预测,到2025年时,乘用车L2级以上智驾产品的搭载率将达到70%。

毫无疑问,正在经历的2023年和还没到来的2024年将十分关键,用毫末智行董事长张凯的话来说,“2023年既是自动驾驶的冲刺之年,也是大考之年”。

张凯判断,智驾产品今年的爆发将主要集中在两个方面。

第一个是城市导航辅助驾驶产品将围绕量产上车发力,主要玩家的城市辅助驾驶产品进入到真实用户覆盖和多城市落地的比拼。

另一个是行泊一体和无人车商业化将成为自动驾驶公司深耕的重点。在乘用车领域,搭载行泊一体功能的智驾产品将迎来前装量产潮。

事实上,毫末智行作为“渐进派”的代表,坚定认为辅助驾驶是通往自动驾驶的必由之路,因而在过往,一直致力于推动智驾产品上车。

2021年推出HPilot 1.0版本,当年即完成坦克300城市版、魏牌拿铁、魏牌玛奇朵、哈弗神兽5款车型的量产上车,搭载乘用车数量超过数万台。

2022年,毫末智行对HPilot进行了两次大版本更新,HPilot月度搭载增速超过200%,与此同时,毫末城市NOH辅助驾驶系统也完成了量产交付,搭载HPilot 3.0的新摩卡DHT-PHEV魏牌蓝山将在2023年先后上市。

根据毫末智行官方公布的数据,截至目前,毫末HPilot整体已搭载近20款车型。用户辅助驾驶行驶里程突破4000万公里,HPilot 2.0 辅助驾驶日均里程使用率达到了12.6%。

NOH的推进方面,目前已经在北京、保定、上海等城市开启泛化测试,即将量产上车,毫末智行预测,到2024年,城市NOH将有序落地100城,届时,毫末辅助驾驶乘用车总量也将来到百万量级别。

有业内人士评述,即便按照当前的节奏不变,毫末智行智驾产品量产落地的速度也已与友商拉开了差距,至少领先行业一年以上。

毫末智行的”快”主要体现在两个方面,一个是产品的推新和迭代速度快,一个是由量产落地而带动的规模覆盖。

不得不说毫末智行选择了一条最为“稳妥”的自动驾驶路线。

在应对行业竞争,推动自动驾驶落地的过程中,我们很清晰的看到,HPilot、城市NOH等智驾产品正在源源不断的为毫末智行提供营收,而随着这些智驾产品的每一次迭代升级,自动驾驶能力一点点的向上提升,毫末智行距离全无人驾驶的星辰大海也更近了。

除了自动驾驶量产上车之外,毫末智行还公布6P开放合作的进展,目前已与3家主机厂签署定点合同,相关项目正在交付中。

在此之前,行业对毫末智行发展潜力存疑的主要观点是过于依赖长城,如今6P合作实现突破,表示毫末智行开始走出长城,迈向更广阔的发展空间,构建属于自己的“长城”。

02 数据“第一性原理”,DriveGPT雪湖·海若的主要支撑点

将ChatGPT与DriveGPT雪湖·海若进行对比,虽然都是GPT,但运行条件和应用场景还是有很大的不同。

ChatGPT是对话式的生成式自然语言模型,输入是自然语言的文本串,输出就是自然语言的文本,目前ChatGPT主要完成通用的下游语言生成任务,比如多轮对话、代码生成、翻译、数学运算等。

DriveGPT雪湖·海若是用于自动驾驶场景的生成式大模型,输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。

DriveGPT雪湖·海若的实现过程是,首先在预训练阶段通过引入量产驾驶数据,训练初始模型,再通过引入驾驶接管Clips数据完成反馈模型(Reward Model)的训练,然后再通过强化学习的方式,使用反馈模型去不断优化迭代初始模型,形成对自动驾驶认知决策模型的持续优化。

毫末智行CEO顾维灏在自动驾驶技术领域的眼光独到,布局非常领先。

早在 2021 年,毫末智行就已经开始了 Transformer 大模型技术的探索,并快速落地应用到 BEV 视觉感知算法当中,然后又以五大模型的方式来实现自动驾驶感知、认知算法的快速升级,现在这些大模型将统一到 DriveGPT 生成式大模型当中,最终目标是实现端到端自动驾驶。

很明显,和ChatGPT一样,DriveGPT雪湖·海若的技术原理并不复杂,但为何是毫末智行抢到了落地的头炮呢?

因为要想获得理想的训练结果,必须具备两个条件,海量的数据和超强的算力,而这恰恰是毫末智行区别于其他自动驾驶公司的优势长板。

先看数据。

去年9月的第6届HAOMO AI DAY上,CEO顾维灏向外界确认,毫末智行正式进入数据驱动的自动驾驶 3.0 时代。

如何理解?毫末智行依托HPilot的量产,目前已经积累了超过4000万公里辅助驾驶里程的数据,就场景来看,包括城市道路、城市快速路和高速;就数据分类来看,既有真实的感知数据,也包含真实的人驾数据。

毫末智行的数据优势并不是数据量的多少,而是获取数据的能力。

以HPilot为代表的智驾产品一直在持续的大规模量产上车,这也是说,毫末智行拥有稳定且优质的数据源,这些数据被投喂到MANA数据智能体系的训练中,推动MANA的进化成长,从而完成数据在其设计的技术架构内的闭环。

截至到2023年4月,MANA学习时长超56万小时,虚拟驾龄相当于人类司机6.8万年。

再来看看算力。

毫末智行很早就预见了算力对于自动驾驶研发的重要性,与特斯拉建设超算中心Dojo类似,毫末智行今年1月发布了中国自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),算力达67亿亿次/秒。

通过一系列的训练框架、性能、通信等优化,MANA OASIS可单机实现训练100亿参数规模的大模型的能力,同时执行多任务、多模态并行的训练,大幅提升计算效率。

为了支持DriveGPT雪湖·海若的训练,毫末智行还对MANA OASIS在算力层面进行三大能力的升级。

1、搭建了“全套大模型训练保障框架”,实现了异常任务分钟级捕获和恢复能力,可以保证千卡任务连续训练数个月没有任何非正常中断,有效保证了大模型训练稳定性;

2、研发出以真实数据回传为核心的增量学习技术,并将其推广到大模型训练,构建了一个大模型持续学习系统,自主研发任务级弹性伸缩调度器,分钟级调度资源,集群计算资源利用率达到95%;

3、MANA OASIS通过提升数据吞吐量来降本增效,满足Transformer大模型训练效率,通过引入火山引擎提供的Lego算子库实现算子融合,端到端吞吐提升84%。

古希腊哲学家亚里士多德曾提出过“第一性原理”的哲学术语,翻译过来就是,“每个系统中存在一个最基本的命题,它不能被违背或删除。”

从毫末智行所表现出来的技术理念来看,无论是走“渐进式”路线,还是建设算力基础设施MANA OASIS,围绕的中心都是数据,在毫末智行的认知中,数据就是自动驾驶的“第一性原理”,基于此,毫末智行构建起行业竞争的护城河。

03 从毫末到雪湖再到海诺,自动驾驶的中国式浪漫

在DriveGPT雪湖·海若发布之外,另外一个值得关注的点是,毫末智行还对外开放了该模型。

北京交通大学计算机与信息技术学院、高通、火山引擎、华为云、京东科技、四维图新、魏牌新能源、英特尔等单位成为首批合作伙伴。

此外,毫末智行在使用数据的过程中,还建立了一套极具性价比的,基于4D Clips数据的自动化标注方案。

目前,一张正确标注结果的图片在行业中的市场价是5块钱,如果使用DriveGPT的标注服务,这个价格将只需5毛钱。

毫末智行计划,这项图像帧及4D Clips自动标注服务将逐步向行业开放使用。

很明显,毫末智行发布DriveGPT雪湖·海若,并不是炒作跟风,而是真真切切的在做自动驾驶研发,更难能可贵的是,毫末智行很多前沿技术不光是为自己所用,还将其开放出来,以生态共建的形式,为行业的发展添砖加瓦。

其实,从毫末智行公司名字的由来,到自动驾驶智算体系MANA雪湖的命名,再到DriveGPT雪湖·海若的来源,能够窥视出毫末智行在自动驾驶这件事情上一以贯之的企业价值观。

“毫末”二字取自道家学派创始人老子之《老子·第六十四章》:“合抱之木,生于毫末。九层之台,起于累土。千里之行,始于足下。”强调的是一点一滴积累、脚踏实地耕耘的重要性。

“雪湖”这一名称,出自科幻小说《三体》第二部《黑暗森林》,说的是主人公罗辑在星空、雪山、森林、草地和湖畔之间徜徉思考,直到有一天在湖中寻找到了破解“三体危机”、拯救地球的方法。

将其延伸,“雪湖”这个名字代表了毫末对人类社会和科技趋势发展的热情,承载着毫末以AI通向自动驾驶梦想的思考。

“海若”则出自《庄子·秋水》,里面有两个神话人物河伯和北海若。河伯请教北海若,何谓大小之分,北海若教导,不因天地而觉大,不因毫末而觉小。其中蕴含着智慧包容、海纳百川的寓意。

将上述命名来源进行梳理,可以发现毫末智行的企业价值观融汇了中国古代经典的道家思想和科幻巨作天马行空式的哲学思辨,再结合当前正在从事的最前沿的自动驾驶事业,毫末智行呈现出特立独行的气质,更宏观的视角,还能看到一种与众不同的中国式浪漫。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/411241.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT 这个风口,普通人怎么抓住?

最近在测试ChatGPT不同领域的变现玩法,有一些已经初见成效,接下来会慢慢分享出来。 今天先给大家分享一个,看完就能直接上手的暴力引流玩法。 所需工具: 1)ChatGPT(最好是plus版,需要保证快速…

一个开源的大型语言模型LLaMA论文简单解读,LLaMA: Open and Efficient Foundation Language Models

一个开源的大型语言模型LLaMA论文解读,LLaMA: Open and Efficient Foundation Language Models返回论文和资料目录 1.导读 LLaMA 是 Meta AI 发布的包含 7B、13B、33B 和 65B 四种参数规模的基础语言模型集合,LLaMA-13B 仅以 1/10 规模的参数在多数的 …

ASEMI代理AD8638ARJZ-REEL7原装ADI车规级AD8638ARJZ-REEL7

编辑:ll ASEMI代理AD8638ARJZ-REEL7原装ADI车规级AD8638ARJZ-REEL7 型号:AD8638ARJZ-REEL7 品牌:ADI /亚德诺 封装:SOT-23-5 批号:2023 安装类型:表面贴装型 引脚数量:5 类型&#xff1…

初谈 ChatGPT

引子 最近,小编发现互联网中的大 V 突然都在用 ChatGPT 做宣传:“ChatGPT不会淘汰你,能驾驭ChatGPT的人会淘汰你”、“带领一小部分人先驾驭ChatGPT”。 确实,ChatGPT这个新生事物,如今被视为蒸汽机、电脑、iPhone 般的…

【ChatGPT 】国内无需注册 openai 即可访问 ChatGPT:ChatGPT Sidebar 浏览器扩展程序的安装与使用

一、前言 问题:国内注册 openai 账号麻烦,新必应有部分人也无法登录成功,存在域名单点登录失败等问题,所以无法真正使用 ChatGPT 解决:大部分人仅需使用 ChatGPT 的搜索功能,无需真正对话,需要…

云计算技术的现状和未来发展趋势分析

近年来,随着互联网、物联网、大数据等技术的不断发展,云计算技术也随之崛起并迅速发展。云计算技术作为一种新的计算模式,不断地改变着我们的生活和工作方式,成为了当今IT产业的一股强大的力量。本文将详细探讨云计算技术的现状和…

第十天面试实战篇

目录 一、springboot的常用注解? 二、springmvc常用注解? 三、mysql的内连接和外连接有什么区别?比如有两张表:A和B内连接只返回两个表A和B的交集部分 四、redis分布式锁的缺点有哪些? 五、如何使用reddssion解决r…

多个渠道成功销售的秘诀速递

将您的电子商务业务扩展到多个渠道销售似乎是一项艰巨的任务吗?但如果有了正确的多渠道增长战略,这可能是实现快速增长的好方法。当然,您需要考虑借助一些工具与策略,而SaleSmartly(ss客服)可以为您提供。 …

Python做个猫狗识别系统,给人美心善的邻居

嗨害大家好鸭!我是爱摸鱼的芝士❤ 宠物真的看着好治愈 谁不想有一只属于自己的乖乖宠物捏~ 这篇文章中我放弃了以往的model.fit()训练方法, 改用model.train_on_batch方法。 两种方法的比较: model.fit():用起来十分简单&#…

【剧前爆米花--爪哇岛寻宝】java文件操作和io流

作者:困了电视剧 专栏:《JavaEE初阶》 文章分布:这是一篇关于文件操作的文件,介绍了文件读写以及相关对象的内容,希望对你有所帮助! 目录 文件操作 文件路径 绝对路径 相对路径 File类 File类的构造方…

REDIS Hash 槽 与 一致性hash

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,可以解决你的问题。加群请联系 liuaustin3 ,在新加的朋友会分到2群(共…

Spring boot+Vue3博客平台:文章发布与编辑功能的技术实现

本文将详细介绍如何实现一个博客平台中的文章发布与编辑功能,包括前端的Vue组件设计和后端的Spring Boot接口实现。在阅读本文后,您将了解如何设计和实现高效、易用的文章发布与编辑功能。 一、发布文章 设计思路 在设计文章发布功能时,我们…

vscode中调试rust程序

文章目录一、vscode运行和调式rust程序二、常见问题1.rust: Request textDocument/formatting failed.2.cargo命令3.使用rust-gdb调试rust程序4.cargo build太慢一、vscode运行和调式rust程序 环境:在WSL(ubuntu20.04)中使用vscode &#xf…

数据技术嘉年华星光璀璨,云和恩墨全栈数据技术能力闪耀会场

导语 2023年4月7-8日,由中国DBA联盟(ACDU)和墨天轮社区联合主办的第十二届『数据技术嘉年华』(DTC 2023)在北京成功举办。云和恩墨作为大会的协办方和深度参与者,以6场演讲2大展台全面呈现公司的全栈数据技…

几何算法——4.交线(intersection curve)的表达与参数化、微分性质

几何算法——4.曲面求交的交线(intersection curve)的表达与参数化、微分性质1 关于曲面求交的交线表达2 交线的微分性质3 交线的参数化4 修正弦长参数化的微分性质1 关于曲面求交的交线表达 两个曲面求交,比较经典的方法是用跟踪法&#xf…

wsl使用vscode搭建自己的MySQL

装wsl装MySQL装wsl 我已经装好了,就不说了 装MySQL 安装 MySQL 服务器:终端命令行输入sudo apt install mysql-server 安装完成后,MySQL 服务器会自动启动并在 Ubuntu 启动时启动。您可以使用以下命令检查 MySQL 服务器是否正在运行:sudo ser…

【三十天精通Vue 3】第六天 Vue 3 计算属性和监听器详解

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: 三十天精通 Vue 3 文章目录引言一、Vue 3 计算属性概述1.1 计算属性的简介1.2 计算属性的分类…

第二十章 案例TodoList之动态数据

我们之前已经实现了静态的组件拆分,既然是静态说明数据就是死的,显然这不是我们需要的结果,之前我们学习了React组件,知道组件里面的状态数据驱动了页面的显示,每个组件都有属于自己的状态数据。接下来我们改造组件使得…

SAR ADC系列25:作业和上机实践

作业: 异步SAR逻辑中VALID信号如何产生?答:OUTP和OUTN与非。单纯通过减小“比较器环路”的延时(t1t22*t32*t4)的方式来提升ADC的转换速率可行吗?为什么?答:不可行,还要考虑CDAC建立的速度&…

【ARMv8 编程】A64 数据处理指令——位域字节操作指令

有些指令将字节、半字或字扩展到寄存器大小,可以是 X 或 W。这些指令存在于有符号(SXTB、SXTH、SXTW)和无符号(UXTB、UXTH)变体中,并且是适当的位域操作指令。 这些指令的有符号和无符号变体都将字节、半字…