“毫末预计,到2025年中国高阶辅助驾驶搭载率将达到70%。而在汽车新消费领域,中国汽车市场增换购消费比例将达到60%,智能驾驶功能成为必选因素,并迎来商业化的加速发展。”1月5日,第七届HAOMO AI DAY上,毫末智行董事长张凯对自动驾驶宏观趋势进行了全面分析。
首先,站在2023年的时间拐点,智能驾驶的下半场进入加速期,高阶辅助驾驶产品的商业应用将迎来大规模落地。“自动驾驶全面进入3.0时代。”在张凯看来,从全球来看,以数据驱动为标志,特斯拉成为率先进入自动驾驶3.0时代的代表。
而在中国,以毫末智行等渐进式自动驾驶企业为代表,正在通过规模量产和高阶辅助驾驶场景落地实现数据闭环,推动自动驾驶技术快速走向成熟,与美国企业一起全面领跑自动驾驶3.0时代。
数据驱动的背后,则是需要一个强大的超级计算中心,来完成闭环体系的最后一环。
今年,毫末智行智算中心“雪湖·绿洲”(MANA OASIS)正式重磅发布,这是中国自动驾驶行业最大智算中心,每秒浮点运算达到67亿亿次。这意味着,在感知、认知等层面,毫末智行可以继续领跑行业,引领大模型、大算力、大数据发展方向,冲刺进入自动驾驶3.0时代。
这些数据来自,2024年上半年毫末城市NOH落地将达到100城,这是中国第一个可大规模落地的城市导航辅助驾驶,并基于重感知、大模型的技术路线及技术应用、用户闭环的数据建设。
公开数据显示,2022年毫末持续稳居中国量产自动驾驶第一名,三代HPilot产品搭载至魏牌、坦克、欧拉、长城炮等近20款车型,辅助驾驶用户行驶里程突破2500万公里。
此外,搭载毫末HPilot的300台摩卡DHT-PHEV车型也已奔赴欧洲。毫末不但是中国首个自研AEB算法落地海内外的公司,也是中国首个出海欧洲、澳洲的自动驾驶公司。
“毫末城市NOH是中国首个可大规模量产的城市导航辅助驾驶。毫末城市NOH的领先性表现在:重感知技术路线领先,大模型的技术应用领先,用户闭环数据建设领先。”毫末智行CEO顾维灏表示。
目前,毫末历经两年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。
在算力优化方面,毫末部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。
在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本降低100倍。
而产品高速迭代的背后,是毫末打造的业内独有的产品能力迭代铁三角:即场景化用户体验设计、人工智能技术、技术工程化能力。基于此,MANA已形成了强大的数据智能驱动体系,它包含六大闭环:用户需求闭环、研发效能闭环、产品自完善闭环、数据积累闭环、数据价值闭环、业务工程化闭环。
其中,数据积累闭环部分,毫末通过自研自动化数据采集、自动化数据标注工具,在2022年底数据成本降低98%;数据价值闭环部分,让毫末的全新车型复用开发只需4个月时间即达到量产落地状态,全新车型匹配标定2个月内匹配完成。
事实上,今年全球不少车企也已经在搭建自己的超算中心。在张凯看来,这将成为自动驾驶企业的入门配置。“大模型+大数据”的数据驱动模式,成为自动驾驶技术进化的关键,而驱动大模型和海量数据训练的超算中心是关键。
而支持功能不断迭代升级的,还有硬件。
在张凯看来,全新一代芯片、传感器将进入市场,自动驾驶生态呈现更丰富的多样性。随着我国智能汽车渗透率的快速提升,正带动车端芯片、传感器数量的强劲增长。其中,2023年,国内外新一代的AI芯片,以及性能更好的4D毫米波雷达、补盲激光雷达将大量进入市场。
背后,还有大模型在数据合成、知识提取等方面的能力提升。
过去一年,我们看到国内越来越多的自动驾驶公司,正在将Transformer大模型应用到自动驾驶算法当中。作为最早投入研究和应用的公司,毫末发现随着大模型的引入,使得自动驾驶在数据合成、知识提取等方面的能力有大幅提升,而相应开发成本则在大幅降低,技术迭代速度更是实现量级提升。
最关键的,仍是企业开发效率的提升。
比如,在MANA OASIS的加持下,基于视觉自监督大模型,让毫末在中国首个实现4D Clip的100%自动标注,原先依靠的人工标注成本则降低98%。
此外,毫末将爆火的三维重建NeRF技术应用在自动驾驶场景重建和数据生成中,它通过改变视角、光照、纹理材质的方法,生成高真实感数据,实现以低成本获取normal case,生成各种高成本corner case。
在基础上,3D重建大模型生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低,增加NeRF生成的数据后,还可将感知的错误率降低30%以上。
而毫末视频自监督大模型的泛化性效果,可以实现即使是在一些非常困难的场景(严重遮挡的骑行者,远处的小目标,恶劣的天气和光照等)都能准确地完成自动标注。
同时,针对城市多种异形障碍物的稳定检测问题,毫末正在思考和探索更加通用的解决方案。比如,多模态互监督大模型引入了激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达,很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。
而在张凯看来,2023年,中国自动驾驶企业能否冲刺进入3.0时代,城市场景辅助驾驶如何快速实现规模化量产交付,将成为未来一年最为值得期待的关键趋势。
按照毫末智行公布的数据,预计到2024年上半年,毫末将完成HPilot落地中国100个城市的计划,实现点点互达。到2025年,更大规模全场景的NOH将更快落地,全面迈入全无人驾驶时代。