国内首家,极越展示纯视觉城市NOA,正面对决特斯拉FSD

news2025/1/13 13:41:57

作者 | 德新

编辑 | 王博

96ac984862adf64cb31e93842944021e.jpeg

10月17日,极越宣布其基于纯视觉的高阶智驾方案,已在上海核心城区跑通城市领航辅助功能,同时官方还首次公布了与百度联合开发的Occupancy占用格栅网络技术。

基于对极越一贯的判断,我们认为,极越的第一款车极越01,大概率将量产纯视觉城市领航方案

极越01极有可能是国内第一款搭载纯视觉城市领航方案的车型。

过去国内所有搭载城市领航功能的车型都选择了多传感器融合、带有激光雷达的方案。极越的路线布局,将是国内车企第一次在智驾技术路线上与特斯拉FSD正面PK。

一、国内首家公布纯视觉城市NOA,极越的研发历程

极越公司在2021年3月份组建,当年6、7月这支团队完成初步搭建,并启动了车型产品的研发。严格来讲,极越01从产品定义到即将上市,只用了两年零四个月时间。

在最初定义产品时,极越内部就想走纯视觉智驾的方案路线。

最早,极越CEO夏一平和百度智能驾驶事业群组的首席研发架构师王亮讨论量产的路线,受限于算力平台以及算法性能,当时的方案决定增加激光雷达,并且与视觉系统相互独立,作为一套冗余的安全兜底。

但到2022年底、今年初,随着BEV+Transformer等的算法成熟,切换纯视觉方案再次被提上议程。其中重要的因素是大算力芯片量产,以及业界在大模型上的技术工程突破。

夏一平说,「如果换作去年,我当时觉得要实现(完全)自动驾驶,需要10年时间。今年随着有GPT4等一系列业界特别优秀的工程实践出来后,我评估3-5年是可以实现的。」

在上车纯视觉方案之前,王亮找夏一平详细沟通了所需要的数据集、算法训练需要的算力规模以及开发周期。

极越很快在全国投入了几百台用于纯视觉方案的测试车,用于采集数据,加快算法的迭代改进。

极越的智驾方案在开发初期,就采用了一部分高度统一的架构,比如AEB、泊车以及行车,采用的是统一的大模型来感知,这在开发初期推进非常困难,但极越和百度Apollo坚持认为这是未来方向。

王亮总结智驾系统长期的演进方向应该是「大道至简」。硬件的复杂性降低,模型算法越来越集中,而基于规则和假设的算法越来越少。

二、「BEV+Transformer+OCC」,实现纯视觉城市NOA的关键突破

我们预估,极越预计今年会上马量产纯视觉城市领航方案,实际上这套纯视觉方案不是短期就能干出来的。

2019年,百度内部出于对一些技术进展的观察以及产品驱动的需求,决定开辟一条新的技术路线,从原来的L4技术栈中解绑激光雷达。所以王亮当时带领了一支小规模的团队,开始了纯视觉L4方案的开发。

而极越的智驾方案在产品定义初期,就将视觉系统与激光雷达系统设计相互独立,互为冗余。从2021年开始,极越联合百度Apollo,基于新的BEV + Transformer的技术对此前的纯视觉方案进行了重构,比如用更加集中化的AI算法模型来解决感知问题。

引入BEV+Transformer对算法的迭代效率提升明显

在过去,模型算法的架构是由许多分层的小模型构成。举个例子,一些小的模型会关注车轮、转向灯以及车道线的识别,这个时候算法根据小模型感知的结果再编写一些规则,比如车轮压到车道线,并且转向灯亮时可能前车要变道。而当内部有较多的模型时,系统的复杂性会增加。

BEV+Transformer引入之后,用一个中央大模型替代很多小模型,而数据灌入会带来直接的体验变化,这比过去修改许多小模型以及规则,效果要好很多。

所以夏一平说,「数据生产的质量和效率,是未来竞争的关键。」

自动化数据产线,是百度的一大优势。

百度目前有上千台Robotaxi的运营规模,因此这些年搭建了一条非常高效的数据产线。带有时序的4D数据无法沿用过去人工标注的方式,而上一代的感知算法可以用于生成标注数据来训练下一代的模型。

368d8cd76a7ad07ab62beaa609432cc9.jpeg

再往下一步,纯视觉目前最大的诟病,是对未知异形障碍物的识别。Occupancy Network占用格栅网络(简称「OCC」),通过视觉三维重建的方式,解决针对特殊物体的识别问题。

激光雷达的优势胜在测距精准,但纯视觉的方案能够提供更加丰富的语义信息,并且点云更加稠密,而且避免了异源传感器之间的时间同步、标定等问题的影响。

「相比于纯视觉的方案,激光雷达算法不那么吃数据,因为后者本质是几何信息。」王亮说。几何信息内涵相比于图像信息是有限的,因此投喂一定量的数据之后,激光雷达算法的上限提升不如视觉算法明显。

特斯拉FSD的V11是全球第一套量产了OCC的智驾系统。我们采访了一些在美国的FSD用户,从V10-V11,增加了OCC之后,对城区特殊目标的感知提升明显,尤其是针对近距的物体。

按照目前的进度来看,极越很有可能成为全球量产OCC的第二家

不仅技术上对标,商业化上,极越也开始针锋相对,多家门店已经亮出了吸引特斯拉车主的特殊权益——2000元的“特”后悔基金,将全面硬刚特斯拉的氛围拉满。

b27f98e181371cd91836a0266a603cc6.jpeg

三、这可能是今年在智能化上,最激进的车型

2021年李彦宏邀请夏一平出山,两人最早有一个根本的共识,就是智能化会决定未来汽车的发展方向,成为核心的竞争力。

当时夏一平看到其中一个关键要素是两颗芯片,一个是高通的8295,一个是英伟达的Orin。有了这两颗芯片,才能承载很强的智能化能力,把过去放在更贵的工控机、在云端上跑的算法,在车端跑起来。

所以夏认为,今天竞争的核心是把这些要素的能力发挥出来,做到最大。

很多公司今天对8295的利用,是把8155上的系统迁移到8295上,尽管这样做确实会让系统更流畅,但本身并没有发挥出8295的价值。

极越在上面做了一套目前体验过的,业界最流畅、识别和响应效果俱佳的语音交互系统,并且有不少有特色功能的创新。

比较有意思的是,高通这代8295内置了两个NPU,大部分公司只用了其中的一个,也就是30T左右的算力。而极越做完语音的大模型之后,30T的算力基本用尽,又授权解锁了另一个NPU,用剩下的30T算力来做图形渲染以及游戏等应用。

fda02017ac4b08b3ec2c0cd470e5faec.jpeg

智能化最核心的智驾功能,也将是全系标配的策略。极越已经透露,城市领航功能,到今年底会在包括上海在内的多个城市可用。

在交互上全力推动语音的使用,取消换挡拨杆、取消门把手,智驾系统布局纯视觉方案,极越有不少激进的做法。

整个产品开发的过程中,因为开发难度大,夏一平自己也坦诚「一度非常焦虑」。

不过,「我敢说,今天说极越是行业里智能化的标杆,没有人会再质疑」。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1108589.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一些经典的神经网络(第17天)

1. 经典神经网络LeNet LeNet是早期成功的神经网络; 先使用卷积层来学习图片空间信息 然后使用全连接层来转到到类别空间 【通过在卷积层后加入激活函数,可以引入非线性、增加模型的表达能力、增强稀疏性和解决梯度消失等问题,从而提高卷积…

集成学习方法(随机森林和AdaBoost)

释义 集成学习很好的避免了单一学习模型带来的过拟合问题 根据个体学习器的生成方式,目前的集成学习方法大致可分为两大类: Bagging(个体学习器间不存在强依赖关系、可同时生成的并行化方法) 流行版本:随机森林(random forest)Boosting(个体…

8.strtok函数

#define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <string.h>int main() {/*----------------------函数解析----------------------*//*函数原型&#xff1a;char* strtok(char* str, char const* sep)*//*函数入参&#xff1a;第一个参数是要分割的…

Layui 主窗口调用 iframe 弹出框模块,获取控件的相应值

var iframeWindow window[layui-layer-iframe index]; iframeWindow.layui.tree............(这里就可以操作tree里面的内容了)。var chrild layero.find(iframe).contents(); chrild.layui.tree (这样是调用不到的)。var child layer.getChildFrame(); child.layui.tree(这…

Linux常见指令及热键

文章目录 1. ls 指令语法实例 2. pwd 指令语法实例 3. cd 指令语法实例 4. touch 指令语法实例 5. mkdir语法实例 6. rmdir 指令语法实例 7. rm 指令语法实例 8. man 指令语法实例 9. cp 指令语法实例 10. mv 指令语法实例 11. cat 指令使用权限语法格式参数说明&#xff1a;实…

【Java系列】Java 简介

目录 Java 简介主要特性发展历史Java 开发工具系列文章版本记录 Java 简介 Java 是由 Sun Microsystems 公司于 1995 年 5 月推出的 Java 面向对象程序设计语言和 Java 平台的总称。由 James Gosling和同事们共同研发&#xff0c;并在 1995 年正式推出。 后来 Sun 公司被 Ora…

Android apkanalyzer简介

关于作者&#xff1a;CSDN内容合伙人、技术专家&#xff0c; 从零开始做日活千万级APP。 专注于分享各领域原创系列文章 &#xff0c;擅长java后端、移动开发、商业变现、人工智能等&#xff0c;希望大家多多支持。 目录 一、导读二、概览三、用法3.1 使用 Android Studio3.1.1…

Arduino Nano 引脚复用分析

近期开发的项目为气体传感器采集仪&#xff0c;综合需求&#xff0c;选取NANO作为主控&#xff0c;附属设备有 oled、旋转编码器、H桥板、蠕动泵、开关、航插等&#xff0c;主要是用现有接口怎么合理配置实现功能。 不管stm32 还是 Arduino 都要看清引脚图 D2 D3 引脚是两个外…

abap中程序跳转(全)

1.常用 1.CALL TRANSACTION 1.CALL TRANSACTION ta WITH|WITHOUT AUTHORITY-CHECK [AND SKIP FIRST SCREEN]. 其中ta为事务码tcode使用时要打单引号() 2. CALL TRANSACTION ta WITH|WITHOUT AUTHORITY-CHECK USING bdc_tab { {[MODE mode] [UPDATE u…

【JavaEE】浅谈死锁

1、什么是死锁&#xff1f; 死锁是这样一种情形&#xff1a;多个线程同时被阻塞&#xff0c;它们中的一个或者全部都在等待某个资源被释放。由于线程被无限期地阻塞&#xff0c;因此程序不可能正常终止。 2、关于死锁的情况 2.1 一个线程一把锁&#xff0c;可重入锁没事。不…

Jmeter压测入门教程

目录 1.Jmeter安装与启动 2.Jmeter使用步骤 3.结果分析 1.Jmeter安装与启动 安装 1. 首先进入官网Apache JMeter - Download Apache JMeter 2. 选择操作系统所对应的版本进行下载。 3.将下载成功的压缩包解压到指定目录当中&#xff0c;即安装成功。 4. 右键“我的电脑”…

spring6-资源操作:Resources

资源操作&#xff1a;Resources 1、Spring Resources概述2、Resource接口3、Resource的实现类3.1、UrlResource访问网络资源3.2、ClassPathResource 访问类路径下资源3.3、FileSystemResource 访问文件系统资源3.4、ServletContextResource3.5、InputStreamResource3.6、ByteAr…

程序员必备的IP查询工具

shigen坚持日更的博客写手&#xff0c;擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。坚持记录和分享从业两年以来的技术积累和思考&#xff0c;不断沉淀和成长。 hello&#xff0c;今天shigen给大家分享一下如何优雅的查询IP的工具。我们先看一下效果&a…

LeetCode 1361. 验证二叉树【二叉树,DFS或BFS或并查集】1464

本文属于「征服LeetCode」系列文章之一&#xff0c;这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁&#xff0c;本系列将至少持续到刷完所有无锁题之日为止&#xff1b;由于LeetCode还在不断地创建新题&#xff0c;本系列的终止日期可能是永远。在这一系列刷题文章…

Yakit工具篇:端口探测和指纹扫描的配置和使用

简介&#xff08;来自官方文档&#xff09; 端口扫描和指纹识别是渗透测试和网络安全领域中常用的基础技术之一&#xff0c;用于评估目标系统的安全性和发现可能存在的漏洞和攻击面。也是Yakit基础工具的模块之一。 端口扫描 是指通过扫描目标系统上的端口&#xff0c;确定哪…

一步步掌握Java IO的奥秘:深入学习BIO、NIO,实现客户端与服务器通信

众所周知&#xff0c;Java IO是一个庞大的知识体系&#xff0c;很多人在学习的过程中会感到迷茫&#xff0c;甚至学得一头雾水&#xff0c;而我也曾有同样的困惑。因此&#xff0c;本文的目标是帮助大家一步一步深入学习Java IO&#xff0c;从BIO开始&#xff0c;然后引出JDK1.…

React +AntD + From组件重复提交数据(已解决)

开发场景&#xff1a; react Hooks andt 提交form表单内容给数据库(使用antd的form组件) 问题描述 提交是异步的&#xff0c;请提交方式是POST 方式 提交表单内容给后端&#xff0c;却产生了两次提交记录&#xff08;当然&#xff0c;数据新增了两条数据&#xff09;。可以…

智能加压站远程监控与维护,提高小区供水效率与安全性的创新方案

不知道大家有没有遇到过这样的情况&#xff1a;当你在家中使用水龙头接水时&#xff0c;突然水管的水流就逐渐变细直到消失。正当你震惊带着一丝疑惑是否停水的时候&#xff0c;水流又开始由细变粗&#xff0c;仿佛在和你开玩笑一样。 实际上&#xff0c;这种情况的出现通常是由…

汽车屏类产品(一):流媒体后视镜Camera Monitoring System (CMS)

前言: CMS,有叫电子侧视镜,虚拟倒车镜,电子倒车镜, 电子取代镜等,ISO 国际标准组织称其为摄像头监控系统。电子后视镜由“摄像头+屏幕”组成,汽车外后视镜经历了光学镜面从平面镜到曲面镜的迭代进步,CMS也实现从商用车到乘用车的过渡。显示模式为外部摄像头采集图像,…