20T算力打造轻地图方案,这家智驾公司持续内卷

news2024/12/24 10:24:11

作者 | 张祥威

编辑 | 德新

4e243199d003b49691f34b023a514797.jpeg

行泊一体的话题热度不减。

近日,宏景智驾核心产品单SoC行泊一体解决方案已全场景跑通,可实现高速导航辅助驾驶。

在推进量产的同时,宏景智驾也在布局BEV感知、轻高精地图甚至去高精地图的智驾方案,同时也在打造4D BEV感知真值系统产品,赋能更多车企进行相关技术开发。

宏景智驾在HiEV进行了主题为《如何打造极致“品价比”的轻地图ADAS 产品》的线上分享,要点如下:

  • 宏景智驾BEV去高精地图技术展示;
  • 宏景智驾轻地图ADAS产品,打造极致“品价比” ;
  • 宏景智驾 Hyper-GTMax如何附能车企高阶感知自研能力?

以下为线上分享问答环节的内容整理。


一、将BEV轻地图能力降维到20T级算力芯片上

Q:当实时感知的结果跟本地的SD Pro Map(比标精地图精度更高)有差异的话,我们的逻辑策略是什么样的?

A:首先,宏景目前的开发重心还是高性价比的行泊一体产品。所以我们在高速上面采用的是SD地图,不是SD Pro的方案。在高速上SD地图就可以实现BEV+去地图的方案。因为我们在感知端的开发是不分高速和城市的。

在城市里面很多地方的拓扑是非常困难的,所以目前拓扑的模块还没有非常成熟之前,在这种比较复杂的路段,我们还是以图商提供的为准。

Q:目前我们对BEV的最低算力有评估吗?

A:我们目前可以把6V的BEV方案,在20TOPS+ 的芯片上实现目标检测和地图检测的能力。

Q:宏景的4D真值系统相当于是给车厂搭建了一套地图采集的设备么?

A:它其实不是地图采集。它更多的是,比如我们希望用一段多个图像的30秒数据,针对下游的任务,比如目标检测、局部地图的一些元素检测,包括一些Occupancy 的检测提供它的真值系统。

因为构建这些真值是非常麻烦的,很多时候车企想快速完成感知的0到1的能力的构建的时候,往往取决于它要怎么把这个数据构建出来。所以我们应客户需求做出了这套真值系统。

Q:宏景的方案跟其他家比,技术差异化主要在哪里?

A:第一,我们其实已经做了大量的基于HD Map的量产NOA(导航辅助驾驶)的落地。要去掉高精地图,首先要了解在量产NOA地图里的一些点,去地图的时候就更有信心,这个过程中的积累能更好地帮我们知道什么时候该如何解决某些问题。

第二,目前BEV轻地图的方案主要还是用在一些比较贵的车型上。我们希望能够把BEV轻地图的能力,通过技术降本的方式提供给车厂和消费者。这也是我们跟其它公司一个比较大的不同,我们能够把这种BEV轻地图的能力降维放到20TOPS+ 的芯片上,能实现差不多的功能,体验上也非常优秀。我们主打的是最高的“品价比”。

Q:要做到BEV轻地图的方案,算法上是如何考量的,是否要采用Transformer类型网络?

A:首先回到商业维度,我感觉城市NOA的落地,并不一定是大芯片+Transformer就一定能实现的,更多的是整个功能做出来是怎么样的?体验如何?价格如何?这是一个点。

第二,从技术维度上,因为整个BEV模型有很多个模组,包括比如2D转3D模块、时序、检测模块,在一些功能模块上面,我认为是不是 Transformer 都无所谓,只要能够完成这个功能就可以。无论是Transformer或者CNN(卷积神经网络)都可以。在检测上面使用Transformer的方式,其实能带来表征的一些优化。

从芯片的角度说,用这种支持Transformer的芯片,对于算法的选择上是有很多的帮助的。对我们来说做BEV地图的检测,如果只是用传统的CNN,想去地图是非常困难的,因为它有非常多厚重的后处理。

所以我们现在整个BEV在车端算法的核心,是在输出端能够直接输出点集加上局部的拓扑,这个输出的表征其实是非常重要的。这也是为什么我们在20TOPS+ 的芯片上能够做出来跟Transformer效果差不多的线,它并不是通过大量的复杂的后处理来得到的,而是直接从模型里面出的。

Q:您认为BEV的难度以及壁垒在哪里?

A:我认为算法壁垒、数据壁垒,或者说BEV究竟能不能应用到一个非常好的产品上面,其实都有壁垒。

举个例子,从算法开发的角度来说,BEV其实也有一些不同的功能模块,比如BEV下的3D目标检测这个功能,从整个数据的构建到标注到最后的输出,这个难度会稍微小一点。但是BEV轻地图的这个功能,要完成非像素级别对应的数据的构建,其实要花的时间和整个数据构建的难度会更大。

第二,数据的壁垒肯定是最大的。拥有越来越多高质量的数据,BEV感知的性能就越好,迭代周期就越快。所以到BEV的阶段,需要有非常强的数据构建的能力,包括自动标注都是非常重要的。

第三,如何基于BEV打造一个好的产品也是一种壁垒。


二、要实现城市NOA,必须去高精地图

Q:现在大家可能会感受到,去地图后的成本并没有降太多,而且体验相比于传统高精地图的体验还会差一些,您怎么看这个问题?

A:我认为这个问题一方面取决于感知的成熟度,另一方面取决于体验能不能持续做得更好,还有一方面取决于客户的接受度。

宏景目前还是脚踏实地的希望先从高速做起,在高速上基于我们非常成熟的行泊一体的量产的系统,能把高精地图和高精定位模组去掉。

然后在感知开发端,其实不论城市和高速我们都会积累,所以我们也不会那么快一定要在城市里面完全不依赖高精地图。目前阶段我们的重心还是在高速上去完成具备性价比产品的打造。

从价格方面,我非常赞同“一个ADAS系统应该在车价的3% - 5% 的区间”这种说法,如果我们要让10万的车能满足这样的功能,那是不是要把整个系统成本压到这个区间,主机厂才愿意买单,才能有更多人愿意买单。这个时候我们一定是希望通过更好的技术降本去完成。

通过BEV轻地图的方式,在现在这种比较成熟的行泊一体的里面做到体验不降,甚至上了BEV之后体验还能更好,同时能降低成本,把这个能力给到更多的低价的车型,更多的消费者手里,这是我们的愿景。

Q:想问一下目前在跟主机厂交流的过程当中,主机厂的态度,是不是对去地图的诉求真的很强烈?还是主机厂的诉求只是降本?并不特别关心怎样通过技术去实现这个功能。

A:我觉得这个可以分成两个点。第一点,现在比较热的城市NOA的功能,它的去地图其实并不是一个降本的方案,因为高精地图在城市里面要保持这个东西非常困难,所以它更多是从技术角度的考虑,要实现城市NOA,必须具备去地图的能力。

现在,我们在高速NOA上去地图的能力,相对来说实现的方式会比城市稍微简单一点,它只要能够把各种匝道、各种困难的场景攻克了,能够达到这样的功能,其实从降本的层面,对于这个主机厂来说他们还是非常乐意见到这样的产品推出。只要能保证产品体验足够优秀,还比别人便宜,是非常有竞争力的。

还有一点,这种新系统里面它有一个核心点,就是它会把这个BEV的感知架构给拿出来,整个数据架构可以逐渐地从高速往城市这样去走,是一个体系化的升级和更新。

Q:相比传统技术,BEV技术下的标注有哪些新的规则和新的技术?

A:以BEV地图举例,规则层面肯定还是看算法下游的一些定义,包括后面需要的哪些功能来做BEV地图的一些标注,要识别哪一些元素,之间它需要有一个关联关系,这个关联关系是怎么样的?这是一个维度。

另外从技术的角度,它会比传统的更复杂一点。因为如果想在6V上面直接标BEV地图,基本上不太可能,所以必须要能够有场景重建能力的模块,在这个场景重建的基础上去做完标注,标完的数据还得跟图像级别的像素对应起来。这个地方对于整个系统的时间同步,传感器的标定,整个基础能力都是非常考验的,才能得到4D对应好的这种真值Clip 来做BEV训练,不然构建出来的数据对齐程度不高,这个BEV训练出来结果会有很大的问题。

Q:在拥堵场景下,BEV怎么做到实时建图,比如一个拓扑结构被周围车辆遮挡住了,怎么解决这个问题?

A:这是一个非常难的点,我觉得解决了这个问题之后,就能在高速上把BEV地图去掉了。现在我们的解决方案,首先整个BEV并不是单帧的,它是带时序的。因为整个地图元素是一个静态的信息,所以只要曾经看到过,就能记住。

BEV地图跟传统的所见即可得的这种车道线检测对比,它有一定的预测和推理能力。很多时候我数据标的时候真值为一个路口,或者一个匝道口,其实有时候像素里面没有看到,它其实就有局部的预测能力。这是一个点,在感知端需要更好地解决这个问题。

如果目标车辆真的被各种大车挡住了什么都看不见,这时候我们需要更多的规控端和后端,需要用到一些车流的信息,因为车流的信息很多时候跟中心线是息息相关的,所以我们也会重点参考比如历史的车流信息,这其实对于我们BEV地图检测是有些帮助的。当然如果说极端场景下,还是需要人工接管的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1117983.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IPv6基础

1. IPv6概述 基本概念 IPv6(Internet Protocol Version 6)也被称为IPng(IP Next Generation)。它是Internet工程任务组IETF(Internet Engineering Task Force)设计的一套规范,是IPv4&#xff…

influxDB学习记录

一、官网 influxdb官方英文文档:https://docs.influxdata.com/influxdb/v1.8/query_language/spec/influxdb中文文档:https://jasper-zhang1.gitbooks.io/influxdb/content/ 二、centos安装与基本配置 influxdb安装与基本配置(centos) 三…

iPhone上的闹钟不工作的原因不单一,可能多达十种

这篇文章将带你了解如何让iPhone闹钟重新工作。 调大音量 这听起来可能很明显,但不要跳过这一步。使用手机侧面的按钮可以在不增加闹钟音量的情况下提高音量。这是因为iPhone可以让你用相同的按钮控制两组完全不同的声音。 例如,如果你打开了音乐流媒…

CMMI V2.2模型介绍

1、CMMI模型内容编排 模型内容主要由三篇组成,包括概述、实践域(PA)和附录,共分为6个章节。 章节 标题说明篇章:概述第1章关于CMMI V2.0概述CMMI V2.0产品套件,包括模型的执行摘要。第2章 成…

mysql—面试50题—1

注:面试50题将分为5个部分,每部分10题 一、查询数据 学生表 Student create table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10)); insert into Student values(01 , 赵雷 , 1990-01-01 , 男); insert into Student …

S-Clustr(影子集群)新增Nets3e插件,实现一对多主机拍照

公告 项目地址:https://github.com/MartinxMax/S-Clustr 项目地址:https://github.com/MartinxMax/Nets3e 环境 这里有一台Windows主机,我们拿到了Webshell 依赖安装 根据你的主机类型选择依赖安装程序。 配置Nets3e 安装完成后,我们需要启动Nets3e服务端(这边…

学习git博客

git新建分支并且提交代码过程 1. git pull <codeBaseAddress> [分支名(默认是master)] 2. cd <projectName> 3. git branch <newBranchName> // 创建分支 4. git checkout <newBranchName> // 切换到新分支 // 开始写你的新代码 5. git add . //…

在Windows下Edge浏览器OA发起流程问题

在Edge浏览器中发起流程 如上图所示&#xff0c;不能正常打开Excel&#xff0c;自动将Excel表格转为了PDF 怎么处理&#xff1f;还得使用IE浏览器来访问&#xff0c;但打开IE后又自动跳转到Edge&#xff0c;根本就不给使用&#xff0c;在Edge下使用IE模式也解决不了这个问题。…

Aocoda-RC F405V2 FC(STM32F405RGT6 v.s. AT32F435RGT7) IO Definitions

[TOC](Aocoda-RC F405V2 FC(STM32F405RGT6 v.s. AT32F435RGT7) IO Definitions) 1. 源由 Aocoda-RC F405V2飞控支持betaflight/inav/Ardupilot固件&#xff0c;是一款固件兼容性非常不错的开源硬件。 之前我们对比过STM32F405RGT6 v.s. AT32F435RGT7 Comparison for Flight …

架构案例分析重点

架构案例分析重点 信息系统架构架构图 层次式架构&#xff08;可能考点&#xff09;表现层框架设计中间层架构设计数据访问层数据访问层工厂模式的设计&#xff08;一个考点&#xff09; 物联网三层 云原生架构面向服务架构(SOA)SOA设计模式 嵌入式系统架构鸿蒙操作系统&#x…

为什么索引要用B+树来实现呢,而不是B树

首先&#xff0c;常规的数据库存储引擎&#xff0c;一般都是采用 B 树或者 B树来实现索引的存储。 B树 因为 B 树是一种多路平衡树&#xff0c;用这种存储结构来存储大量数据&#xff0c;它的整个高度会相比二叉树来说&#xff0c;会矮很多。 而对于数据库来说&#xff0c;所有…

常见分布整理

概率论 - 常见分布&#xff08;及其分布表&#xff09; 常见分布的期望和方差 离散型分布 两点分布 有2种结果&#xff0c;实验只做1次 X~b(1,p)则有 P(X k) pk (1-p)1-k,k 0, 1 数学期望&#xff1a;E(X) p 方差&#xff1a;D(X)p(1-p) 二项分布 P(A) p&#xff0…

网络编程知识点

概念 计算机网络定义 利用通信线路将地理上分散的、具有独立功能的计算机系统和通信设备按不同的形式连接起来&#xff0c;以功能完善的网络软件及协议实现资源共享和信息传递的系统。 计算机网络分类 按覆盖范围分&#xff1a; 局域网 作用范围一般为几米到几十公里。 …

【LLM】大模型微调,压缩,量化,部署(还在缓慢更新

前段时间很忙一直没时间follow最近的大模型工作&#xff0c;最近几天闲一点了…这个可能会出现整理不全或者是结果没跑完的情况&#xff0c;我尽量快一点&#xff08;如果最近没啥事的话&#xff09;&#xff0c;有啥想法可以在评论区d一下我。 LLM排行榜 &#xff1a; https:/…

Labview2023安装教程 (最新最详细保姆级教程)

目录 一 .简介 二.安装步骤 软件&#xff1a;Labview版本&#xff1a;2023语言&#xff1a;简体中文大小&#xff1a;2.73G安装环境&#xff1a;Win11/Win10/Win8/Win7硬件要求&#xff1a;CPU2.6GHz 内存8G(或更高&#xff09;下载通道①百度网盘丨下载链接&#xff1a; htt…

【趣味随笔】盘点国内外做双足机器人的公司

&#x1f4e2;&#xff1a;如果你也对机器人、人工智能感兴趣&#xff0c;看来我们志同道合✨ &#x1f4e2;&#xff1a;不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 &#x1f4e2;&#xff1a;文章若有幸对你有帮助&#xff0c;可点赞 &#x1f44d;…

大数据精准营销告诉你如何找到对的人?

如今&#xff0c;朋友圈广告已经“稀松平常”&#xff0c;而用户接收到什么样的商品广告&#xff0c;则基本取决于平日里对微信的使用习惯。无独有偶&#xff0c;淘宝、京东等电商平台在网页中弹出的定向品类广告&#xff0c;也是大数据基于用户对于某一商品的搜索行为。 可见&…

RK3568驱动指南|第七期-设备树-第58章 实例分析:时钟

瑞芯微RK3568芯片是一款定位中高端的通用型SOC&#xff0c;采用22nm制程工艺&#xff0c;搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码&#xff0c;支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU&#xff0c;可用于轻量级人工…

laravel框架介绍(一)

laravel框架是一套简洁&#xff0c;优雅的PHPWeb开发框架。

蓝鹏精准测量系统 助力圆钢负公差轧制

关键字: 钢材下差生产, 负公差轧制, 负公差带肋钢筋, 盘螺负公差率, 成品负公差范围 负公差轧制是指很多产品是按照尺寸公差交货。如果产品公差标或厂标&#xff0c;则可认为产品尺寸精度满足交货要求。 根据国家标准GB/T702-2008《钢材冷拔、冷拉和冷拔锻造用圆钢》的规定&…