单视觉L2市场「鲶鱼」来了,掀起数据反哺高阶新打法

news2024/9/21 18:40:46

作者 | 张祥威
编辑 | 德新

b3b3f025ebacd7b0b72deb6b51ed4926.jpeg

智驾方案的降本行动仍在推进。

早年,单视觉L2市场的玩家以Mobileye、博世为主,后来国内智驾公司加入,共同推动 1V、1R1V、nR1V等不同的方案兴起,L2近乎成为车辆的必备功能。

当下,在行业降低智驾成本的大背景下,有行业公司提出,可以推出成本极致下探的单视觉L2方案,并能解决行业的两大痛点:

  • 降低AEB误报率,帮助车企拿到CNCAP五星成绩;
  • 支持数据回传,为高阶智驾迭代打下基础。

与以往的L2方案相比,今天的单视觉L2正在变强,且有了更高的可靠性,成为主机厂向高阶辅助驾驶进军的入场券。

1. 单视觉成本香但有痛点,行业关注AEB误触发率

2017年,随着特斯拉Model 3开启规模交付,L2逐渐进入公众视野。

国内市场中,先后出现1R1V、3R1V、5R1V的L2方案,后来还出现了加入激光雷达的L2+方案。再后来,随着主机厂降本、便于管理的需求,又出现了行泊一体等。

对性能的极致压榨,其中一个代表是特斯拉。其采用144TOPS的算力坚持使用120万像素的摄像头,来实现L2、L2+的功能更新,并且一直在做传感器的减法,比如去掉毫米波雷达等。

6f4d97b6b6bae980f452981be87c9faf.jpeg

国内主机厂在极致成本竞争下,也已经开始做减法,行业开始出现去高精地图、去雷达等声音。

回到L2方案上,过去行业的主流做法是通过1R1V方案来实现L2功能,比如AEB等。

为了降低成本,行业后来又开始去掉毫米波雷达,出现1V方案。不过,去掉毫米波雷达后,仅依靠单个摄像头容易发生“幽灵刹车”,就是AEB误触发率高的问题。

要解决传统的1V方案幽灵刹车的问题,需要大量的数据,但是又不能拿量产车主机厂当小白鼠。主机厂希望降低成本,又担心去掉毫米波雷达产生的幽灵刹车。这是过去行业推进「1V」这种极简L2方案时遇到的问题。

为解决AEB的误触发,MAXIEYE做了多种算法冗余,通过两套甚至更多套不同的算法来进行目标物的检测,不同算法的检测特征、原理是完全不同的,并可以相互校验。

比如,对行人的检测,一套算法会检测行人的整体轮廓,另一套算法会检测行人的关节、头等局部特征。

5月24日,智驾科技MAXIEYE发布了牧童MonoToGo 单视觉L2解决方案,一站式实现L2全功能集成,具备数据闭环全场景复现、事件触发数据回传等功能。

面向当下单V行业痛点,该方案针对性解决了AEB误触发等问题,满足CNCAP五星+主动安全评分。

极简极致的L2方案再次被刷新。

2ece1d12dba1a37815a4360e8d8d457c.jpeg

据悉,这款单视觉L2方案的Vision Only产品在CNCAP标准测试中,主动安全ADAS部分更是得到了88.56%的分数。

要获得CNCAP主动安全五星,需要系统具备很高的敏感性,同时保证量产时AEB不会出现误触发,考验方案的平衡能力。许多主机厂为了让量产的车减少误触,会把系统调整得很保守,从而无法获得CNCAP的五星高分。

值得一提的是,MAXIEYE单V产品刷新系统安全指标,这背后有一套数据迭代的逻辑。

随着量产上车的方案不断积累更多数据,MAXIEYE会不断地训练这套视觉方案,精度、性能、场景随之提升,从而在主动安全上获得更好的分值。

2. 从产品底层设计,建立数据回传机制

获得主动安全五星成绩,仅仅是MAXIEYE的单视觉L2方案能力的一部分。更为重要的是,MAXIEYE的L2方案所具备的数据回传能力。

“单视觉方案最怕的是一些Ghost(鬼影)。”MAXIEYE创始人兼CEO周圣砚告诉HiEV,因为视觉无法形成深度信息,经过龙门架时,会把龙门架当成大卡车的车尾,进隧道时,也可能把隧道的杆子当成车尾,而要解决鬼影问题,就需要大量的数据积累。

为了做好数据积累,早在2019年左右,MAXIEYE发布1R1V方案时,就为这套方案设计了支持数据回传和事件触发视频回传的机制。这是当时行业的其他方案没有考量的。

ba81d369aa34064947f543b8edf834a8.jpeg

MAXIEYE在1R1V方案中运行了单V的影子系统,利用影子系统,可以把由于缺少毫米波雷达校验所产生的AEB误触发数据全部回传回来,用于之后的数据训练和算法迭代。

据介绍,在1R1V和单V方案市场,MAXIEYE是唯一一家具备数据回传能力的公司。

为了开发这样一套系统,MAXIEYE在选择芯片时,就要求芯片必须支持H.264视频编码。“视频编码直接决定了方案的后续能力,比如影子系统、数据回传,以及通过回传来训练深度学习的卷积网络。”

彼时,一款芯片既要有足够的算力去部署深度学习算法,同时又支持H.264编码,这样的芯片产品并不多,它考验的是芯片公司的IP设计和产品定义能力。

据了解,许多智驾方案供应商早期推出的芯片并不具备H.264视频编码能力,数据回传主要靠大量的人工成本,在方案量产之前通过大量的试验车采集各种工况数据,数据获取的成本相对较高。

69a7156b2b382f22083871eb6e2cdd14.jpeg

除了芯片,MAXIEYE自身也基于底层感知自研算法,实现视觉感知网络的迭代。目前已经实现高测距测速精度、高环境适应性。

受限于芯片算力,L2的算法采用的是MAXI-NET 1.0深度学习网络。

据周圣砚介绍,机器学习对算法检测率的提升主要来自两个途径:

  • 一是,提升卷积网络设计,采用运算能力比较大的卷积网络;
  • 二是,在量产的产品上,由于可用的算力不高,通常为2 - 3TOPS,此时想要提高检测率就要通过数据。

最终,MAXIEYE选择了安霸和TI的芯片,并通过算法的不断迭代,获取大量量产上车的L2方案回传的数据,其场景数据规模量已经累计超2亿公里。

这种前瞻性设计,为后来解决AEB误触发、获得CNCAP主动安全五星成绩打下了基础。

更关键的是,它还为系统向高阶辅助驾驶迭代留出空间。

3. 向高阶辅助驾驶迭代

主机厂为了提高竞争力,需要提升L2的搭载率,并且方案最好支持向L2+、L2++等高阶功能进化。

要做到高阶辅助驾驶,要包含上下匝道、过路口等,核心是解决路口的拓扑。

MAXIEYE的单V方案可以支持在经过十字路口时,按照设计好的触发机制,将过路口前后五秒的视频回传到云端。同时,MAXIEYE在云端为主机厂准备了一套VSLAM和地图重构的算法,将单V的视频用VSLAM的方式创建整个道路拓扑,作为高阶的地图真值去训练高阶辅助驾驶。

cdae8b99785367cfce6f870109bcba52.jpeg

周圣砚认为,虽然单V的算力有限,运行不了BEV算法,无法感知道路的分叉、汇合等拓扑信息,但行业当下L2和L2+的配置率大概会是8:2。可以用80%车辆L2采集的数据,为20%车辆提供城市NOA道路拓扑信息。

这一过程考验的便是数据闭环能力。

它要求:

整车厂的车辆具备以太网的架构,以太网不只用于ADAS的数据回传,还可以用于车机等;

智驾供应商具备数据脱敏能力,要用算法把行人的脸、车牌照信息脱敏,L2方案的芯片算力本身有限,将数据脱敏算法植入进去,技术挑战颇大。

站在主机厂的角度,如果不具备数据回传能力,意味着和燃油车时代的“放养”没有任何区别。而且,由于L2的配置率很高,如果无法支持数据回传,数十万乃至近百万辆车无监管地行驶在路上,主机厂对于车辆的数据掌控力也会变弱。

具备数据回传能力后,主机厂可以联合智驾供应商一起设计触发机制,提供基于触发机制的数据回传,以还原现场。

它不仅可以提升ADAS本身的性能,也能拓展L2的功能边界。

比如,安全气囊起爆后,如果将起爆前后五秒进行数据回传,就可以帮助主机厂用来做起爆点的设计等等。

目前看,要进入智能驾驶领域,单视觉L2基本上是性价比最高的入场券了。

对于主机厂来说,一方面这张入场券的成本更低。另一方面,也是更为关键的,它能为进入NOA等高阶自动驾驶做好准备。

单视觉L2采集的数据,可以做场景触发,将数据回传支持NOA的迭代。也就是说,遇到的每个corner case,都能攒下经验值,为以后的算法迭代打下基础。

对于售价更低比如售价10万元以下的车型来说,成本更低且具备数据积累能力的智驾方案,是有着不错的吸引力的。

最终,用户感受到的是更加安全的巡航功能,主机厂可以在主动安全方面获得CNCAP五星评分,并且具备了数据迭代能力。

未来某天,随着传感器本身成本下降,单视觉L2的硬件可能会被替换,但那时,主机厂已经从算法层面获取更多的海量数据,拿到了迈入高阶辅助驾驶的入场券。

882c201b1c18dec472a12cf20b830ae9.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/564639.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

认识linux文件系统/文件夹名字解释

linux系统因为其高效、直接的底层操作而被很多代码开发者使用,谈及linux,大家普遍的印象就是黑乎乎的终端命令行,后来基于linux系统开发出来的具有可视化桌面的ubuntu版本,让大家的使用体验兼顾了windows系统的直观性可linux系统代…

YOLOV5使用(一): docker跑通,详解TensorRT下plugin的onnx

yolov5的工程使用(以人员检测为案例) 使用ubuntu为案例 docker run --gpus all -it -p 6007:6006 -p 8889:8888 --name my_torch -v $(pwd):/app easonbob/my_torch1-pytorch:22.03-py3-yolov5-6.0使用端口映射功能也就是说打开jupyter lab的指令是 http://localhost:8889/l…

windows先的conda环境复制到linux环境

如果是迁移的环境一致:同是windows或同是linux直接用这个命令即可: conda create -n new_env_name --clone old_env_path 如果是window的环境迁移到linux这种跨环境就不能用上面的方法,网上这方面的资料也很多,记录一下我的…

小蝌蚪找妈妈:Python之作用域链与 LEGB 原则

文章目录 参考描述作用域对象全局作用域globals() 局部作用域locals() 包含作用域内置作用域builtins 模块builtins 模块与 \_\_builtins__builtins is \_\_builtins__??? \_\_builtins__ 与内置作用域赶不走的 \_\_builtins__ 作用域链作用域链 与 LEGB 原则狗急跳墙之法 参…

【Go语言从入门到实战】基础篇

Go语言从入门到实战 — 基础篇 First Go Program 编译 & 运行 基本程序结构 应用程序入口 package mainimport "fmt"func main() {fmt.Println("Hello World") }退出返回值 package mainimport ("fmt""os" )func main() {fmt.Pr…

哪个产品功能重要?KANO模型帮你

哪个产品功能重要?KANO模型来帮你 模型工具可以协助思考和系统化改进 KANO模型是小日本一个教授提出 趣讲大白话:往往,怎么思考,比思考什么重要 【趣讲信息科技175期】 **************************** 东京理工大学教授狩野纪昭(No…

【医学图像】图像分割系列.2 (diffusion)

介绍几篇使用diffusion来实现医学图像分割的论文:DARL(ICLR2023),MedSegDiff(MIDL2023)& MedSegDiff-V2(arXiv2023),ImgX-DiffSeg(arXiv2023)…

CTF 2015: Search Engine-fastbin_dup_into_stack

参考: [1]https://gsgx.me/posts/9447-ctf-2015-search-engine-writeup/ [2]https://blog.csdn.net/weixin_38419913/article/details/103238963(掌握利用点,省略各种逆向细节) [3]https://bbs.kanxue.com/thread-267876.htm(逆向调试详解&am…

web功能测试方法大全—完整!全面!(纯干货,建议收藏哦~)

本文通过六个部分为大家梳理了web功能测试过程中,容易出现的遗漏的部分,用以发掘自己工作中的疏漏。(纯干货,建议收藏哦~) 一、输入框 1、字符型输入框 2、数值型输入框 3、日期型输入框 4、信息重复 在一些需要命…

GPT-4版Windows炸场,整个系统就是一个对话机器人,微软开建AI全宇宙

原创 智东西编辑部 智东西 Windows的GPT时刻到来,变革PC行业。 作者 | 智东西编辑部 今日凌晨,Windows迎来了GPT-4时刻! 在2023微软Build大会上,微软总裁萨蒂亚纳德拉(Satya Nadella)宣布推出Windows Co…

实现免杀:Shellcode的AES和XOR加密策略(vt查杀率:4/70)

前言 什么是私钥和公钥 私钥和公钥是密码学中用于实现加密、解密和数字签名等功能的关键组件。 私钥是一种加密算法中的秘密密钥,只有密钥的拥有者可以访问和使用它。私钥通常用于数字签名和数据加密等场景中,它可以用于对数据进行加密,同…

头部效应凸显,消金行业迈入“巨头赛”?

回顾已经过去的2022年,消金行业面临着来自多方面的考验,承压前行,而随着进入2023年,相关企业也陆续展示出过去一年的发展成果,以此为后续发展做出指引。 当前,30家已开业的消金公司中,29家的20…

《消息队列高手课》课程笔记(三)

如何利用事务消息实现分布式事务? 什么是分布式事务? 消息队列中的“事务”,主要解决的是消息生产者和消息消费者的数据一致性问题。如果我们需要对若干数据进行更新操作,为了保证这些数据的完整性和一致性,我们希望…

独立站怎么搭建?搭建一个独立站的10个建议和步骤

要搭建一个独立站(也称为个人网站或博客),以下是一些建议和步骤: 选择一个合适的域名:选择一个简洁、易记且与您网站内容相关的域名。确保域名可用,并注册该域名。 寻找一个合适的主机服务提供商&#xff…

【Cpp】哈希之手撕闭散列/开散列

文章目录 unorderedunordered系列关联式容器unordered_map和unordered_set概述unordered_map的文档介绍unordered_map的接口说明 底层结构 哈希哈希/散列表 概念哈希冲突哈希函数哈希函数设计原则:常见哈希函数 哈希冲突解决闭散列线性探测二次探测 开散列 哈希表的…

C语言数据结构——树、堆(堆排序)、TOPK问题

🐶博主主页:ᰔᩚ. 一怀明月ꦿ ❤️‍🔥专栏系列:线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C,数据结构 🔥座右铭:“不要等到什么都没…

使用go语言构建区块链 Part4.事务1

英文源地址 简介 事务是比特币的核心, 区块链的唯一目的是以安全可靠的方式存储交易, 因此在交易创建后没有人可以修改. 今天我们开始实现事务, 但由于这是一个相当大的主题, 我将它分成两部分: 在这一部分中, 我们将实现事务的通用机制, 在第二部分中, 我们将研究细节. 此外…

让你在Windows打开Sketch格式再也不愁

Sketch是Macos的专用矢量绘图应用。在Sketch软件中,ios开发者可以轻松设计图层面板等图层的常用操作,广泛应用于产品的交互设计和UI设计,帮助很多设计师创作出很多优秀的作品。然而,Sketch只服务于Macos系统,这使得许多…

Laravel框架06:文件、迁移填充、会话、缓存

Laravel框架06:文件、迁移填充、会话、缓存 一、文件上传1. 文件上传表单2. 上传业务处理3. 全部代码 二、数据表的迁移与填充1. 迁移文件① 创建迁移文件② 编写迁移文件③ 执行迁移文件④ 回滚迁移文件 2. 填充(种子)文件① 创建填充文件②…

C++常用的支持中文的GUI库Qt 6之三: Qt 6的项目的发布

C常用的支持中文的GUI库Qt 6之三: Qt 6的项目的发布 本文接着上一篇“C常用的支持中文的GUI库Qt 6之二:项目的结构、资源文件的使用” https://blog.csdn.net/cnds123/article/details/130741807介绍,并使用其中的例子。 程序代码能正确编译…