SMERF,使用SD地图来增强模型的拓扑感知

news2024/11/20 3:24:48

论文链接

2311.04079v1 (arxiv.org)icon-default.png?t=N7T8https://arxiv.org/pdf/2311.04079v1

研究背景

理解道路的拓扑关系是自动驾驶中很重要的一个环节,以往这个部分都是通过HD地图,及高精度地图的数据训练来实现的。高精度地图具备很多的标注信息和很明确的语义信息,模型可以很容易学习到其中的道路拓扑关系。但是高精度地图的维护成本是很高的,而SD地图的成本会低很多,覆盖面也更广,所以文章研究如何使用SD来提升模型对于道路信息的理解。

提出SMERF

作者提出了一种名为SMERF的新型基于Transformer的编码器框架。该框架将SD地图整合到现有的车道拓扑模型中,以提高其性能。具体方法如下:

  1. SD地图整合:SD地图用于提供道路层级拓扑的先验信息。这些地图通过Transformer编码器编码成特征表示。
  2. 交叉注意力机制:编码后的SD地图特征通过交叉注意力机制与来自车载摄像头输入的特征相结合。这种融合使模型能够更有效地推理车道拓扑,特别是在被遮挡或不太明显的区域。
  3. 车道拓扑模型:增强的特征被输入到车道拓扑模型中,以预测车道中心线、交通元素及其关系。

示意图详解:

1. SD地图中的所有连线都是含有高度语义信息的,这里SMERF把每条link中的点的信息都提取出来,单独为每个link都做一个点的序列

2. 叠加上对应道路的道路类型等简单的标注信息,结合起来做编码成一个一个token

3. 输入Transformer编码器中学习,做交叉自注意力机制,最终输出的就是富含地图语义特征的token序列

4. 把这些特征token和地图信息做交叉注意力后,再结合多视角图像backbone后的特征一起去做空间注意力,构造产生新的BEV

5. 最后再利训练一个解码的模型,可以实现模型从SD中学习理解到车道拖布信息并且标注到图像中

SMERF这个方式其实比以往的toponet简洁,性能也不差

实验验证

该方法在OpenLane-V2数据集上进行了验证,这是一个用于自动驾驶的大型真实世界感知数据集。结果表明,在结合SD地图后,各种模型的车道检测和拓扑预测性能均有显著提升。

总结贡献

  1. 首次使用SD地图进行车道拓扑理解:这是首次系统地探索SD地图在车道拓扑理解中的作用。
  2. 基于Transformer的编码器:引入了一个基于Transformer的编码器模型,以有效利用SD地图。
  3. 性能提升:实验证明,使用SD地图显著提升了车道检测和拓扑预测的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1687025.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

docker 指定jdk11镜像执行jar

dockerfile :下载jdk11 并将上传的jar 放入jdk11容器/root,改名为app.jar vi dockerfile 。。。。内容见下图 # 构建jdk11镜像 docker build -t demo . # 也可以通过jdk11镜像(前提有jdk11镜像)外挂载目录方式运行jar docker run --name d…

使用小技巧:PREEvision权限管理进阶篇

Review 在《浅谈PREEvision权限管理》一文中,我们介绍了如何在PREEvision中初始化一个权限模型,但只有模型还不够,我们需要对各个用户在不同Project中进行权限的配置,以及在EEA工程中对各个Package配置权限。 Roles and Right …

成都青年AI人才崭露头角,知了汇智科技助力孵化营大放异彩

5月18日-19日,为期两天的成都国际商贸城青年(大学生)AI应用孵化营活动在热烈的氛围中圆满落幕。本次活动由成都国际商贸城、成都成商数字科技有限公司、成都知了汇智科技有限公司及成都电商职教集团联合举办,旨在为青年&#xff0…

Project Reactor 响应式编程

Project Reactor 响应式编程 什么是响应式编程 响应式编程(Reactive Programming)是一种编程范式,致力于处理异步数据流和变化。它的核心思想是构建响应于变化的系统,即当数据流或事件发生变化时,系统能够自动地调整…

iOS单元测试覆盖率报告导出功能实现

一、插件安装 在Mac电脑上,安装slather插件。插件地址:https://github.com/SlatherOrg/slather 安装命令: gem install slather二、在Xcode上设置Code Coverage,Targets指定XXX 三、在终端切换到项目根目录下,执行单…

HTML静态网页成品作业(HTML+CSS)——魅族商城首页网页(1个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有1个页面。 二、作品演示 三、代…

Nginx - 常用的控制请求处理和响应生成的指令的高阶用法和最佳实践

文章目录 指令列表returnbreakrewriteifproxy_passtry_files 执行顺序基础用法高阶使用最佳实践 指令列表 return 作用:用于立即结束当前请求的处理并生成响应。用法:return code [text]; code 是 HTTP 状态码,如 200、301、404 等。text 是…

GitLab集成DingTalk(超级详细)

目录 参考文档1 简介2 集成方法2.1 钉钉测操作2.2 极狐GitLab侧操作2.3 钉钉群内操作 参考文档 钉钉集成 1 简介 极狐GitLab集成钉钉,可以在群组中机器人或者直接与机器人创建一对一的聊天框发送消息。当您未将钉钉账户和极狐GitLab 账户进行绑定时,机…

Blazor 下支持 Azure AD 的多套登录方案

比如上图配置了两套不同的登录方案,各有自己的 TenantId 和 ClientId ,要同时支持他们的登录(其实在同一套 TenantId 和 ClientId 里面配置多个登录账户不就好了,但是......那套登录的管理是在客户自己的Azure AD账户管理下的&…

C++BuilderXE 如何让listView按文件名数字排序而非字母排序

int m_nDataColSort0; bool IsAsctrue; void __fastcall TForm1::RzListView4Compare(TObject *Sender, TListItem *Item1, TListItem *Item2, int Data, int &Compare) { if(m_nDataColSort0) { //按列表第二列排序 //CompareCompareText(Item1->SubItems-…

新书发布——《机器学习大数据平台的构建、任务实现与数据治理——使用Azure、DevOps、MLOps》

内容简介 机器学习大数据平台的构建、任务实现与数据治理 你需要构建安全、稳定的数据平台,需要可以扩展到任何规模的工作负载。当项目从实验室进入生产环境时,你需要确信它可以应对现实工作中的挑战。本书能够帮助你实现这些需求,将讲述如…

ARM9驱动开发基础概念

2、arm9的通用寄存器有几个? 3、异常向量表中irq的异常向量是多少? 4、cpsr中的那几位是用来设置工作模式的? 5、r13,r14,15别名是什么?有什么作用? r13栈顶指针 :它用于实现堆栈指针操作,实…

安装测缝计安装事项详解

在建筑和工程领域,测量缝隙和裂缝的准确性对于工程质量和安全性至关重要。测缝计作为一种专业的测量工具,能够帮助工程师和施工人员准确测量和监测建筑结构的缝隙情况,进而采取合适的修复和加固措施,保证建筑物的稳定性和安全性。…

YOLOv8独家改进:KAN系列 | 「一夜干掉MLP」的KAN ,全新神经网络架构一夜爆火

💡💡💡创新点:来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 KAN。该方法在准确性和可解释性方面表现优于 MLP。而且,它能以非常少的参数量胜过以更大参数量运行的 MLP。 KAN 在边上具有激活函数,而 MLP 在节点上具有激活函数。KAN 似乎比 MLP 的参数效率更…

预约直播丨ETLCloud训练营:ETL中多流数据合并与运算专题

在大数据处理领域,一个至关重要的步骤是对多源数据流进行汇聚与融合,进而开展深度处理与剖析。此操作对于构建高效数据仓库、实现数据动态变化的实时洞察,以及驾驭复杂事件流的处理机制尤为关键。过程涉及从多样化的数据源中抽取信息&#xf…

【408精华知识】Cache类题目解题套路大揭秘

有关Cache的题目,需要理解Cache的工作原理,也即给出一个地址,要知道如何在Cache中寻找或者如何将其从主存中复制入Cache,同时理解Cache中具体是如何存储的,包含三种存储方式,分别是直接映射、全相联映射、组…

最有效的企业数据防泄漏手段 | 数据泄漏防护系统推荐

随意信息安全意识不断提高,企业纷纷寻求高效的数据防泄漏手段。在众多解决方案中,这五款软件各具特色,但它们的共同目标都是确保企业数据的安全性和保密性。 接下来,我们将逐一介绍这五款软件的特点和优势。 1、Ping 32 Ping32…

前端面试项目细节重难点(已工作|做分享)

面试官提问:需求场景:页面上有一个单选框,有是否两个选项:当用户选择是,出现一个输入框,用户可以输入内容,给后端的保存接口传入参数radio和content这两个字段,值分别是用户选项和输…

【Python】 如何在Python中创建GUID UUID

基本原理 GUID(全局唯一标识符)和UUID(通用唯一标识符)都是用来在分布式系统中唯一标识信息的。在Python中,我们可以使用内置的uuid模块来生成这些唯一标识符。 UUID有几种不同的版本,每种版本都有其特定…

图形学初识--光栅化直线算法

文章目录 什么叫做光栅化?为什么需要光栅化?直线的光栅化算法有哪些?Bresemham算法问题定义:问题模型简化:算法核心理解:算法拓展: 结尾:喜欢的小伙伴可以点点关注赞哦 什么叫做光栅…