首个端到端自动驾驶背景下对抗性训练研究

news2024/12/22 9:23:25

更多优质内容,请关注公众号:智驾机器人技术前线

1.论文信息

  • 论文标题:Module-wise Adaptive Adversarial Training for End-to-end Autonomous Driving

  • 作者:Tianyuan Zhang, Lu Wang, Jiaqi Kang, Xinwei Zhang, Siyuan Liang, Yuwei Chen, Aishan Liu, Xianglong Liu

  • 作者单位:北京航空航天大学, 新加坡国立大学, 中国航空工业发展研究中心

  • 论文链接:https://arxiv.org/pdf/2409.07321

2.摘要

深度学习的最新进展显著提高了自动驾驶(AD)模型的性能,特别是将感知、预测和规划阶段整合在一起的端到端系统,实现了最先进的性能。然而,这些模型仍然容易受到对抗性攻击的影响,其中人类难以察觉的扰动可以破坏决策过程。虽然对抗性训练是提高模型对此类攻击的鲁棒性的有效方法,但之前没有研究关注将其应用于端到端的AD模型。在本文中,我们采取了端到端AD模型对抗性训练的第一步,并提出了一种新颖的模块化自适应对抗训练(MA2T)。然而,将传统的对抗性训练扩展到这一领域是非常复杂的,因为模型内的不同阶段具有不同的目标且彼此之间紧密相连。为了应对这些挑战,MA2T首先引入了模块化噪声注入,它在不同模块的输入前注入噪声,以整体目标而非每个独立模块损失的指导下训练模型。此外,我们引入了动态权重累积自适应,它结合累积的权重变化,根据它们的贡献(累积降低率)自适应地学习和调整每个模块的损失权重,以实现更好的平衡和鲁棒训练。为了证明我们防御的有效性,我们在广泛使用的nuScenes数据集上对几种端到端AD模型进行了广泛的实验,无论是在白盒还是黑盒攻击下,我们的方法都以较大的优势超越了其他算法(+5-10%)。此外,我们通过在CARLA模拟环境中进行闭环评估,验证了我们防御的鲁棒性,即使在自然腐败面前也显示出了更强的弹性。

3.主要贡献

  • 据我们所知,本文是第一个在端到端自动驾驶(AD)的背景下研究对抗性训练;

  • 提出了MA2T,它整合了模块化噪声注入和动态权重累积自适应,有效地应对了多样化训练目标和不同模块贡献的挑战;

  • 进行了大量的实验,全面评估了MA2T,证明它在不同的对抗性攻击方法中显著优于基准方法,实现了5-10%的绝对提升。

4.主要思想与方法

Module-wise Adaptive Adversarial Training (MA2T) 是一种为端到端自动驾驶模型设计的对抗训练方法,旨在提高模型对于对抗性攻击的鲁棒性。MA2T 包含两个主要组件:

  1. 模块级噪声注入(Module-wise Noise Injection):这一过程在不同模块的输入前注入噪声,而不是仅在图像级别。这样做是为了确保模型以整体目标为导向进行训练,而不是仅依赖于各个独立模块的损失。通过使用整体损失进行反向传播,而不是关注可能导致对整体决策鲁棒性产生负面影响的单个模块损失,从而确保噪声的生成考虑到了整个模型。

  2. 动态权重累积自适应(Dynamic Weight Accumulation Adaptation):这一过程通过考虑模块在噪声注入期间的贡献(累积降低率)来自适应地调整每个模块的损失权重。具体来说,该方法利用一个权重累积因子来调整下降速率,以保持平衡的训练过程,能够自适应地控制每个模块的权重,防止任何一个模块在训练过程中过于激进地下降。

通过结合这两种方法,MA2T 能够在端到端自动驾驶模型的各个阶段进行全面的训练,同时保持训练的平衡性和有效性。在广泛的实验中,MA2T 在多个端到端自动驾驶模型上,无论是在白盒还是黑盒攻击下,都显示出比现有对抗训练方法更好的性能,实现了显著的改进(提高了5-10%)。此外,通过在CARLA模拟环境中进行闭环评估,验证了MA2T在提高模型对自然干扰的鲁棒性方面的有效性。

算法架构

算法架构

5.实验验证仿真

6.总结 & 局限

端到端自动驾驶(AD)模型通过将感知、预测和规划整合到一个统一框架中,大大简化了决策过程。然而,它们紧密耦合的特性也使它们特别容易受到对抗性扰动的影响,而且缺乏全面的对抗训练方法使得这些模型容易受到攻击。现有的防御措施通常只关注自动驾驶pipeline中的个别任务,并且往往仅限于特定类型的扰动,未能解决端到端AD系统的复杂性和相互关联性。

本文介绍了一种新颖的方法——模块化自适应对抗训练(MA2T),专门设计用来增强端到端AD模型对广泛对抗性攻击的鲁棒性。MA2T通过引入模块级噪声注入和动态权重累积自适应机制,解决了这些模型的独特挑战,确保了在AD管道的所有阶段进行平衡而有效的训练。

通过在nuScenes数据集上进行广泛的实验,我们证明了MA2T的有效性,它在多项任务中显著优于现有的对抗训练方法。此外,在CARLA模拟器中进行的闭环评估证实了MA2T提高了端到端AD模型在闭环评估中的鲁棒性。

尽管取得了有希望的结果,但仍有几个领域需要进一步探索:❶ 在真实世界的车辆上评估MA2T,以评估其在实际自动驾驶场景中的有效性;❷ 开发更先进的对抗训练策略,以进一步提高对更广泛攻击的鲁棒性;以及❸ 降低模型的复杂性并加速训练过程,使MA2T更适用于实时系统的部署。

更多优质内容,请关注公众号:智驾机器人技术前线

本文仅做学术分享,如有侵权,请联系删文!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2168150.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

(done 意义不明的公式) 声音信号处理基础知识(10) (Demystifying the Fourier Transform: The Intuition)

参考:https://www.youtube.com/watch?vXQ45IgG6rJ4 就像棱镜可以把可见光分解为不同波长的光一样,FT 做的事情就是把复杂的声波转为不同频率的声波 FT 可以把时域信息转为频域信息 以下是对于 FT 的一些 intuition-level 的理解: 1.FT 会…

2.4K star的GOT-OCR2.0:端到端OCR 模型

GOT-OCR2.0是一款新一代的光学字符识别(OCR)技术,标志着人工智能在文本识别领域的重大进步。作为一款开源模型,GOT-OCR2.0不仅支持传统的文本和文档识别,还能够处理乐谱、图表以及复杂的数学公式,为用户提供…

如何使用ssm实现基于JavaWeb的个人健康信息管理系统

TOC ssm701基于JavaWeb的个人健康信息管理系统jsp 绪论 1.1 研究背景 当前社会各行业领域竞争压力非常大,随着当前时代的信息化,科学化发展,让社会各行业领域都争相使用新的信息技术,对行业内的各种相关数据进行科学化&#x…

大模型如何赋能智慧城市新发展?

国家数据局近期发布的《数字中国发展报告(2023)》显示,我国数据要素市场化改革步伐进一步加快,数字经济规模持续壮大,数字技术应用场景不断拓展。这一成就的背后是数字技术广泛应用,数字技术不仅影响着老百…

12.系统架构分析师应该懂的项目管理知识

进度管理 进度管理就是采用科学的方法,确定进度目标,编制进度计划和资源供应计划,进行进度控制,在与质量、成本目标协调的基础上,实现工期目标。具体来说,包含以下过程: 活动定义:…

智算中心动环监控:构建高效、安全的数字基础设施@卓振思众

在当今快速发展的数字经济时代,智算中心作为人工智能和大数据技术的核心支撑设施,正日益成为各行业实现智能化转型的重要基石。为了确保这些高性能计算环境的安全与稳定,卓振思众动环监控应运而生,成为智算中心管理的重要组成部分…

小红书,努力成为小红书

【潮汐商业评论/原创】 Lisa作为时尚达人,小红书就是她成长路上的「电子闺蜜」,“想买衣服了,去小红书搜一下;晚饭不知道吃什么,去小红书搜搜看;最近我又小红书上在研究MBTI。” “离了小红书真是不能活&…

[笔记]数据结构

文章目录 堆排序215 数组中第k个最大元素 堆排序 堆排序方法对于记录数较少的文件并不值得提倡,但对n较大的文件还是有效 运行时间主要耗费在: 建立初始堆调整建立新堆 反复筛选 筛选算法进行的关键字比较次数至多为: 2 ( k − 1 ) 2(k-1)…

9.26作业

C 面试题 1,什么是虚函数?什么是纯虚函数? 虚函数:父子类中,在父类中的函数需要在子类中进行重写,重写后父子类空间中使用的都是重写后的函数,该函数就是虚函数,虚函数的声明需要在函数前加virtual。 纯虚函数&…

Trace纳米侦查无人机技术详解

纳米无人机,作为微型无人机的一种,通常指尺寸和重量都非常小的无人机,其重量一般不超过几百克,甚至更小。这类无人机由于体积小、重量轻,具备高度的隐蔽性和灵活性,在军事侦察、环境监测、搜救行动等领域具…

数值计算 --- 平方根倒数快速算法(上)

平方根倒数快速算法(上) --- 向Greg Walsh致敬&#xff01; 写在最前面 --- 一场关于平方根倒数快速算法作者的讨论&#xff1a; 上图中的这段代码出自一个早期的3D游戏<雷神之锤>的源代码&#xff0c;它实现的功能就是计算一个数x的平方根的倒数&#xff1a; 这段代码之…

如何投IEEE论文(Transactions on Cybernetics为例)

文章目录 0. 建议先看看投稿要求1.下载对应的论文模板2.进入提交论文信息的界面3.填写论文中必要的信息3.1 Article Type3.2 Upload Manuscript3.3 Title3.4 Abstract3.5 Authors3.6 Author Details3.7 Math Organizations3.8 Additional Information3.9 Final Review 终审 0. …

计算1 / 1 - 1 / 2 + 1 / 3 - 1 / 4 + 1 / 5 …… + 1 / 99 - 1 / 100 的值,打印出结果

我们写这道题的时候需要俩变量接受&#xff0c;一个总数一个分母&#xff0c;我们发现分母变化是有规律的从1~100循环。 #include<stdio.h> int main() {int i 0;int tag 1;double sum 0.0;for (i 1; i < 101; i){if (i % 2 0){sum sum - 1.0 / i;}else{sum s…

实力!云起无垠荣获“创业邦2024年AIGC创新企业及产品创新”双奖

近日&#xff0c;国际创新生态服务平台创业邦郑重发布 “2024 年 AIGC 创新企业及产品创新榜单”。云起无垠凭借卓越的企业能力与突出的产品创新&#xff0c;成功入选 “2024 年 AIGC 创新企业 100 强” 以及 “2024 年 AIGC 产品创新 100 强”。 本次评选采用内部初审与外部专…

深入分析MySQL事务日志-Undo Log日志

文章目录 InnoDB事务日志-Undo Log日志2.1 Undo Log2.1.1 Undo Log与原子性2.1.2 Undo的存储格式1&#xff09;insert类型Undo Log2&#xff09;delete类型Undo Log3&#xff09;update类型Undo Log 2.1.3 Undo Log的工作原理2.1.4 Undo Log的系统参数2.1.5 Undo Log与Purge线程…

【Linux 报错】vim 保存文件时出现 E45: ‘readonly‘ option is set (add ! to override)

一、错误原因 该错误表明当前你尝试保存的是一个 只读文件&#xff0c;该文件权限设置为只读&#xff0c;具有只读的标识 系统为了防止你意外修改该只读文件&#xff0c;因此会阻止对只读文件的保存&#xff08;他怕你修改了你还保存&#xff0c;破坏了只读属性&#xff09; …

媒界:2025河南台球及配套设施展会3月举办

立足中原&#xff0c;辐射全国&#xff0c;壹肆柒中国国际台球产业博览会3月在郑州盛大举办&#xff1b; 2025中国&#xff08;郑州&#xff09;国际台球产业博览会&#xff08;壹肆柒台球展&#xff09; The 2025 China (Zhengzhou) International Billiards Industry Expo …

2021年的burpsuite安装。

安装burpsuite 很简单的。 1.要有java环境&#xff0c;也就是jdk&#xff0c;并且jdk版本要与burpsuite要对应。&#xff08;如果你的bp安装不起&#xff0c;可能是你的jdk版本不对&#xff09; 2.就是按照我都步骤走就行。 3.下载完文件之后&#xff0c;全程离线操作 说明一下…

spring boot 项目如何使用jasypt加密

1.首先&#xff0c;添加jasypt依赖 <dependency><groupId>com.github.ulisesbocchio</groupId><artifactId>jasypt-spring-boot-starter</artifactId><version>2.1.0</version></dependency> 2.然后winr&#xff0c;cmd调出窗…

Rapid品牌SSL证书通配符单域名申请窍门

RapidSSL最初以FreeSSL的名称引入数字世界&#xff0c;于2003年诞生&#xff0c;扎根于以技术为中心的加利福尼亚州山景城。如今&#xff0c;它是GeoTrust旗下一家值得骄傲的子公司&#xff0c;其战略定位是满足市场对经济高效的SSL证书解决方案的需求。 Rapid属于Geotrust品牌…