【论文阅读】SPARK:针对视觉跟踪的空间感知在线增量攻击

news2025/1/12 9:39:15

SPARK: Spatial-Aware Online Incremental Attack Against Visual Tracking

introduction

在本文中,我们确定了视觉跟踪对抗性攻击的一个新任务:在线生成难以察觉的扰动,误导跟踪器沿着不正确的(无目标攻击,UA)或指定的轨迹(有针对性的攻击,TA)。为此,我们首先采用现有的攻击方法,即FGSM、BIM和C&W,提出了一种空间感知的基本攻击,并综合分析了攻击性能。我们发现在线对象跟踪带来了两个新的挑战:1)很难生成可以跨帧传输的难以察觉的扰动,2)实时跟踪器要求攻击满足一定的效率水平。为了应对这些挑战,我们进一步提出了空间感知在线增量攻击(SPARK),它在线执行时空稀疏增量扰动,并使对抗性攻击不易被察觉。此外,作为一种基于优化的方法,SPARK通过考虑历史增量扰动,在多次迭代内快速收敛到非常小的损失,使其比基本攻击更加有效。对 OTB100、VOT2018、UAV123 和 LaSOT 上最先进的跟踪器(即 SiamRPN with Alex、MobileNetv2 和 ResNet-50)的深入评估证明了 SPARK 在两种情况下误导跟踪器的有效性和可转移性UA 和 TA 有轻微扰动。

与图像、语音和自然语言处理任务不同,在线目标跟踪对对抗性攻击技术提出了一些新的挑战。 首先,与现有的顺序输入相关任务(例如用于分类的音频 [ 4 ]、自然语言 [ 19 ]或视频 [ 43 ]相比,它们可以访问完整的顺序数据),对象跟踪在其中逐一处理输入帧。令当当前帧t受到攻击,所有先前的帧(即)仍然不可用,也无法立即受到攻击。由于时间数据片段和动态场景变化有限,生成可随时间转移的难以察觉但有效的对抗性扰动(即多个连续帧)更加困难。 此外,对象跟踪通常依赖于从视频的第一帧中裁剪的目标指定对象模板 [ 2 , 24 ]以进行进一步分析。不同的初始指定对象可能会导致不同的跟踪分析,这使得通用对抗性扰动 [ 31 ]通常无效。

此外,在线对象跟踪通常以实时速度运行。因此,它要求攻击足够有效,以便在下一帧到达之前完成当前帧的对抗性扰动。尽管基于梯度下降的方法(例如,FGSM [ 13 ],BIM [ 22 ])被证明可以有效地攻击图像分类器,但当多帧时,它们仍然遇到欺骗最先进的跟踪器的效率问题很快到达。实时攻击多个帧的成本也相当高,即稀疏性 [ 43 ]。

为了更好地理解攻击 VOT 的挑战和独特性,我们首先通过适应用于攻击每个帧的现有最先进的攻击技术(即 FGSM、BIM、C&W),提出了一种空间感知的基本攻击方法单独。我们的实证研究证实,由于实时的连续时间帧,基本攻击对于攻击 VOT 确实无效。在此基础上,我们进一步提出了空间感知在线增量攻击(SPARK)方法,该方法可以在有效性和效率方面产生更多难以察觉的在线扰动。

本文的主要贡献如下:

  • 我们将 VOT 的对抗性攻击问题形式化,即在线生成难以察觉的扰动,以误导跟踪对象的视觉跟踪器进入不正确的(非目标攻击,UA)或指定的(目标攻击,TA)轨迹。

  • 我们通过调整现有攻击(即 FGSM、BIM、C&W)提出了几种基本攻击,并进一步进行实证研究,以更好地理解对抗性攻击对实时对象跟踪的挑战。

  • 我们提出了一种新的空间感知在线增量攻击(SPARK)方法,可以有效地为实时 VOT 生成更多难以察觉的扰动。

  • 与基本方法一致,我们的深入评估证明 了SPARK在UA和TA。SPARK 生成的攻击还表现出对 SiamRPN 跟踪器在线更新变体的强大可转移性。

相关工作

与这些作品不同,我们的攻击旨在通过有限的在线数据访问来误导视觉跟踪器,即未来的帧不可用,过去的帧也不能被攻击。在与我们最相关的工作中, [ 43 ]提出了在整个视频数据可用并且多个帧的扰动可以联合调整的情况下,基于范数的攻击生成用于动作识别的稀疏扰动。为了进一步显示差异,我们使用[ 43 ]实现了跟踪攻击,并将其与我们的评估方法进行比较。 [ 25 ]攻击了SiamRPN跟踪器 [ 24 ]中也使用的区域提议网络(RPN) 。然而,这种攻击的重点是欺骗图像检测器来预测不准确的边界框,因此不能直接用于攻击旨在通过在线视频误导错误轨迹的跟踪器。 [ 42 ]提出了通过独立寻址每一帧的视频对象检测攻击,这不适合跟踪器通常以实时速度运行的在线跟踪。另一项相关工作[ 26 ]研究了在强化学习环境中何时攻击代理,并使用对动作的偏好程度来决定关键攻击时间。相比之下,这项工作主要探讨如何利用时间约束在线生成难以察觉的有效扰动来误导实时跟踪器

据我们所知,到目前为止,关于攻击在线对象跟踪的研究还很有限。 [ 44 ]生成物理对抗纹理,使 GOTURN 跟踪器 [ 17 ]始终错误地跟踪对象。与这项工作不同的是,我们打算对对象跟踪的对抗性攻击进行全面的研究,并提出有效的攻击来误导在线实时跟踪器沿指定的轨迹移动,并产生较小的扰动。由于目标跟踪器通常嵌入在移动控制系统中,因此对 VOT 特定领域对抗问题的深入分析和理解可能是加速实际应用的关键。此外,我们研究的主题模型,即基于SiamRPN 的跟踪器,在各种基准[ 10、45、20 ]上实现了最先进的性能, 并且获得了比 GOTURN 跟踪器更高的精度,因此将更具挑战性攻击时。

https://arxiv.org/abs/1904.11042

我们的基本攻击 (BA) 和空间感知在线增量攻击 (SPARK) 的分析。(a)显示攻击后目标位置与预测物体位置之间的距离。距离越小,意味着攻击越有效。(b) 显示每帧的平均绝对扰动。较小的 MAP 会导致不易察觉的扰动较少。(c) 展示了第 49 帧处 4 种攻击方法的对抗性扰动、相应的对抗性示例以及 SiamRPN-Alex 的响应图。(d) 包括从第 41 帧到第 49 帧的增量扰动以及每帧的损失值。

实证研究

1)对每个帧应用基本攻击的攻击效果如何?2)视频中时间帧的影响如何?为了回答这些问题,我们对最先进的跟踪器(例如 SiamRPN-Alex * )执行两种基本的有针对性的攻击:

表 1显示了 BA-E、BA-R1 和 BA-R2 在 TA 下攻击 OTB100 上基于 SiamRPN-Alex 的跟踪器的成功率、平均绝对扰动和每帧平均迭代次数。我们看到:1)通过 BIM 和 C&W 的 BA-E 方法通过攻击每一帧获得了很高的成功率。然而,它们的扰动很大,并且用 10 次迭代来攻击每一帧非常耗时,并且超出了实时跟踪器的范围。FGSM虽然高效,但成功率却低得多。2)随机攻击10%帧,即BA-R1,比BA-E快10倍左右。然而,成功率显着下降。3)BA-R2方法每10帧攻击一次,效率较高,但牺牲了成功率。与BA-R1相比,在相同的攻击率,即10%帧数的情况下,BA-R2的成功率高于BA-R1。例如,基于BIM,BA-R2的成功率是原来的两倍以上。它推断,由于时间平滑性,相邻 10 帧的扰动具有一定的可传递性。

基于 BIM 的案例研究如图1所示 ,其中我们使用三种 BA 攻击来误导基于 SiamRPN-Alex 的跟踪器来定位场景左上角的感兴趣对象(图 1 中的目标位置 ( c ))。我们没有遵循标准的 Siamese 跟踪管道,而是根据地面实况裁剪搜索区域,并确保对象始终位于搜索区域的中心。我们显示了目标位置(图1 (a))和跟踪结果之间的距离 ,以及 帧级别的 平均绝对扰动(MAP)(图 1 (b))。我们得出与表 1一致的结论。BA-E是最简单的解决方案,在某个时刻(距目标位置距离小于20)MAP在5左右时可以成功攻击跟踪器,但攻击效率较低,不适合实时跟踪。此外,根据图 1 (c),扰动很大并且是可察觉的。结果回答了第一个问题:对每一帧进行攻击并不有效,即耗时且MAP较大。

考虑帧之间的时间特性,如果攻击可以在相邻帧之间转移,我们可以只攻击某些帧,同时减少开销,例如BA-R1和BA-R2。不幸的是,表1和图 1中的结果 表明BA-R1和BA-R2仅在执行攻击的特定帧上工作。

结果回答了第二个问题:由于视频中的动态场景,BA 产生的扰动很难直接转移到下一帧(参见 BA-R1 和 BA-R2 的结果)。

在线增量攻击

根据基本攻击的实证研究结果,我们发现直接针对每一帧进行攻击是无效的。由于帧是连续的并且附近的帧非常相似,我们的深入分析发现附近的帧之间存在可转移性。然而,如何有效地利用先前帧的扰动,同时在攻击新的帧时保持不易察觉,这是值得怀疑的。一种直接的方法是将以前的扰动添加到新的计算扰动中,这将提高攻击的成功率,但会导致严重的扭曲。为了解决这个问题,我们提出了在线增量攻击(SPARK),它可以更有效地生成更多难以察觉的对抗性示例以进行跟踪。SPARK 的直觉是,我们仍然攻击每一帧,但通过优化将先前的扰动应用于新帧,并结合小但有效的增量扰动。

增量扰动的时空稀疏性: 增量扰动沿着空间和时间逐渐变得稀疏(见图 1 (d))。与 BA 方法相比,这有助于产生更多难以察觉的扰动。此外,SPARK在所有帧中获得最小的MAP,并且在OTB100上比BA-E更高的成功率(见图 1 (b))。
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1229773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

删除 word 中嵌入文字下方的图片

问题:Word中插入图片,选择图片格式【衬于文字下方】后,无法选择图片并删除。 解决方法: 如图所示,选择 【开始】-【编辑】-【选择】-【选择对象】,然后鼠标放在图片位置即可选中图片进行删除操作。

React中StrictMode严格模式,导致开发环境,接口会请求两次或多次( useEffect 请求多次)

问题描述: 我在用 create-react-app时,开发环境,一进页面接口会请求两次或多次。 我在首页 useEffect里 请求一个接口,整个页面就在这里请求这一次接口。但 实际上请求了两次。我检查了代码,确定只调用了一次&#xf…

算法进阶——链表中环的入口节点

题目 给一个长度为n链表&#xff0c;若其中包含环&#xff0c;请找出该链表的环的入口结点&#xff0c;否则&#xff0c;返回null。 数据范围&#xff1a;1<结点值<10000 要求&#xff1a;空间复杂度O(1)&#xff0c;时间复杂度O(n) 例如&#xff0c;输入{1,2},{3,4,5…

【文末送书】计算机网络 | IO多路转接技术 | poll/epoll详解

欢迎关注博主 Mindtechnist 或加入【Linux C/C/Python社区】一起学习和分享Linux、C、C、Python、Matlab&#xff0c;机器人运动控制、多机器人协作&#xff0c;智能优化算法&#xff0c;滤波估计、多传感器信息融合&#xff0c;机器学习&#xff0c;人工智能等相关领域的知识和…

麒麟KYLINOS2303系统上禁用新功能介绍页面

原文链接&#xff1a;麒麟KYLINOS2303系统上禁用新功能介绍页面 hello&#xff0c;大家好啊&#xff0c;今天给大家带来一篇在麒麟KYLINOS2303系统上禁用新功能介绍页面的文章&#xff0c;在我们安装完系统登录后&#xff0c;会发现有新功能介绍这个界面&#xff0c;我们可以通…

OpenCvSharp从入门到实践-(01)认识OpenCvSharp开发环境搭建

目录 一、OpenCV 二、OpenCvSharp 三、OpenCvSharp开发环境搭建 四、下载 五、其他 一、OpenCV OpenCV是基于Apache2.0许可&#xff08;开源&#xff09;发行的跨平台计算机视觉和机器学习函数库&#xff0c;支持Windows、Linux、Android和Mac OS操作系统。OpenCV由一系…

人工智能靠自学就行?

随着人工智能技术的飞速发展&#xff0c;这个领域的知识和技术对于很多人来说都充满了神秘和吸引力。很多人都想要学习人工智能&#xff0c;但是又不知道如何入手&#xff0c;是否需要参加培训机构或者跟着导师学习呢&#xff1f;今天&#xff0c;我想和大家分享一些关于自学人…

全流量分析应用运行和访问情况

在当今数字化时代&#xff0c;应用程序的运行和访问情况对于企业和组织来说至关重要。无论是在线销售平台、移动应用还是企业内部系统&#xff0c;应用的性能和可用性直接影响着用户体验、业务流程以及组织效率。因此&#xff0c;对应用的运行和访问情况进行全面分析和评估&…

[Kettle] 公式

公式是用来计算数据流中数据的表达式 公式可以是"AB"这样的简单计算&#xff0c;也可以是类似"if/then"复杂业务逻辑判断的表达式 数据源 2019年11月月考成绩(Kettle数据集16).xlshttps://download.csdn.net/download/Hudas/88553816?spm1001.2014.300…

【MySQL】细谈SQL高级查询

文章目录 一、前言 & 准备工作二、简易高级查询⚙ 准备工作1、查询每一门课程及其先修课程2、查询和“刘涛”在一个班级的学生的信息3、查询选修了‘计算机基础’课的学生的学号、姓名③ 连接方式④ 子查询嵌套方式 4、查询没有选修课程的学生的信息① 子查询in方式② 子查…

Python爬虫技术系列-03/4flask结合requests测试静态页面和动态页面抓取

python构建web服务 flask内容参考:Flask框架入门教程&#xff08;非常详细&#xff09; flask安装与运行测试 安装flask pip install flask创建一个webapp.py文件&#xff0c;内容如下 from flask import Flask# 用当前脚本名称实例化Flask对象&#xff0c;方便flask从该脚…

赠人玫瑰,手有余香,分享5款精致小巧的软件

​ 分享是一种美好的事情&#xff0c;它能让快乐变得更多&#xff0c;它能让悲伤变得更少&#xff0c;我会持续分享一些好用的软件给大家。 1.矢量图形设计——Affinity Designer ​ Affinity Designer是一款屡获殊荣的矢量图形设计软件&#xff0c;适用于 Windows、macOS 和…

wvp gb28181 pro 拉流代理功能

前言 不是所有的摄像机都支持国标或者推流的&#xff0c;但是这些设备可以得到一个视频播放地址&#xff0c;通常为rtsp协议&#xff0c; 以大华为例。可以得到这样一个流地址&#xff0c;可以直接用vlc进行播放&#xff0c;此时我们可以通过拉流代理功能将这个设备推送给其他国…

如何构建更简洁的前端架构?

目录 为什么需要前端架构&#xff1f; 那么&#xff0c;前端架构是什么样的呢&#xff1f; 使用了哪些层&#xff1f; 那么&#xff0c;这种架构会出什么问题呢&#xff1f; 我们应该如何避免这些错误&#xff1f; 哪些原则应适用于组件&#xff1f; Anti-Patterns 反模…

不会制作电子期刊怎么办?新发现

​电子期刊已经成为当今社会中非常流行的一种出版形式&#xff0c;它不仅方便快捷&#xff0c;而且易于分享和传播。如果你一直想尝试制作电子期刊&#xff0c;但又不知道如何开始&#xff0c;那么不用担心&#xff01;今天我将为你揭秘制作电子期刊的秘籍&#xff0c;让你轻松…

家电电器展示预约小程序的作用是什么

电器产品已经成为人们生活的必备品&#xff0c;如冰箱、电视机、洗衣机等&#xff0c;而这些产品的购买方式也很多&#xff0c;可以到线下门店购买&#xff0c;也可以到线上多个电商平台购买&#xff0c;如今互联网高速发展以及民众享受线上服务带来的便捷性&#xff0c;同时商…

Openlayer【二】—— 绘制不同的点、线以及给其添加监听事件

Openlayer【二】—— 绘制不同的点、线以及给其添加监听事件 接上篇&#xff1a;OpenLayer初始化 在openlayer当中&#xff0c;图层Layer与地图源Source是一对一的关系。当创建了一个图层Layer&#xff0c;相应的需要给图层添加地图源Source&#xff0c;然后将图层Layer添加到…

【Android】画面卡顿优化列表流畅度六(终篇)

上一篇&#xff1a; 【Android】画面卡顿优化列表流畅度五之下拉刷新上拉加载更多组件RefreshLayout修改 场景回顾&#xff1a; 业务经过一年半左右的运行后&#xff0c;出现了明显的列表卡顿情况&#xff1b;于是开始着手进行列表卡顿优化。目前的情况是&#xff1a; 网络图…

8年资深测试,自动化测试常见问题总结,惊险避坑...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、自动化测试简介…

好的CRM系统有哪些核心能力?

CRM是企业管理的重要工具&#xff0c;可以维护管理客户关系&#xff0c;提高企业的核心竞争力。市场营销、销售、客户服务和技术支持等相关领域都需要用到CRM系统。那么一个好的CRM&#xff0c;最核心的能力有哪些&#xff1f; 1.销售自动化 这里简单介绍下销售自动化的功能&…