论文阅读记录(1)

news2024/9/30 1:33:11

这一周读了2021cvpr的《Learning to Filter: Siamese Relation Network for Robust Tracking》。这篇文章的创新点:

  1. Relation Detector。关系检测器。关系检测器在本文中以元学习的方式执行,以获得从背景中过滤干扰物的能力。
  2. Refinement Module。x细化模块(RM),RM的目的是将RD模块有效的整合到孪生网络框架中(本文的孪生网络框架是SiamBAN),以产生准确的跟踪结果。
  3. 对比训练策略。

摘要最后提及,本文提出的跟踪器可以在面对背景杂乱、快速运动和遮挡的情况下获得准确的跟踪结果。

本文提出的Relation Detector结构图如下图所示:

1、Relation Detector

在本文中提出了一种新型的关系检测器(RD),该检测器配备了自适应非线性比较器,具有很强的判别能力,通过测量与被跟踪目标的相似关系来过滤干扰物。由于训练这样的检测器需要相同序列的目标样本,而这些样本通常是不足的,传统的训练策略不能很好地发挥作用,而少采样学习的方式可以克服这一挑战。因此,本文通过少样本学习来训练网络,使关系检测器能够转移在大量不同的少量任务学习中获得的元知识。Relation Detector的结构图如下图所示:

 关系检测器有三种不同的非线性可学习比较器组成,即全局检测器、局部检测器和块检测器。

 2、Contrastive Training Strategy

与传统的学习框架不同,少样本学习任务具有每个类别中缺乏标记样本的特点。它的目的是构造一个分类器,通过一些已知的标记样本作为支持集,为查询集中的每个样本x分配一个标签y。当支持集包含N个不同的类别,每个类别有K个标记样本时,我们将其定义为N -way K-shot。在我们的训练中,我们定义了目标和非目标两个类别,我们的实验是双向的一次性学习。

对比训练样本的生成。仅仅匹配相同实例的对象是不够的,因为区分不同对象的能力也很重要。因此,本文利用训练样本之间的潜在关系,构造训练三元组(sc, qc, sn),其中sc和sn为正支持图像和负支持图像,qc为查询图像。Sc和qc是从同一视频中提取的,sn是从不同视频中提取的。

在每一次学习过程中,不仅对目标类别中的物体进行匹配,还对非目标类别中的干扰物进行区分,并学习测量由输入三元组生成的不同样本组合之间的关系。将正支持的基础真值定义为sp,并使用pp表示sc和qc生成的正建议。类似地,负支持的基真值记为nn,我们用pn表示由sc和qc生成的负建议。然后我们将它们组合成不同的对,如(sp, pp), (sp, pn), (nn, pp/pn),并保持1:2:1的比例。我们采用MSE损失作为损失函数,计算这些形成的对上的匹配损失。

难例挖掘。在训练初期,使用简单样本可以使模型稳定收敛。为了进一步增强模型的判别能力,在训练中后期引入了难例挖掘。详细地说,以两种不同的方式(在线和离线)执行难例挖掘。对于在线方法,首先计算候选区域与ground-truth之间的union (IoU)交集,然后去除IoU值大于0.2的部分提案。然后从剩余的候选区域中选择置信度得分最高的候选区域作为难例样本。对于离线方式,在VID , GOT和LaSOT等大规模数据集的预处理过程中生成一个近似最近邻查询的索引表。然后给定被跟踪对象的图像,使用索引表在嵌入空间中检索被跟踪对象的最近邻,可以找到N个不同的硬负样本。

 3、Refinement Module

分类和回归是基于cnn的跟踪器的两大支柱,它们通常是独立优化的,导致它们之间存在不匹配的问题。具体来说,分类置信度最高的位置对应的方框不是最准确的,甚至不是跟踪的目标。本文设计了一个细化模块,它有效地将建议的RD集成到Siamese框架中。首先,利用RD的输出并将其转换为大小为25 × 25 × 1的匹配分数。接下来,我们将匹配分数与分类分支的互相关特征图进行逐元相乘,通过抑制假阳性位置来过滤背景中的干扰物。然后通过卷积层将精炼的相关特征传递给卷积层,生成精炼的分类置信度分数。

下图提供了获得的置信度图的一些示例。在细化模块中,我们将回归分支和分类分支的信息结合起来,共同操作来预测目标位置,从而缓解了不匹配的问题。

 4、损失函数

 Lmatching表示的是RD检测器求得得分数与真值标签之间得MSE损失。

5、训练和推理

5.1、训练

我们在大规模数据集上训练我们的暹罗关系网络,包括ImageNet VID、YouTubeBoundingBoxes、COCO、ImageNet DET、GOT10k[18]和LaSOT。训练输入是一个图像三元组,包括从相同序列中提取的模板补丁和搜索补丁,其大小分别为127×127和255×255像素,以及从另一个大小为255×255的序列中提取的负搜索补丁。我们首先从三联体的同一序列中选择两个patch,在其上最多采集16个阳性样本和48个阴性样本,训练分类分支和回归分支[25,24,4]。然后,使用三元组中的负搜索patch来生成我们的关系检测器的训练输入。此外,我们在epoch 5和epoch 15开始使用在线难例挖掘进行离线。我们的整个网络可以端到端进行训练,不需要任何进一步的微调。

5.2、推理

在推理过程中,以第一帧中目标的patch作为模板,并将其送入骨干提取模板特征fz。在跟踪过程中对其进行缓存,避免后续跟踪中重复计算。通过精确的ROI池化得到模板的ROI特征[6]。对于后续帧,我们根据前一帧的跟踪结果裁剪搜索补丁并提取其特征,称为fx。然后在搜索区域进行预测,得到回归图P reg−all w×h×4并生成建议。接下来,建议的特征被裁剪并与ROI z的缓存目标ROI特征连接起来。将得到的特征馈送到RD中,以度量提案与目标之间的关系。我们将此关系转换为匹配分数s匹配w×h×1,并使用分类分支中corr cls的相关图进行逐元素乘法。通过这种方式,我们将回归结果融合到分类分支中,而不是单独计算它们。然后,我们通过改进的相关图f * corr cls生成分类图P cls−all w×h×2。最后,我们可以通过P reg−all w×h×4和P cls−all w×h×2得到预测框。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/545526.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

canal学习-运行canal-adapter源码并记录解决报错问题(包含缺失的jar文件)(一)

运行canal-adapter 1. 下载canal源码1.1 下载源码并安装好环境1.2 查看目录结构 2.项目运行2.1 项目打包2.2 项目打包可能遇到的问题:1.Failure to find com.alibaba.otter:connector.tcp:jar:jar-with-dependencies:1.1.52.com.alibaba.druid.pool.DruidDataSource…

数字信号处理基础(三):FIR滤波器的设计

目录 1. 滤波器1.1 低通滤波器1.2 高通滤波器1.3 带通滤波器1.4 带阻滤波器 2. 完整代码3. 结果图 1. 滤波器 1.1 低通滤波器 低通滤波器需要知道低通截止频率,然后采用以下代码实现 % 低通滤波器设计 fp2*10000; % 低通滤波器截止频率&#x…

安全测试之使用Docker搭建SQL注入安全测试平台sqli-labs

1 搜索镜像 docker search sqli-labs 2 拉取镜像 docker pull acgpiano/sqli-labs 3 创建docker容器 docker run -d --name sqli-labs -p 10012:80 acgpiano/sqli-labs 4 访问测试平台网站 若直接使用虚拟机,则直接通过ip端口号访问若通过配置域名&#xff0…

2023-5-20-各种编译器的全面学习

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 💥💥💥欢迎来到🤞汤姆🤞的csdn博文💥💥💥 💟💟喜欢的朋友可以关注一下&#xf…

网站投票软件投票链接制作软件投票链接小程序投票程序

近些年来,第三方的微信投票制作平台如雨后春笋般络绎不绝。随着手机的互联网的发展及微信开放平台各项基于手机能力的开放,更多人选择微信投票小程序平台,因为它有非常大的优势。 1.它比起微信公众号自带的投票系统、传统的H5投票系统有可以图…

LLVM-Clang交叉编译详细教程

文章目录 前言对比GCC与ClangClang交叉编译参数选项安装交叉编译器交叉编译生成二进制文件Target Arch列表Target Triple列表参考文档后话 前言 最近自己写了个C的小项目,想在Windows编译出其他平台的二进制文件的话,只能交叉编译了,于是就选…

性能测试-JMeter分布式测试及其详细步骤

性能测试概要 性能测试是软件测试中的一种,它可以衡量系统的稳定性、扩展性、可靠性、速度和资源使用。它可以发现性能瓶颈,确保能满足业务需求。很多系统都需要做性能测试,如Web应用、数据库和操作系统等。 性能测试种类非常多,…

深入学习《c语言函数》

📕博主介绍:目前大一正在学习c语言,数据结构,计算机网络。 c语言学习,是为了更好的学习其他的编程语言,C语言是母体语言,是人机交互接近底层的桥梁。 本章学习函数。 让我们开启c语言学习之旅吧…

Mybatis管理数据库

快速入门 使用idea工具操作数据库使用Mybatis查询所有用户数据第一步创建springboot工程,数据库表user,实体类User第二步,引入Mybatis的相关依赖,配置Mybatis(数据库连接信息)第三步,编写sql语句…

Jmeter工具+ant+jenkins实现持续集成

jmeterantjenkins持续集成 一、下载并配置jmeter 首先下载jmeter工具,并配置好环境变量;参考: jmeter默认保存的是.jtl格式的文件,要设置一下bin/jmeter.properties,文件内容,保存jmeter.save.saveservice.output_f…

关于华为云负载均衡ELB健康检查显示离线的排查问题及解决办法

由于项目中经常涉及到检修升级操作,在进行检修升级时,服务就需要停止一段时间,检修结束后重启,在此期间相关的功能页面都将无法访问。甲方反馈,需要停止服务的检修工作暂时不予执行。因此,为了不耽误系统的…

低代码搭建制造管理系统,你要知道的哪些事~

随着数字化转型的推进,制造业也逐渐意识到数字化转型的重要性。数字化转型不仅可以提高制造业的效率和品质,还可以降低成本和提高客户满意度。在数字化转型中,低代码搭建制造管理系统是一种比较有效的方式。本文将介绍低代码搭建制造管理系统…

深入篇【C++】类与对象:再谈构造函数之初始化列表与explicit关键字

深入篇【C】类与对象&#xff1a;再谈构造函数之初始化列表与explicit关键字 Ⅰ.再谈构造函数①.构造函数体赋值②.初始化列表赋值【<特性分析>】1.至多性2.特殊成员必在性3.必走性&#xff1a;定义位置4.一致性5.不足性 Ⅱ.explicit关键字①.隐式类型转化②.作用 Ⅰ.再谈…

Spring Cloud Alibaba 集成 sentinel ,sentinel控制台不能检测到服务,但是在命令行配置启动参数就能看到服务

问题背景 Spring Cloud Alibaba 集成 sentinel &#xff0c;sentinel代码写的限流降级的功能都是好的&#xff0c;但是sentinel控制台不能检测到服务&#xff0c;在程序启动时配置JVM启动参数&#xff08;-Dcsp.sentinel.dashboard.serverlocalhost:18080 -Dproject.namename-…

分公司的负责人要如何承担责任

一、分公司的负责人要如何承担责任 1、分公司的负责人不需要承担责任&#xff0c;因为没有法人资格&#xff0c;没有独立的财产权。根据相关法律规定&#xff0c;分公司的债务由总公司承担连带责任&#xff0c;当然可以先由分公司的全部财产承担。 2、法律依据&#xff1a;《…

小白量化《穿云箭集群量化》(9)用指标公式实现miniQMT全自动交易

小白量化《穿云箭集群量化》&#xff08;9&#xff09;用指标公式实现miniQMT全自动交易 在穿云箭量化平台中&#xff0c;支持3中公式源码运行模式&#xff0c;还支持在Python策略中使用仿指标公式源码运行&#xff0c;编写策略。 我们先看如何使用指标公式源码。 #编程_直接使…

【2023秋招】每日一题:P1087-美团3-18真题 + 题目思路 + 所有语言带注释

2023大厂笔试模拟练习网站&#xff08;含题解&#xff09; www.codefun2000.com 最近我们一直在将收集到的各种大厂笔试的解题思路还原成题目并制作数据&#xff0c;挂载到我们的OJ上&#xff0c;供大家学习交流&#xff0c;体会笔试难度。现已录入200道互联网大厂模拟练习题&…

【C生万物】 指针和数组笔试题汇总 (下)

欢迎来到 Claffic 的博客 &#x1f49e;&#x1f49e;&#x1f49e; &#x1f449; 专栏&#xff1a;《C生万物 | 先来学C》&#x1f448; 前言&#xff1a; 承接上文&#xff0c;继续进行指针和数组的练习。 目录 Part2:指针笔试题 1.做题 …

硬件系统工程师宝典(24)-----如何能够正确理解三极管?

各位同学大家好&#xff0c;欢迎继续做客电子工程学习圈&#xff0c;今天我们继续来讲这本书&#xff0c;硬件系统工程师宝典。上篇我们说到不同材质的磁珠&#xff0c;频率阻抗特性不同&#xff0c;根据磁珠的频率阻抗特性曲线&#xff0c;磁珠在低频时电感起作用&#xff0c;…

Java开源工具库使用之压测JMeter

文章目录 前言一、概念原理1.1 Jmeter 原理1.2 性能测试术语1.3 web项目性能标准 二、常用元件2.1 线程组2.2 取样器2.3 控制器2.4 定时器2.5 前置/后置处理器2.6 配置元件2.7 监听器 三、插件3.1 第三方插件3.2 录制插件 四、JSR223 脚本及函数4.1 JSR223 脚本4.2 函数变量 五…