SCTracker 跟踪论文阅读笔记

news2025/1/10 21:03:05

SCTracker 跟踪论文阅读笔记

SCTracker: Multi-object tracking with shape and confidence constraints
论文链接 (未开源状态)

论文主要更新点围绕shape constraint and confidence两点来展开:

  • 首先论证在跟踪匹配的过程中D-box(检测框)与T-box(预测框)需要有一定的形状约束来决定最后匹配的cost matrix,避免特殊情况下的iou匹配不准确的因素。
  • 后根据检测置信度得分对KF在某些遮挡或者其他干扰因素造成检测得分降低后的自适应修改,对测量噪声协方差噪声的敏感程度由检测得分来决定,这一点与Strong-sort中论文类似,可看之前的文章介绍 BoT-SORT与Strong-SORT论文对比及思考总结 ,不过SCTracker对噪声协方差的公式也有点差别,但总体不大,看下文分析,以及利用检测置信度在更新的基础上利用卡尔曼滤波对原状态向量m更新为新状态向量m0时状态向量的速度分量进行校正。

1、跟踪方法的pipeline处理流程及论证shape Iou:

1.1、pipeline

在这里插入图片描述
根据这个pipeline,在此基础上将改进的点一一嵌入,然后做相关对比实验。
上面图中的pipeline是一个最基础的类似sort的跟踪处理方法,而且作者提到,实验使用ByteTrack作为基准的对比对象,而ByteTrack论文也仅仅是在sort的基础上做了改进,最主要是有一个强检出的检测器YOLOX,而此篇论文检测器与ByteTrack一样,做消融实验才能有对比性。

1.2、提出Shape Iou

在这里插入图片描述
上图为作者论证Iou的不可行性,两个box的交集相同,并且计算出来的iou值也相同,对于这种情况普通的iou计算不能区分匹配度,在此作者提出Shape Iou,猜想这个也是得到训练检测模型中的iou损失函数的启发,类似GIou方法 ,普通iou方法确实对一些形状变化但是iou值却相同的box不能很好的做区分,故有了论文的更新点。

2、论文更新改进点

i1:shape constraint 在原始计算iou cost
matrix的基础上添加高度及区域限制,高度代表的是D-box的H,T-box的H,以及两者外界矩形的H。
i2:confidence 用来对测量噪声协方差做自适应操作,以及对更新m的速度项做对应的校正。

(一)shape constraint

普通iou计算方法:
在这里插入图片描述
对应计算的iou距离表达公式为:
在这里插入图片描述
而shape iou在iou的基础上加了两项限制条件:
在这里插入图片描述
Ph代表的是高度上做一定的限制,Ps代表的是区域上做限制,而对应的Ph和Ps的公式计算为:
在这里插入图片描述
ha为a-box的H,hb为b-box的H,hu为a-box与b-box的最小外接矩形的H;
Sa、Sb、Su类似上面,只不过对应的是区域面积, 在这里插入图片描述为一个固定的值,论文的经验值设置为在这里插入图片描述,以保证限制项的有效性。

公式列完,大概的改动就一目了然了,而且公式也很简单,总体带来的收益也有所提升,看下文的实验部分。

(二)confidence

ii1、 首先检测置信值用来自适应噪声协方差这一部分在它之前的论文Strong-Sort中已经提到过,而此篇论文在公式上做了点手脚,但大致无太大差别,看公式吧:
Strong-Sort :
在这里插入图片描述
SCTracker :
在这里插入图片描述

Strong-Sort中的Ck代表检测置信度,SCTracker中的score代表的也是检测置信度,是不是仅仅动了点手脚,大致意思一样,不过可能还有另外一层意思是我没有猜到的,也可能是作者认为不管检测得分有多高多可信,在实际的应用中协方差噪声这个矩阵都是有一定的作用的,所以在检测置信度的基础上做了部分削减,不过这也是我的猜测,不一定对,有懂的小伙伴欢迎交流。

ii2、 其次,将检测置信度也用到了更新项m的速度校正上,这一点感觉还是有一定道理的,既然对协方差噪声都做了一定的自适应,对于更新项的m确实也应该做一定的校正:
在这里插入图片描述
注意:在这里插入图片描述为原始输入的m作为需要更新的项的后四维速度项,而在这里插入图片描述为更新m的后四维速度项,根据此公式可以知道如果检测置信度高,则原始m项的权重小,依赖更新的m值,有点类似二分类问题的交叉熵损失函数了,感觉很多都是现有经验的迁移一样,有意思哈。

3、实验部分

作者将ByteTrack作为baseline进行对比,总体略有提升,虽说提升的点不是很多,但是总体的跟踪效果表现从指标上看确实是有改善的,不过还得自己实际验证。

在这里插入图片描述

4、总结

作者提出的这两个更新点对跟踪上有一定的提升,改动点比较简单,根据公式做对应的修改,代码都不需要改很多,可以尝试下,shape-iou其实倒是感觉用处不大,类似reid部分特征匹配时加的马氏距离限制,shape-iou在一定程度上会有点改善,但不过看主要的跟踪场景,KF预测部分修改可做相应尝试,使用检测置信度确实是一种可行的方案,毕竟检出得分高的代表着他确实是清晰目标,噪声对应小,而得分低意味着可能被遮挡或者模糊等情况,有做过尝试的小伙伴欢迎交流,谢谢!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/558769.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

今日的CSS小案例

个人名片: 😊作者简介:一名大一在校生,web前端开发专业 🤡 个人主页:几何小超 🐼座右铭:懒惰受到的惩罚不仅仅是自己的失败,还有别人的成功。 🎅**学习目…

第一篇、基于Arduino uno,获取dht11温湿度传感器的温度信息和湿度信息——结果导向

0、结果 说明:先来看看串口调试助手显示的结果,如果是你想要的,可以接着往下看。 1、外观 说明:虽然dht11温湿度模块形态各异,但是代码都是适用的,因为它们的模块都是一样的。 2、连线 说明:…

微博开发--微博官方API使用方法【从注册到实战】

第一步:微博开发者身份认证 访问微博开放平台,登录自己微博账号,登录之后首先需要完善开发者的基本信息。【使用个人】 填写完成之后【审核通过】如下: 第二步:创建自己的应用 【备注:如果只是为了测试…

逻辑回归及逻辑回归的评估指标

一、逻辑回归介绍 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 1.逻辑回归的应用场景 …

【腾讯云FinOps Crane 集训营】快速搭建一个 Kubernetes+Crane 环境,以及如何基于 Crane 优化你的集群和应用初体验

文章目录 一、活动介绍二、环境搭建三、安装本地的 Kind 集群和 Crane 组件四、界面截图五、主要功能六、整体架构七、Crane的优势八、总结参考文献 一、活动介绍 Crane 是由腾讯云主导开源的国内第一个基于云原生技术的成本优化项目,遵循 FinOps 标准,…

用java带你了解网络IO模型

目录 1.BIO1.1 简述1.2 代码示例1.3优点和缺点1.4 思考 2. NoBlockingIO2.1 简述2.2 代码示例2.3 优点和缺点2.4 思考 3. NIO(NewIO)3.1 简述3.2 代码示例3.3 优点和缺点3.3 思考 4. 扩展select/poll、epoll4.1 简述4.2 select/poll4.3 epoll4.4 扩展话题…

Linux之vim编辑器的使用

目录 一、vim是什么? 试验1: 二.命令模式继承用法: vim命令模式的快捷键: 光标移动: vim文本复制相关操作: vim文本编辑操作: 三.末行模式命令用法 部分快捷键: 四.vim编辑器的配置原理 一、vim是什么? vi…

Hive SQL语句的正确执行顺序

关于 sql 语句的执行顺序网上有很多资料,但是大多都没进行验证,并且很多都有点小错误,尤其是对于 select 和 group by 执行的先后顺序,有说 select 先执行,有说 group by 先执行,到底它俩谁先执行呢&#x…

智能结构诊断器:建筑结构健康的守护者

近年来,接二连三的自建房坍塌,超高层建筑震动,让建筑的健康和安全性成为了人们关注的焦点。为了确保建筑物的长期稳定性和安全性,迫切需要高效且准确的方法来监测结构的健康状况。智能结构诊断器的出现,让建筑结构监测…

大数据如何助力营销(5)活动复盘

在市场竞争日益激烈的今天,营销活动已经成为吸引用户、提升品牌影响力、增加销售转化的重要手段。然而,一场营销活动在举办后,往往难以评估活动的效果,而大数据技术将从方方面面、科学有效地复盘活动,并为下一次举办活…

chatgpt赋能Python-python_kbhit

Python kbhit - 帮助您掌握实时按键输入 如果您需要使用实时按键输入来控制您的Python程序,那么你需要知道的是Python kbhit。kbhit是一种允许用户实时按键输入并立即响应的技术。本文将介绍Python kbhit的用途和用法,并探讨实时输入如何帮助您掌控程序…

AI绘图学习心得分享-Midjourney绘画AI,让你少走一些弯路

本教程收集于:AIGC从入门到精通教程 AI绘图学习心得分享-Midjourney绘画AI,让你少走一些弯路 本篇没有什么长篇大论,全部都是实用心得总结。接下来,我们将分享关于Midjourney绘画AI的实用心得总结,包括构图指令结构、常用指令、操作技巧、常用风格词汇和构图词汇。 如果…

手机号码在网时长 API 实现广告投放和精准营销案例分析

引言 手机在网时长是指用户在移动网络上的在线时间,包括用户接入网络的时间和断开网络的时间。手机在网时长 API 是一种提供手机在网时长数据的编程接口,为开发者和服务提供商提供了获取和利用这些数据的能力。 本文旨在深入探讨手机在网时长 API 的技…

计算机视觉——day95 PANet:基于样本原型对齐的Few-Shot图像语义分割

PANet:基于样本原型对齐的Few-Shot图像语义分割 1. Introduction2. Related workFew-shot segmentation 3. Method3.1. Problem setting3.2. Method overview3.3. Prototype learning(原型学习)3.4. 非参数度量学习3.5. 原型对准正则化(PAR) 4. Experime…

MySQL高级 之 explain执行计划详解

使用explain关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的,分析你的查询语句或是表结构的性能瓶颈。 explain执行计划包含的信息 其中最重要的字段为:id、type、key、rows、Extra 各字段详解 id select查询的序…

前端安全和防护:如何保护网站和用户信息的安全

第一章:引言 在当今数字化时代,随着互联网的飞速发展,网站已成为人们获取信息和进行交流的主要渠道。然而,随之而来的是对网站安全的日益关注。作为前端开发者和网站管理员,我们有责任确保用户的信息和网站的安全。本…

可分析表情和情绪的轻量化眼镜:Emteq OCOsense解析

近年来,越来越多VR头显开始尝试结合眼球追踪、手势追踪等生物识别技术,甚至在一些VR社交场景,也在探索将Avatar与面部识别功能结合。可以想象,未来生物识别与AR/VR等穿戴技术的关系将越来越紧密,尽管现阶段相关硬件在体…

Jenkins安装插件教程 牢记 Jenkis安装插件(plugin)的两种方法

目录 jenkins在线安装组件(plugin) jenkins离线安装组件(plugin) 前言:在jenkins学习使用或使用的过程中,由于网络的问题,在选择安装插件的时候,会出现某些插件安装失败。这是需要…

Word控件Spire.Doc 【列表】教程:在 Word 文档中插入列表

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转…

【MaxCompute】基于Package跨项目访问资源实践

背景 目前随着公司业务的不断扩展,各个业务线的数据也越来越多,如果所有数据都集中管理比较错综复杂。MaxCompute的跨项目访问资源比较适合这样的场景。每个业务线创建对应的project,自行管理数据。如果有需要访问其他业务线数据的诉求&…