SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports Scenes
SportsMOT是一个新的大规模多目标追踪数据集,专注于多样化的体育场景,其中需要跟踪场上的所有运动员。该数据集包括来自篮球、排球和足球等三类体育项目的240个视频序列,超过15万帧(几乎是MOT17的15倍),以及超过160万个边界框(MOT17的3倍)。该数据集具有两个关键特性:1) 快速和变速运动;2) 相似但可区分的外观。
本次任务中,作者对几种最先进的跟踪器进行了基准测试,发现 SportsMOT 的关键挑战在于物体关联。为此提出一种新的多目标跟踪框架,称为 MixSort,引入了类似MixFormer的结构作为辅助关联模型,与现有的基于检测的追踪器结合使用。MixSort通过将定制的外观关联与原始的运动关联相结合,实现了在SportsMOT和MOT17上的最先进性能。
- 论文链接:https://arxiv.org/abs/2304.05170
- 项目链接:https://deeperaction.github.io/datasets/sportsmot.html