Mobile Vision Transformer-based Visual Object Tracking

news2024/11/26 13:28:08

论文作者:Goutam Yelluru Gopal,Maria A. Amer

作者单位:Concordia University

论文链接:https://arxiv.org/pdf/2309.05829v1.pdf

项目链接:https://github.com/goutamyg/MVT

内容简介:

1)方向:目标跟踪算法

2)应用:大规模数据集上的目标跟踪

3)背景:近年来,引入了强大的骨干网络(如Vision Transformers),提高了目标跟踪算法的性能。然而,这些最先进的跟踪器在计算上很昂贵,因为它们具有大量的模型参数,并依赖于专用硬件(如GPU)进行更快的推理。另一方面,最近的轻量级跟踪器速度快,但准确性较低,特别是在大规模数据集上。

4)方法:本次工作,作者首次提出了一种使用Mobile Vision Transformers(MobileViT)作为骨干网络的轻量级、准确和快速跟踪算法。还提出了一种新的方法,将模板和搜索区域的表示融合在MobileViT骨干网络中,从而为目标定位生成优秀的特征编码。

5)结果:实验结果表明,基于MobileViT的跟踪器MVT在大规模数据集GOT10k和TrackingNet上的性能超过了最近的轻量级跟踪器,并具有较高的推理速度。此外,该方法在GPU上的模型参数数量只有DiMP-50跟踪器的4.7倍,并以2.8倍的速度运行,但性能却更好。跟踪器的代码和模型可在https://github.com/goutamyg/MVT上获得。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1009161.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

添加Typora主题皮肤

到官网下载喜欢的主题皮肤,比如【vue风格】 https://theme.typora.io 下载压缩包 打开 typora 主题皮肤文件夹 将解压后文件夹中的 vue文件夹 和 vue.css 复制到 主题皮肤文件夹中 重启 typora ,主题菜单中选择 新装的 vue 皮肤即可

华为云云耀云服务器L实例评测|基于云耀云服务器部署Samba服务

本实验将使用华为云云耀云服务器L实例,使用CentOS 7.9系统,搭建部署Samba服务器,并在本地Windows端进行访问。 文章目录 1、samba介绍2、环境准备3、安装samba软件包4、修改smb.conf配置文件5、添加访问samba的用户6、Windows下访问Samba服务…

三、数学建模之非线性规划

1、定义 2、例题matlan代码求解 一、定义 1.非线性规划(Nonlinear Programming,简称NLP)是一种数学优化问题的方法,它处理的目标函数或约束条件包含非线性项。与线性规划不同,非线性规划涉及到在非线性约束下寻找最优…

【Y 新闻】YMatrix携手三一集团,荣获“2023爱分析·数据库最佳实践案例”

2023 年 8 月 16 日,由爱分析主办的第五届数据智能高峰论坛在北京 JW 万豪酒店成功举办。本次论坛以“激活数据资产,释放数据价值”为主题,聚焦企业在数据能力和数据应用建设过程中所面临的系列问题。会上,由 YMatrix 与三一集团携…

iPhone15发布,苹果和台积电的牛皮都破了,3纳米没那么神奇

在发布会之前,A17处理器和3纳米工艺被吹得神乎其神,随着iPhone15的发布,两者也终于在人们面前显示出真面目,事实就是先进工艺并没那么厉害,多花的钱并不值。 苹果在发布会上表示A17Pro处理器的CPU性能最高提升10%&…

背包问题---怎么选取物品,可以使得背包装的物品价值最大?

原文: https://zhuanlan.zhihu.com/p/567560364 1)0-1背包问题的描述 现在有四种物品,每种物品只有1件,它们的重量与价值如下表。 现在有一个背包,总容量为8。问怎么选取物品,可以使得背包装的物品价值…

C#,《小白学程序》第二十三课:大数的除法(BigInteger Divide)

1 文本格式 /// <summary> /// 比较a&#xff0c;b的大小&#xff0c;返回1&#xff0c;0&#xff0c;-1 /// 数据从低位&#xff08;右&#xff09;往高位&#xff08;左&#xff09;存储; /// </summary> /// <param name"a"></param> ///…

Linux(下)

一、 对netstat的补充 1.进程管理 在杀死进程时&#xff0c;不可以杀死其他用户的进程。 查看指定进程时&#xff0c;下图的第二行 是ps -ef | grep tail 命令执行的进程 kill -9 进程号 也可以写作 kill -s 9 进程号 机器人&#xff1a; 2.查看主机状态 将进程的信息分三…

使用新版Maven-mvnd快速构建项目

目前我们项目的构建方式多数是 maven、gradle&#xff0c;但是 maven 相对 gradle 来说&#xff0c;构建速度较慢&#xff0c;特别是模块相对较多的时候&#xff0c;构建速度更加明显。但是我们将项目由 maven 替换为 gradle 相对来说会比较麻烦&#xff0c;成本较高。于是我们…

文章生成器免费版

你是否曾经陷入文案创作的困扰中&#xff1f;是不是为了撰写出优质的文章而煞费苦心&#xff1f;那么&#xff0c;如果我告诉你&#xff0c;现在有一种神奇的工具&#xff0c;可以为你解决这个问题&#xff0c;让你轻松地生成文章&#xff0c;你会不会感到兴奋呢&#xff1f;让…

惊艳时装界!AIGC风暴来袭,从设计到生产的全新体验

时尚是一个不断演进的领域&#xff0c;充满创新和独创性&#xff0c;但现在&#xff0c;创新迈入了一个崭新的境界——人工智能生成内容&#xff08;AIGC&#xff09;。这个革命性的技术&#xff0c;改变了时装设计的游戏规则。在过去的几年里&#xff0c;人工智能已经深刻地改…

关于时空数据的培训 GAN:实用指南(第 02/3 部分)

一、说明 在本系列关于训练 GAN 实用指南的第 1 部分中&#xff0c;我们讨论了 a&#xff09; 鉴别器 &#xff08;D&#xff09; 和生成器 &#xff08;G&#xff09; 训练之间的不平衡如何导致模式崩溃和由于梯度消失而导致静音学习&#xff0c;以及 b&#xff09; GAN 对超参…

C 编译原理

C 编译原理 目录 C 编译原理引入GCC 工具链介绍C运行库 编译准备工作编译过程1.预处理2.编译3.汇编4.链接 分析ELF文件1.ELF文件的段2.反汇编ELF C语言编译过程 - 摘录编译预处理编译、优化汇编链接过程 引入 大家肯定都知道计算机程序设计语言通常分为机器语言、汇编语言和高…

【80天学习完《深入理解计算机系统》】第十六天 4.2 Y86-64的顺序实现

专注 效率 记忆 预习 笔记 复习 做题 欢迎观看我的博客&#xff0c;如有问题交流&#xff0c;欢迎评论区留言&#xff0c;一定尽快回复&#xff01;&#xff08;大家可以去看我的专栏&#xff0c;是所有文章的目录&#xff09;   文章字体风格&#xff1a; 红色文字表示&#…

Spring Boot的优点及项目创建

Spring Boot优点 起步依赖&#xff08;创建的时候就可以方便的添加依赖&#xff09;内置了Tomcat容器快速部署&#xff0c;使用jar包加上简单的命令直接运行抛弃XML的配置方式提供了更多的监控框架&#xff0c;方便的监控系统运行 Spring Boot项目的创建 准备工作 1.如果ID…

Linux常用命令 - 简单命令

简单命令 who 功能&#xff1a;列出所有正在使用系统的用户相关信息。 who who am i whoamidate 功能&#xff1a;显示或者设置系统的日期和时间。 date date -s 12:3:3cal 功能&#xff1a;显示日历。 cal cal 2023 cal 9 2023clear 功能&#xff1a;清除屏幕上的信息…

浙工大MBA常规批复试建议怎么准备?

如果你第一志愿报考浙江工业大学MBA项目不想被无故的淘汰&#xff0c;小编建议你还是认真对待考后的复试环节。因为从2023年的招生录取可以看到&#xff0c;浙工大MBA项目的提前批面试对于最终录取几乎是没什么作用的&#xff0c;在与普通考生同层次竞争的局面下&#xff0c;复…

高压放大器的特点及应用领域有哪些

高压放大器是一种用于增强输入信号的电压的设备&#xff0c;具有许多独特的特点和广泛的应用领域。下面西安安泰将详细介绍高压放大器的特点以及其在各个领域的应用。 高压放大器的特点&#xff1a; 高增益&#xff1a;高压放大器能够提供高增益&#xff0c;即输入信号经过放大…

redis深度历险 1 - Redis基础数据结构-001

Redis有5种基础数据结构&#xff0c;分别为: string (字符串)、list(列表)、set (集合)、hash (哈希&#xff09;和zset (有序集合)。熟练掌握这5种基本数据结构的使用是Redis 知识最基础也最重要的部分&#xff0c;它也是在 Redis面试题中问到最多的内容。 1 字符串 string …

css实现内凹圆

css实现内凹圆 实现效果 html <div id"post-form"><div class"formbox"></div><div class"rightform"></div> </div>css 样式 #post-form{padding:50px 10px;background:#fff;margin:30px auto;width:9…