Part-aware attention correctness for video salient object detection笔记总结

news2024/9/22 15:36:07

一、摘要

问题:在以往的VSOD中,一般主要是研究时空结构,利用隐式注意力模型去聚合相邻视频帧的互补信息。但很少有方法去关注跨视频帧的亲和力,即建立显式注意力图式去完成VSOD。
解决:提出一个新的注意力正确性策略去监督聚合过程。
具体实现:采用成对训练模式,利用积极和消极的聚合监督去探索VSOD的视频间亲和力。
该方法的优点:成功抑制视频帧的负对应,增强了对显著对象的判别(区分性)特征的挖掘。
优化:为了增强视频内的一致性,提出了部分感知的相似性聚合模块,帮助视频内的亲和力去分割视频级上下文的显著对象。

二、实现流程

该方法目的:学习相邻视频帧之间的相互对应关系,并利用额外的跨视频监督,从而促进从视频内和视频间上下文中检测显著对象。
具体实现过程:提出了一个PACNet,这是一个部分感知视频间和视频内增强方法,他不仅能探索视频内的对应关系,而且可以跨视频注意力监督。

PACNet:
在这里插入图片描述
使用视频内相关性去生成由ground truth masks监督的显著性图;为了抑制显著性挖掘的负对应,利用视频内相似性去产生由零显著性图监督的负面(消极)结果。绿色的线表示视频内的正相关性,红色线表示成对视频间的负对应性。

为了提高视频内的时间依赖性,提出了一个基于注意力的聚合模块,可以动态的计算相邻帧之间的内在相关性,但由于所有视频帧之间的像素相关性挖掘成本是很高的,因此这里提出了一个有效的部分感知注意力排名策略。这种操作可以只考虑几个排名靠前的相关性特征来降低计算成本。

将视频间亲和力和注意力正确性策略集成到我们的网络中,去学习有用处的相关性,同时抑制非显著的视觉线索,去实现更准确的VSOD。

注意力正确性策略监督聚合过程图:
在这里插入图片描述

三、关于VSOD的部分感知注意力正确性

部分感知相似性聚合块的流程图:
在这里插入图片描述
大概内容如图,利用两个卷积对输入的连续帧T嵌入特征图,之后利用矩阵乘法进行融合,融合之后通过Top-K选取排名较高的相关性特征,接着进行排序和平均操作进一步处理,为了突出显著性检测的区别性特征,利用合并操作来整合空间平面的特征图。(即把动态信息和静态信息结合起来)

基于自顶向下的特征融合模块说明:
在这里插入图片描述
𝑮4由部分感知相似性聚合模块产生,其产生用于显著对象检测的时间相关性的指导信息。通过卷积操作将深时间特征图与浅相邻层逐步集成,这改善了用于检测的空间显著性线索。

PACNet模型的总体流程图:
在这里插入图片描述
PACNet模型包括正监督和负监督。输入的视频帧首先通过骨干网络进行处理,然后进行视频内和视频间聚合。视频间的亲和力利用掩蔽功能和跨视频注意力的相互作用。正特征图进一步通过基于自顶向下的多层特征融合来利用。

注:本文有具体的参数设置,算法过程等,这里暂时不作总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/431610.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

博客系统测试报告【可上线】

目录 1、测试概述 1.1、项目名称 1.2、测试时间 1.3、编写目的 1.4、测试范围 2、测试计划 2.1、测试用例 2.1.1、注册/登录模块 2.1.2、个人中心模块 2.1.3、找回密码模块 2.1.4、博客主列表模块 2.1.5、个人博客列表模块 2.1.6、个人草稿列表模块 2.1.7、博客详…

Elasticsearch:位置搜索介绍

在这个互联网和信息时代,在应用程序和应用程序中启用基于位置的搜索是一个普遍的要求。 基于位置的搜索根据邻近度获取场所或地点,例如附近的餐馆、半径不超过 1 公里的待售房屋等。 我们还使用基于位置的搜索来查找前往某个地方或兴趣点的方向。 好消息…

C#代码修改设计原图psd、ai格式图层文字内容等导出bmp等,需要license 要高额付费放弃

Update text is supported only in licensed mode System.ComponentModel.LicenseException HResult0x80131901 MessageUpdate text is supported only in licensed mode SourceAspose.PSD StackTrace: at  .(Object ) at  . () at  .(Object , UInt32 )…

【C++学习】类和对象--对象特性

构造函数和析构函数 对象的初始化和清理是两个非常重要的安全问题 一个对象或变量没有初始状态,对其使用后果是未知的 使用完一个对象或变量,没有及时清理,也会造成一定的安全问题 C利用构造函数和析构函数解决上述问题,这两个函数…

牛客竞赛字符串专题 NC237664 Typewriter(SAM + 树上倍增 + 二分 + 线段树优化dp)

本题主要考察了如何用 SAM 求原串每个前缀对应的能与非后缀匹配的最长后缀,以及如何求 SAM 每个节点 right 集合的 min / max。很有价值的一道串串题。 题意: 你有一台打字机,你需要用它打出一段只由小写字母构成的文本S。 设某个时刻&#…

java数据结构刷题二期

在 MATLAB 中,有一个非常有用的函数 reshape ,它可以将一个 m x n 矩阵重塑为另一个大小不同(r x c)的新矩阵,但保留其原始数据。 给你一个由二维数组 mat 表示的 m x n 矩阵,以及两个正整数 r 和 c &…

考研数据结构--栈和队列

栈和队列 文章目录 栈和队列栈栈的定义(特点)栈的存储表示栈的基本操作栈的顺序存储方式和基本操作实现顺序栈的定义顺序栈的初始化顺序栈的判空顺序栈的判满顺序栈的进栈顺序栈的出栈取栈顶元素main函数测试 栈的链式存储方式和基本操作实现链栈的定义链…

sentiel安装与整合

(1)方案一:超时处理 设定超时时间,请求超过一定时间没有响应就返回错误信息,不会无休止等待(只能缓解,不能从根本上解决) (2)方案二:舱壁模式 限定每个业务能使用的线程数,避免耗尽整个tomcat的资源,因此也叫线程隔离。(会造成资源浪费) (3)方案三:熔断降…

不坑盒子 + 智能写作(Office、WPS插件)助你高效办公,早点下班回家。

不坑盒子简介 很多朋友在工作过程中需要对Word文档进行编辑处理,如果想让Word排版更有效率可以试试小编带来的这款不坑盒子软件,这是一个非常好用的插件工具,专门应用在Word文档中,支持Office 2010以上的版本,用户可以…

ntp时间服务器配置,ssh免密登录 rhce(22)

目录 1.配置ntp时间服务器,确保客户端主机能和服务端主机同步时间. 2.配置ssh免密登录,能够通过客户端主机通过redhat用户和服务端主机基于公钥验证方式进行远程连接 1.配置ntp时间服务器,确保客户端主机能和服务端主机同步时间. 安装时间…

(链表专题) 234. 回文链表——【Leetcode每日一题】

234. 回文链表 给你一个单链表的头节点 head ,请你判断该链表是否为回文链表。如果是,返回 true ;否则,返回 false 。 示例 1: 输入:head [1,2,2,1] 输出:true 示例 2: 输入&…

【蓝桥杯】数组中存在K倍区间的子数组个数

文章目录 前言题目分析算法难度实战1、创建算法2、创建测试用例3、运行测试用例4、测试结果 总结 前言 蓝桥杯全国软件和信息技术专业人才大赛由工业和信息化部人才交流中心主办,每年参赛人数超过30000人。蓝桥杯大赛作为国内领先的全国性 IT 学习赛事,持续有力支撑…

Python爬虫自动化从入门到精通第9天(爬虫数据的存储)

爬虫数据的存储 数据存储概述MongDB数据库的概念MongDB的安装使用PyMongo库存储到数据库 数据存储概述 通常,从网页爬取到的数据需要进行分析、处理或格式化,然后进行持久化存储,以备后续使用。数据存储主要有以下两种方式: 1&am…

启动kafka报错ERROR Fatal error during KafkaServer startup. Prepare to shutdown

一、错误 报的错: ERROR Fatal error during KafkaServer startup. Prepare to shutdown (kafka.server.KafkaServer) kafka.common.InconsistentBrokerIdException: Configured broker.id 0 doesn’t match stored broker.id Some(1) in meta.properties. If you m…

跟ChatGPT聊天、需求润色优化,禅道OpenAI 插件发布

禅道插件上新了,OpenAI 禅道集成,可提供神奇海螺聊天、需求润色功能。 神奇海螺 “章鱼哥,你为什么不问问神奇海螺呢?”——海绵宝宝 那么,就让我们问一问神奇 海螺吧!禅道上线神奇海螺功能,…

【C++】优先级队列,反向迭代器

文章目录 priority_queue的介绍和使用priority_queue的使用 反向迭代器 priority_queue的介绍和使用 优先队列是一种容器适配器,根据严格的弱排序标准,它的第一个元素总是它所包含的元素中最大的。此上下文类似于堆,在堆中可以随时插入元素&a…

数据分析之Pandas 基础入门

一、初始Pandas pandas 是数据分析三大件之一,是Python的核心分析库,它提供了快捷、灵活、明确的数据结构,它能够简单、直观、快速的处理各种类型的数据结构。 pandas 支持的数据结构如下: SQL 或Excel 类似的数据有序或无序的…

后端程序员必须学会的编辑器vim

vim编辑器使用小结 1. vim简介 Vim是一个类似于Vi的著名的功能强大、高度可定制的文本编辑器,在Vi的基础上改进和增加了很多特性。VIM是自由软件。Vim普遍被推崇为类Vi编辑器中最好的一个,事实上真正的劲敌来自Emacs的不同变体。1999 年Emacs被选为Lin…

MyBatis(十一)、MyBatis查询语句专题

准备工作: 模块名:mybatis-007-select 打包方式:jar 引入依赖:mysql驱动依赖、mybatis依赖、logback依赖、junit依赖。 引入配置文件:jdbc.properties、mybatis-config.xml、logback.xml 创建pojo类:Car 创…

SQL sever数据库----基础增删改查操作与where条件限制

where条件限制方法 在SQL sever中使用where语句,可以对各种操作添加限制条件 基础格式为 ———————— where 逻辑表达式 例如限制条件的查询 select 范围 from 表名 where 逻辑表达式 逻辑表达式就是一个判断 如 a > 5 、a6>9、a>5 and b>5 各种…