论文阅读——Co-Salient Object Detection with Co-Representation Purification

news2025/1/11 18:31:30

目录

  • 基本信息
  • 标题
  • 摘要
  • 引言
  • 方法
    • PCS
    • RPP
  • 实验

基本信息

期刊IEEE TPAMI
年份2023
论文地址https://arxiv.org/pdf/2303.07670.pdf
代码地址https://github.com/ZZY816/CoRP

标题

具有共同表示净化的共同显著目标检测

摘要

共同显著目标检测(Co-SOD)旨在发现相关图像组中的共同对象。挖掘共同表示对于定位共同显著目标至关重要。然而,当前的Co-SOD方法并未充分关注与共同显著对象无关的信息是否包含在共同表示中。共同表示中的此类不相关信息会干扰其定位共同显著对象。在本文中,我们提出了一种旨在寻找无噪声共同表示的共同表示净化(CoRP)方法。我们搜索可能属于共同显著区域的一些像素级嵌入。这些嵌入构成我们的共同表示并指导我们的预测。为了获得更纯净的共同表示,我们使用预测来迭代减少共同表示中的不相关嵌入。对三个数据集的实验证明,我们的CoRP在基准数据集上实现了最先进的性能。

引言

人类感知系统可以轻松地发现最显著的区域。共同显著目标检测(Co-SOD)旨在从一组相关的图像中发现共同显著的对象。同时,Co-SOD需要处理在训练过程中未学习的未知对象类别。这种能力可以作为许多现实世界应用的预处理步骤,例如视频共定位、语义分割、图像质量评估和弱监督学习。Co-SOD任务的难点在于在混乱的现实世界环境中发现共同显著的对象。如图1所示,自动发现和分割多个不相关显著对象中的共同显著对象“香蕉”是具有挑战性的。
在这里插入图片描述
(a) "•"代表共同显著对象“香蕉”的嵌入。我们观察到嵌入(在蓝色圆圈区域内)非常接近中心,很可能属于共同显著对象。我们将它们用作我们的共同表示,以定位共同显著对象。 (b) 当我们的初步预测滤除了许多不相关对象的嵌入时,我们可以获得一个新的中心,不受不相关嵌入的干扰。这个新的中心有助于搜索更纯净的共同表示,从而实现更准确的预测

为了区分共同显著对象,大多数最先进的方法(SOTA)直接估计一个共同表示,以捕捉共同显著对象的共享特征,通过特征聚合、聚类、主成分分析、全局池化等方法。这些方法的共同表示是从所有区域汇总的,或者是在预测的显著区域内总结的。尽管在许多场景中取得了令人满意的性能,但它们通常忽略了与不相关的显著对象相关的噪声信息。

利用带噪声的共同表示可能导致共同显著对象的不正确定位,限制了Co-SOD模型的性能,特别是对于复杂的现实世界场景。为了克服这一瓶颈,我们尝试减少共同表示中的不相关信息。与当前的方法不同,后者通过总结所有区域或显著区域来直接获得共同表示,我们提出了一个迭代过程,只搜索属于共同显著区域的自信位置作为我们的共同表示,这将引导共同显著对象的完整分割。

具体而言,我们首先提出纯共同表示搜索(PCS)来找到属于共同显著区域的自信嵌入,作为我们的共同表示。如图1所示,在所有显著对象的像素嵌入中,由于图像组中共同显著对象的重复性,共同显著对象的嵌入占主导地位。当通过总结所有显著区域的嵌入来获得中心时,我们发现靠近中心的嵌入更有可能属于共同显著对象。基于这一观察,我们不直接使用不完美的中心来检测共同显著对象,而是将中心视为用于索引与其高度相关的嵌入的代理共同表示。与从所有显著区域总结的代理共同表示相比,我们的共同表示由自信的共同显著嵌入组成,受到不相关噪声的干扰较少。

在这里插入图片描述

图2. 我们CoRP的总体框架。 “PCS” 和 “RPP” 分别表示提出的纯共同表示搜索(第3.2节)和递归代理净化(第3.3节)。如上所示,当接收一组图像时,首先通过共享骨干的显著性目标检测(SOD)头部来预测相应的显著性图。通过显著性图过滤背景噪声生成共同表示代理。借助代理的帮助,PCS搜索纯共同表示,指导共同显著性预测。RPP反馈共同显著性图以计算新的代理,有助于搜索更纯净的共同表示。在PCS和RPP的协作下,预测中的噪声被迭代地去除。为了简洁起见,我们没有绘制我们的编码器-解码器架构和SOD头部,这些部分与Co-SOD网络共享骨干参数。

考虑到来自PCS的索引共同表示仍然包含不相关的嵌入,我们提出了递归代理净化(RPP),使用预测的共同显著性图来迭代净化共同表示。在获得共同显著性图的预测之后,我们使用预测来过滤更多的噪声并获取一个新的代理。新的代理有助于PCS搜索更少噪声的共同表示,以实现更准确的预测。我们迭代地执行上述过程来净化我们的共同表示。在PCS和RPP的交替工作下,我们的共同表示中的不相关嵌入逐渐减少。也就是说,迭代过程使我们的表示变得越来越纯净。在下面的章节中,我们简称我们的方法为CoRP(共同表示净化)。总之,我们的主要贡献如下
我们提出了两种净化策略:(i)PCS用于挖掘无噪声的共同表示,和(ii)RPP用于基于先前的共同显著性图迭代减少噪声。
CoRP在具有挑战性的数据集CoCA、CoSOD3k和CoSal2015上实现了最先进的性能。

方法

PCS

PCS策略旨在通过找到多个与目标共同表示的纯代理来提高Co-SOD网络的性能。具体而言,PCS方法通过以下步骤来生成纯代理:

  1. 使用预训练的VGG16网络作为特征提取器,提取输入图像的特征。
  2. 使用一个大小为K的矩阵K Embeddings来表示每个纯代理。K Embeddings中的每个元素都与输入图像中的一个元素对应。
  3. 对于每个纯代理,使用基于随机森林的分类器预测其所属的类别。
  4. 使用SOD(Single Salient Object Detection)网络在预测类别的基础上,提取对应的纯代理。
  5. 对提取到的纯代理进行排序,并记录下它们的IoU(Intersection over Union)分数。
  6. 使用IoU分数来筛选出前K个最具相关性的纯代理。
  7. 将前K个纯代理拼接在一起,生成一个长度为K的向量,作为纯代理的最终表示。

RPP

RPP策略旨在通过迭代去除与目标共同表示的代理,从而提高Co-SOD网络的性能。具体而言,RPP方法通过以下步骤来生成纯代理:

  1. 使用预训练的VGG16网络作为特征提取器,提取输入图像的特征。
  2. 使用一个大小为K的矩阵K Embeddings来表示每个纯代理。K Embeddings中的每个元素都与输入图像中的一个元素对应。
  3. 对于每个纯代理,使用基于随机森林的分类器预测其所属的类别。
  4. 使用SOD(Single Salient Object Detection)网络在预测类别的基础上,提取对应的纯代理。
  5. 在每次迭代中,使用前一时刻的纯代理生成新的纯代理。具体而言,对于每个新纯代理,使用基于随机森林的分类器预测其所属的类别。
  6. 如果新纯代理与前一时刻的纯代理IoU分数差异较大,或者新纯代理的IoU分数低于某一阈值,则将其从内存中移除。
  7. 经过若干次迭代后,得到一个纯代理序列,该序列代表了输入图像中与目标共同表示的所有纯代理。
  8. 使用IoU分数来筛选出前K个最具相关性的纯代理。
  9. 将前K个纯代理拼接在一起,生成一个长度为K的向量,作为纯代理的最终表示。

实验

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/984457.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java使用GraalVM Native Image打包可执行程序

GraalVM Native Image 技术可提前将 Java 代码编译为自包含的可执行文件。只有应用程序运行时所需的代码才会添加到可执行文件中。 也就是说打包体积会很小,不需要考虑设备有没有java环境,也不需要带着笨重的 jre 了 安装过程有很多的坑,愿你…

《Web安全基础》04. 文件操作安全

web 1:文件操作安全2:文件上传漏洞2.1:简介2.2:防护与绕过2.3:WAF 绕过2.3.1:数据溢出2.3.2:符号变异2.3.3:数据截断2.3.4:重复数据 3:文件包含漏洞4&#xf…

Java EE企业级开发学习 -- day1

什么是Java EE? 它是基于Java语言的一种软件设计体系结构,它是一种标准中间件体系结构。它的作用在于能标准化企业级多层结构应用系统的部署,并且简化开发环境。 具体环境的搭建 1.下载压缩包于安装包 jdk-8u261-windows-x64 eclipse-jee-2018-12-…

Navicat15工具连接PostgreSQL15失败

1.错误现象及原因 错误现象: 错误原因: postgresql 15版本中 pg_database 系统表把 datlastsysoid 列删除了,所以造成了此错误。 2.解决方法 (1)将Navicat工具更新到官网最新版本。 (2)更换…

如何使用CSS画一个三角形

原理&#xff1a;其实就是规定元素的四个边框颜色及边框宽度&#xff0c;将元素宽高设置为0。如果要哪个方向的三角形&#xff0c;将对应其他三个方向的边框宽和颜色设置为0和透明transparent即可 1.元素设置边框&#xff0c;宽高&#xff0c;背景色 <style>.border {w…

STL vector

文章目录 一、vector 类的模拟实现 vector 是一个动态增长的数组&#xff0c;可以存储任意类型 模板参数 T 表示存储元素的类型&#xff0c;Alloc 是空间配置器&#xff0c;一般不用传 vector 的接口使用和 string 类似&#xff0c;参考 string 一、vector 类的模拟实现 vec…

Facebook 已删除 276.7 亿虚假账户,大量真实用户被“误伤”

据Cyber News消息&#xff0c;正有数以千计的用户在X&#xff08;Twitter&#xff09;及其他平台上表达对Facebook的不满&#xff0c;因为该平台在打击虚假账户时对他们的正常账户进行了“误伤”。 自 2017 年 10 月以来&#xff0c;Facebook 已删除了 276.7 亿个虚假账户&…

函数相关概念

4.函数 1.函数的概念 1.什么是函数? 把特点的代码片段,抽取成为独立运行的实体 2.使用函数的好处1.重复使用,提供效率2.提高代码的可读性3.有利用程序的维护 3.函数的分类1.内置函数(系统函数)已经提高的alert(); prompt();confirm();print()document.write(),console.log()…

实训三:多表查询 - 大学数据库创建与查询实战

大学数据库创建与查询实战 第1关&#xff1a;数据库表设计任务描述相关知识大学数据库的整体设计教师信息表&#xff08;instructor&#xff09;开课信息表&#xff08;section&#xff09; 编程要求测试说明参考代码 第2关&#xff1a;查询&#xff08;一&#xff09;任务描述…

【javaweb】学习日记Day10 - tlias智能管理系统 - 部门、员工管理功能开发

目录 一、建立项目的基本操作步骤 二、前期搭建环境 1、创建springboot工程 ​2、引入对应依赖 3、对建立好的框架进行调试 &#xff08;1&#xff09;pom.xml没有显示蓝色怎么解决&#xff1f; &#xff08;2&#xff09; 启动类为橙红色java文件怎么办&#xff1f; 4…

OSS专栏------文件上传(一)

目录 1、简单上传1.1、流式上传1.1.1、上传字符串1.1.1.1、代码示例1.1.1.2、执行结果 1.1.2、上传Byte数组1.1.2.1、代码示例1.1.2.2、执行结果 1.1.3、上传网络流1.1.3.1、代码示例1.1.3.2、执行结果 1.1.4、上传文件流1.1.4.1、代码示例1.1.4.2、执行结果 1.2、文件上传1.2.…

申威芯片UOS中opencv DNN推理

Cmake&#xff0c;opencv&#xff0c;opencv-contribute安装 #apt可能需要更新apt update apt install -y wget unzip apt-get install build-essential libgtk2.0-dev libgtk-3-dev libavcodec-dev libavformat-dev libjpeg-dev libswscale-dev libtiff5-dev#安装cmake apt i…

【OceanBase概念】国产数据库OceanBase的那些事儿(1)初识OceanBase

文章目录 写在前面涉及知识点1、OceanBase是什么&#xff1f;1.1基本概念1.2发展历史 2、TPC-C认证2.1什么是TPCC2.2OceanBase认证成果 3、OceanBase应用场景3.1行业应用A、金融行业B、电信运营行业C、保险行业D、初创互联网行业 3.2内部应用A、支付宝B、淘宝C、网商银行D、Pay…

草图大师SketchUp Pro 2023 for Mac

SketchUp Pro 2023 for Mac&#xff08;草图大师&#xff09;是一款专业的三维建模软件&#xff0c;由Trimble Inc.开发。它可以用于创建、修改和分享3D模型&#xff0c;包括建筑、家具、景观等。 SketchUp Pro 2023 for Mac提供了简单易学的用户界面和强大的工具集&#xff0…

【数据恢复】.360勒索病毒|金蝶、用友、OA、ERP等软件数据库恢复

引言&#xff1a; 在当今数字化的时代&#xff0c;网络犯罪已经演变成了一场全球性的威胁&#xff0c;而 360 勒索病毒则是其中最为可怕和具有破坏性的威胁之一。这种恶意软件以其危害深远、难以防范的特点而令人震惊。本文91数据恢复将深入探讨 360 勒索病毒的可怕性&#xff…

Navicat连接mysql8.0:提示无法加载身份验证插件“caching_sha2_password”

Navicat连接mysql时&#xff0c;提示&#xff1a;Unable to load authentication plugin ‘caching_sha2_password‘. 原因&#xff1a;mysql 8.0 默认使用 caching_sha2_password 身份验证机制。 D:\MySQL8.0\install\bin>mysql -uroot -p123456789 #登录 mysql: [War…

【Redis】Redis 通用命令、键的过期策略

文章目录 一、基础命令SET 和 GET 二、全局命令KEYSEXISTSDELEXPIRE 和 TTL经典面试题&#xff1a;Redis 中 key 的过期策略是怎么实现的TYPE Redis 有许多种数据结构&#xff0c;但是这些数据结构的 key 的类型都是字符串类型的&#xff08;所以说&#xff0c;Redis 不同的数据…

vue插槽slot

插槽有三种&#xff1a; 目录 1.普通插槽 2.具名插槽 3.作用域插槽 1.普通插槽 sub.vue 子组件 --- 子组件写slot标签&#xff0c;父组件的Sub标签内填写的内容会显示在slot的位置&#xff0c;父组件如果不写内容就会展示默认内容。 <template><div class"…

智慧物流发展的重要推动力量:北斗卫星导航系统

随着经济的快速发展和电商的普及&#xff0c;物流行业的规模不断扩大&#xff0c;对物流运输的效率和安全性也提出了更高的要求。传统的物流运输方式存在着效率低下、信息不对称、安全隐患等问题&#xff0c;因此发展智慧物流已经成为物流行业的必然趋势。智慧物流可以通过先进…

软文发稿平台那么多,为什么选择媒介盒子

近年来随着互联网技术的发展&#xff0c;越来越多的企业开始注重软文营销&#xff0c;品牌软文推广对企业来说是至关重要的&#xff0c;也有许多企业选择和软文发稿平台合作来增强品牌曝光&#xff0c;提升宣传效果&#xff0c;那么为什么会有这么多企业选择媒介盒子合作呢&…