Shape-Erased Feature Learning for Visible-Infrared Person Re-Identification

news2025/1/8 5:22:06

Shape-Erased Feature Learning for Visible-Infrared Person Re-Identification(形状擦除特征学习在可见红外人物再识别中的应用)

期刊合集:最近五年,包含顶刊,顶会,学报>>网址
文章来源:CVPR 2023
代码地址:https://github.com/jiawei151/sgiel_vireid

研究背景

 由于可见光和红外图像之间存在巨大的模态差异,并且视觉模糊程度较高,因此学习不同模态之间的共享语义的概念直接用于可见-红外人物再识别是一个非常具有挑战性的问题。
 体型是VI-ReID的重要模态共享线索之一。为了挖掘更多样化的模态共享线索,我们期望在学习特征中删除与体型相关的语义概念,可以迫使模型提取更多和其他模态共享特征进行识别。为此,我们提出了在两个正交子空间中解相关模态共享特征的形状擦除特征学习范式。在一个子空间中共同学习形状相关特征和在正交补中共同学习形状擦除特征,实现了形状擦除特征与丢弃身体形状信息的身份之间的条件互信息最大化,从而显着增强了学习表征的多样性。

近年来,针对非重叠摄像机视图行人匹配的人再识别(ReID)得到了快速发展。然而,当人们出现在白天和只有红外摄像机才能清楚地捕捉到他们的外表时,ReID仍然具有挑战性,这提高了可见红外ReID (VIReID)的任务。在VI-ReID领域已经出现了许多卓有成效的工作[4,6,15,16,28,31]。在现实场景中,发现丰富多样的情态共享语义概念通常有助于提高VI-ReID语义分析的有效性。

在VI-ReID的线索中,我们可以在许多情况下通过行人的身体形状来识别行人,因为它包含了模态不变信息,并且对光线变化具有鲁棒性。然而,体型并不是解释一个人身份的唯一或充分的语义概念。在某些情况下,仅仅根据体型来区分可能很困难,但我们仍然可以通过其他语义概念来区分他们,比如他们的物品、发型或面部结构。受此启发,我们在图1中虚线左侧的V enn图中说明了可见和红外模态之间的信息理论度量。假设体型(红色表示)和身份相关的模态共享信息(虚线框表示)部分重叠。

需要注意的是部分原因还在于1 arXiv:2304.04205v1 [cs]中包含了与身份无关的信息。身体形状图,例如人体姿势。这种部分重叠的假设表明,VI-ReID的目标信息是身份相关和模态共享的,可以分为两个与体型相关和不相关的独立成分。

基于以上的观察和假设,为了挖掘更多的VI-ReID模态共享线索,我们希望能够删除特征中与体型相关的语义概念,迫使VI-ReID模型提取更多的其他模态共享特征进行识别。如图1虚线右侧所示,将形状擦除的特征与形状相关的特征去相关,同时发现与形状无关的知识,而形状相关的特征可以通过某种给定的身体形状先验来明确引导,这很容易通过现有的预训练的人类解析模型获得[17]。这样,形状相关特征和形状擦除特征都被明确量化,而这两个特征的判别性可以独立保持。

具体而言,我们提出了形状擦除特征学习范式,该范式将正交性引入表征以满足独立约束的放松。然后将该表征分解为位于两个正交子空间中的两个子表征,分别用于形状相关和形状擦除的特征学习。通过在一个子空间中学习和覆盖大多数可判别的体型特征,形状擦除特征被迫在另一个子空间中发现其他模态共享的可判别语义概念,因为形状相关特征在其正交补中受到约束。在上述假设下,我们从互信息的角度构建了这种形状擦除特征学习范式,并证明了形状擦除和形状相关目标的联合学习实现了形状擦除特征与丢弃身体形状信息的身份之间的条件互信息最大化,从而显着增强了学习表征的多样性。最后,我们设计了一个形状引导的多元特征学习框架(SGIEL),该框架共同优化形状相关目标和形状擦除目标,以学习模式共享和判别集成表示。我们的工作贡献总结如下:

作者提出了一种用于 VI-ReID 任务的形状擦除特征学习范式,该范式通过正交分解的方式将形状擦除特征与形状相关特征解相关。具体来说,在一个子空间中,形状相关的特征以身体形状先验(Body Shape Prior)为导向,而形状擦除的特征在其正交补中被约束,从而发现更多其他模态共享的判别语义概念,从而显著增强了学习表征的多样性。

基于所提出的形状擦除特征学习范式,设计了一个形状引导的多样化特征学习框架,该框架联合优化形状相关目标形状擦除目标,以学习模式共享和判别集成表示。

论文分析

网络框架

3.1、Preliminary(相关准备工作)

VI-ReID Setup

考虑随机变量X(i)和Y表示VI-ReID的数据和标签,其中i = 1表示可见模态,i = 2表示红外模态。利用X(i)和Y的观测值构建数据集D = {D(i)}2i=1,其中D(i) = {X(i) j, yj}Nij=1。每种模态的样本都是从同一组C个人中收集的,但每种模态的每个身份的样本数量可以任意。设f和g分别表示图像编码器和分类器,VI-ReID的目标是学习一个f来提取不同模态和不同相机视图下不变的表示z(i) = f(x(i))∈Rn。

Body Shape Data

我们借用[17]中提出的预训练自我校正人类解析(SCHP)模型从背景中分割出人体形状。给定图像的一个像素,我们直接将SCHP预测的头部、躯干或四肢部分的概率相加,以创建身体形状图。具体来说,对于来自数据集D的每个样本x(i),无论是可见光还是红外,我们使用SCHP生成具有相同图像大小和标签的配对体型图x(s),即D与其对应的体型数据之间的一对一映射。设fs和gs分别表示体型图编码器和分类器,x(s)的潜在表示为z(s) = fs(x(s))∈Rm, m < n。

3.2、Shape-Erased Feature Learning Paradigm(形状擦除特征学习范式)

在本节中,我们首先解释明确量化形状相关和形状擦除特征的关键独立假设,以及近似它的松弛。
基于这种松弛的独立约束,我们提出了形状擦除特征学习。

3.2.1、Independence between Z(i)sr and Z(i)se

我们首先将形状擦除特征学习范式的主要设计表述为如图2所示的图形模型。
在这里插入图片描述

假设模态共享的形状相关特征Z(i)sr 和模态共享形状擦除特征Z(i)se是彼此独立的,并且由在X(i)中提取的积分表示Z(i)导出,即Z(i)→Z(i)sr, Z(i)→Z(i)se,
在这里插入图片描述
是同时学习任意两个特征而不相互影响的必要条件。

独立表达式如下:
在这里插入图片描述
I(·;·)表示互信息,为0就是没有两者之间没有任何关系;由于互信息估计复杂且耗时,我们将独立性放宽为正交约束,表示为正交分解,得到方程(1)的松弛版为
在这里插入图片描述
式中,P∈Rn×m(m < n)为半正交矩阵,P P T构成正交投影。

这样,形状相关的特征是在子空间P中学习的,而形状删除的特征是在正交补P⊥中学习的,近似满足独立约束。

在实践中,由于P通常采用标准正态分布初始化,当n→∞时,P变成半正交矩阵的概率趋于1。为了进一步增强这种正交性,我们通过Eq.(3)对P T P与单位矩阵Im的各维差用l1范数正则化P:
在这里插入图片描述

3.2.2、Shape-Erased Feature Learning

如第1节所述,我们的目标是明确量化Z(i)sr和Z(i)se,以便Z(i)se可以在丢弃用于描述X(s)的信息时推断身份Y。这可以表示为给定体型X(s)的Z(i)se和Y之间的条件互信息最大化,即i (Z(i)se;Y | X (s)):
在这里插入图片描述
其中第一项表示Z(i)se和Y之间的互信息,第二项表示Z(i)se、Y和X(s)之间的互信息。

接着作者做了两个操作:最大化前者,最小化后者
Maximize:这里主要是通过一个最小化交的叉熵来实现
在这里插入图片描述

在这里插入图片描述

Minimize
因为I(Y;X(s))是难以处理的,我们用下面两步近似它。
在这里插入图片描述

首先,我们考虑一个要求,即X的表示Z至少可以像使用原始数据X一样描述Y。这一要求被称为充分性[1],其定义如下:

定义1(充分性)。当且仅当下列条件时,X的表示Z对Y是充分的:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
其次,我们希望与形状相关的特征Z(i)sr能够完全代表真实的体型特征Z(s);

在这里插入图片描述

为了使Z(i)sr完全表示Z(s),由于Z(i)sr和Z(s)之间存在一对一的映射,我们最大化i (Z(i)sr;Z(s))通过最小化元素均方误差(MSE)来引导Z(i)sr模仿Z(s)如Eq. (9),

在这里插入图片描述
式中∥·∥2为l2范数。
此外,为了减少X(i)的Z(i)sr与X(s)的Z(s)之间的横视差异,我们的目标是最小化以下条件互信息i (X(i);老Z (i) | X (s)):
在这里插入图片描述
表示给定X(s)视图下Z(i)sr中的剩余信息。

3.3、Overall Framework( )

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

总结

在这里插入图片描述

假设体型信息和身份相关的模态共享信息(虚线框表示)部分重叠。为了使提取的特征更加多样化,我们提出了形状擦除特征学习范式,将表征分解为形状相关特征和形状擦除特征。

学习形状擦除特征驱动模型发现除身体形状之外更丰富的模态共享语义概念。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/616646.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Lecture 10 Distributional Semantics

目录 Problems of Lexical Database 词汇数据库的问题分布假设根据上下文猜测单词含义Word vectors 词向量词嵌入Count-based Word Vectors 基于计数的方法Document as Context: The Vector Space Model 向量空间模型TF-IDFDimensionality Reduction 降维 Words as Context 单词…

跨数据中心高可用架构设计

前言 随着常年的码代码&#xff0c;做设计&#xff0c;笔者做过基础编码&#xff0c;云计算平台&#xff0c;架构师&#xff0c;见过不少应用设计&#xff0c;系统设计&#xff0c;中间件&#xff0c;了解现有的技术体系发展模式&#xff0c;集中式->分布式&#xff1b;cap…

阿里8年,肝到P7只剩这份笔记了,已助朋友拿到15个Offer....

时光飞逝&#xff0c;转眼间在阿里工作了8年&#xff0c;工作压力大&#xff0c;节奏快&#xff0c;但是从技术上确实得到了成长&#xff0c;尤其是当你维护与大促相关的系统的时候&#xff0c;熬到P7也费了不少心思 我的职业生涯开始和大多数测试人一样&#xff0c;刚开始接触…

Redis进阶:分布式锁问题

分布式锁问题 1. 分布式锁问题1.1 问题介绍1.2 解决方案1.2.1 分布式锁主流的实现方案1.2.2 使用Redis实现分布式锁1.2.3 分布式锁需要满足的四个条件 1.3 实现分布式锁 1. 分布式锁问题 1.1 问题介绍 单机单体中的锁机制在分布式集群系统中失效&#xff1b;单纯的Java API并…

Linux快速安装MySQL

文章目录 Linux上安装MySQL1. 安装MySQL1&#xff09;上传MySQL安装包以及MySQL驱动jar包2&#xff09;解压MySQL安装包3&#xff09;卸载系统自带的mariadb4&#xff09;安装MySQL依赖5&#xff09;安装mysql-client6&#xff09;安装mysql-server7&#xff09;启动MySQL8&…

案例27:基于Java宠物领养系统开题报告设计

博主介绍&#xff1a;✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专…

性能测试之Docker监控

相信很多程序员在进行性能测试时常常会遇到一些问题&#xff0c;比如如何监控Docker容器的运行状态。这时候&#xff0c;Docker监控工具就派上了用场。 我曾经也遇到过这样的问题&#xff0c;不知道如何获取Docker容器的性能数据&#xff0c;直到我发现了Docker监控工具。使用…

干货分享 | TSMaster小功能之实时注释在图形中的使用技巧

今天给大家介绍TSMaster功能之实时注释在图形中的使用技巧&#xff0c;主要通过手动注释、自动化注释、实时注释在记录与回放中的运用等三方面来进行介绍。 一、实时注释的作用 在了解实时注释的使用技巧之前&#xff0c;我们先了解一下实时注释是什么以及它的作用。 实时注释…

算法修炼之筑基篇——筑基二层初期(解决最长回文子串问题,马拉车(manacher)算法模板)

✨博主&#xff1a;命运之光 &#x1f984;专栏&#xff1a;算法修炼之练气篇 &#x1f353;专栏&#xff1a;算法修炼之筑基篇 ✨博主的其他文章&#xff1a;点击进入博主的主页 前言&#xff1a;学习了算法修炼之练气篇想必各位蒟蒻们的基础已经非常的扎实了&#xff0c;下来…

SpringCloud服务注册中心

SpringCloud 服务注册中心 1.Eureka基础知识 什么是服务治理? Spring Cloud 封装了 Netflix 公司开发的 Eureka 模块来实现服务治理 在传统的rpc远程调用框架中,管理每个服务与服务之间依赖关系比较复杂,管理比较复杂,所以需要使用服务治理,管理服务与服务之间的依赖关系,…

数据库的增删改查(三)

1、查询 1.1、聚合查询 1.1.1、聚合函数 数据库提供了很多函数&#xff0c;其中就包括聚合函数&#xff0c;常见的聚合函数如下表 函数说明COUNT([IDDINCT] expr)返回查询到的数据的数量SUM([DISTINCT] expr)返回查询到的数据的总和&#xff0c;不是数字没有意义AVG([IDSTI…

一篇长文教你进行全方位的使用appium

随着移动应用的日益普及&#xff0c;移动应用的测试成为了软件开发的重要组成部分。Python&#xff0c;作为一种易于学习&#xff0c;功能强大的编程语言&#xff0c;特别适合进行这种测试。本文将详细介绍如何使用Python进行APP测试&#xff0c;并附带一个实例。 Python 和 Ap…

CVE漏洞复现-CVE-2021-2109 Weblogic Server远程代码执行

CVE-2021-2109 Weblogic Server远程代码执行 漏洞背景 2021年1月20日&#xff0c;Oracle官方发布了漏洞补丁&#xff0c;修了包括 CVE-2021-2109 Weblogic Server远程代码执行漏洞在内的多个高危严重漏洞。CVE-2021-2109 中&#xff0c;攻击者可构造恶意请求&#xff0c;造成J…

多媒体库SDL以及实时音视频库WebRTC中的多线程问题实战详解

目录 1、概述 2、开源跨平台多媒体库SDL介绍 3、开源音视频实时通信库WebRTC介绍 4、在国产化Linux桌面系统中遇到的SDL多线程问题 5、在给WebRTC新增外部音频插件库时遇到的多线程问题 6、最后 VC常用功能开发汇总&#xff08;专栏文章列表&#xff0c;欢迎订阅&#xf…

【云原生】创建容器的方法

1&#xff09;基于现有镜像的创建 先使用现有镜像创建容器 docker run 再进入容器进行内容更新 docker exec 最后提交成新的镜像 docker commit 2&#xff09;基于模板创建 可以从本地容器导出模板文件 docker export 或者从网上下载现成的模板文件 http://openvz…

C++继承相关内容(二)

目录 一.拷贝构造函数 第一种情况&#xff1a;基类没有拷贝构造函数&#xff0c;派生类也没有拷贝构造函数 结果&#xff1a; 原因&#xff1a; 第二种情况&#xff1a;基类没有拷贝构造函数&#xff0c;派生类有拷贝构造函数 结果&#xff1a; 原因&#xff1a; 第三种情况…

【文生图系列】 Stable Diffusion v2复现教程

文章目录 xformersbug 记录 txt2imgdiffusers参考 基础环境承接Stable Diffusion v1, 详情请见我的博文【文生图系列】 Stable Diffusion v1复现教程。然后更新pytorch和torchvision的版本&#xff0c;因为要使用GPU和xformers&#xff0c;需要下载gpu版本的pytorch。再下载ope…

学习笔记之微服务(一)

一、了解微服务 1、服务架构演变 **单体架构&#xff1a;**所有业务功能都集中在一个项目中开发&#xff0c;打成一个包部署。 优点&#xff1a;架构简单、部署成本低 缺点&#xff1a;耦合度高 分布式架构&#xff1a;根据业务拆分系统功能&#xff0c;每个业务模块独立项…

微信小程序map 之个性化地图(日出日落主题)

微信小程序map 之个性化地图&#xff08;日出日落主题&#xff09; 个性化地图之根据日出日落时间动态变换地图主题个性化前的准备进入腾讯地址服务官网小程序开发html 代码. layer-style 编号为样式名称js代码. 注意的是&#xff0c;layer-style只能定义一次&#xff0c;所以值…

Yarn【常用命令】

1、yarn application 查看Application运行情况 1.1、列出所有Application yarn application -list 可以通过Web UI端来查看&#xff1a; 1.2、根据Application状态过滤&#xff1a; yarn application -list -appStates &#xff08;所有状态&#xff1a; ALL 、 NEW 、 NEW…