Cross-Modality Person Re-identification with Memory-Based Contrastive Embedding

news2025/1/24 22:30:10

文章目录

    • 题目:Cross-Modality Person Re-identification with Memory-Based Contrastive Embedding(基于记忆对比嵌入的跨模态人物再识别)
    • 摘要
    • 论文分析
      • 网络框架
      • 1、Problem Definition(模态预处理)
      • 2、Learning Modality-Aware and Modality-Agnostic Proxies(学习模态感知和模态不可知代理)
      • 3、Cross-Modality Mutual Information(模态互消息)
      • 4、Global Modality-Agnostic Cluster Contrast(全局模态不可知聚类对比)
      • 5、Overall Objective Function
    • 实验结果

题目:Cross-Modality Person Re-identification with Memory-Based Contrastive Embedding(基于记忆对比嵌入的跨模态人物再识别)

期刊合集:最近五年,包含顶刊,顶会,学报>>网址

摘要

 由于模态之间存在差异,VI-ReID 变得更具挑战性,即阶层间的混乱(模态之间)和阶层内的变化(如姿势、视点、光照、背景聚类、遮挡等)。作者提出 基于聚合记忆的跨模态深度度量学习 框架,该框架受益于越来越多的学习模态感知和模态不可知的质心代理,用于聚类对比和互信息学习。此外,为了抑制模态差异,同时利用历史和最新学习的聚类代理来增强跨模态关联。这种训练机制通过增加学习到的聚类代理的多样性来获得硬正参考,最终实现跨模态图像特征之间更强的“拉紧”效果。

论文分析

网络框架

在这里插入图片描述

1、Problem Definition(模态预处理)

这都是常规操作:① 在这里插入图片描述 代表可见光和红外模态的图像,在这里插入图片描述 表示可见和红外全部图像数,在这里插入图片描述 对应相应的真实标签(ground-truth)。

  任务: 给定某一模态的查询人物图像,跨模态人物ReID任务的目的是根据学习到的图像特征相似度,检索具有相同身份的另一模态的行人图像。

在这里插入图片描述作为对应可见光图像的第 i 个提取特征。

  CNN 架构由基于记忆的模态感知和模态不可知聚类对比目标、跨模态互信息约束和全局模态不可知聚类对比目标共同优化。

③ 文章还利用通道增强策略进行数据增强,通过随机 交换可见光 图像的颜色通道生成新的辅助模态(看这篇文章: Channel augmented joint learning for visible-infrared recognition),记作 在这里插入图片描述在这里插入图片描述
对应的特征向量记为 在这里插入图片描述,与可见光图像特征向量保持维度一致。

2、Learning Modality-Aware and Modality-Agnostic Proxies(学习模态感知和模态不可知代理)

 基于 vallina 记忆的聚类对比学习(Cluster contrast for unsupervised person re-identification),最重要的组成部分是基于聚类的记忆库,其中每个聚类由平均特征向量 W m (也表示为聚类中心) 表示,所有聚类特征向量都基于单个特征更新。第 k 类的聚类质心初始化如下:

在这里插入图片描述
对 RGB 模态的聚类存储库 W m ∈ R d×N p 进行初始化,提取每个聚类的特征向量均值,其中 d 和 N p 分别表示特征维数和身份/聚类个数。在这里插入图片描述 表示 RGB 特征空间中属于第 k 类的训练图像的子集,|·| 表示聚类集中的实例数。在模型训练过程中,使用相应的聚类特征向量更新存储在记忆库中的聚类质心。

然后,基于记忆库的聚类对比学习可以导出,它也是一个分类器。
在这里插入图片描述

在这里插入图片描述
同样得到 红外损失,数据增强模态的损失,
最终损失合在一起:
在这里插入图片描述

3、Cross-Modality Mutual Information(模态互消息)

 为增强模态关联,同时抑制模态差异,作者提出跨模态互信息约束。前一阶段已经分别学习了每个模态的单位质心。也就是说,存储在记忆库中的质心只从它们对应的模态中学习知识。因此,给定一个行人图像特征 (记为f),无论它属于哪个模态,如果它在不同模态中相对最近的质心对应相同的同一性,则意味着模型提取了模态共享的图像特征,消除了模态的差异。

基于学习到的不同模态的图像质心,将得到的图像特征 在这里插入图片描述 转化为概率形式。

在基于记忆的聚类对比学习中,观察到可以从历史学习的聚类质心中获益更多。由于一些历史聚类质心相对于记忆库中最新动态学习的质心距离模态/身份边界较远,这可能导致对对应模态分布的 “拉近” 效应增强。因此,使用前一个 epoch 结束时学习到的质心作为分类器,从而使下一个训练 epoch 的质心参数始终保持固定。

RGB 模态的质心 在这里插入图片描述,输入特征 在这里插入图片描述 在聚类质心下的概率表示:

在这里插入图片描述

相应的,下面也成立。

在这里插入图片描述

 这里作者做了前提条件,历史聚类质心参数与存储在最新内存库中的质心是不同的,尽管它们都可以代表恒等式的聚类中心。历史聚类质心 C = {Cv, Cr, Ca, Cu} 通过其自身模态空间中同一 同一性内的特征向量的均值计算,其中特征向量由前一个训练历元结束时获得的模型提取。通过 Kullback-Leibler 散度计算,RGB 模态和 IR 模态之间的概率,
在这里插入图片描述

显然,该目标函数鼓励 RGB 模态中的输入特征向量 在这里插入图片描述 在其原始 RGB 模态质心和 IR 模态质心上都具有一致性的概率,而另一 IR 模态中的输入特征则相反。通过这种方式,可以鼓励模型在不同模态之间学习知识,并进一步学习与模态无关的特征。

辅助模态数据是通过通道增强策略由相应的 RGB 模态数据生成的,同样需要建立辅助模态与 IR 模态之间的互信息约束,抑制模态差异。
整体的跨模态互信息约束如下:
在这里插入图片描述

4、Global Modality-Agnostic Cluster Contrast(全局模态不可知聚类对比)

 为进一步抑制模态差异,在已学习的历史模态不可知聚类质心 C u 的基础上,提出了全局模态不可知聚类对比学习。目标函数可表示为:
在这里插入图片描述
在这里插入图片描述 是习得的历史模态不可知的聚类质心。在这里插入图片描述 为特征 在这里插入图片描述 对应的正质心,α 是正距离和最小负距离之间的最小裕度参数。通过最小化上述损失函数,可以以整体模态不可知的方式抑制模态差异。

5、Overall Objective Function

 提出的方法结合模式感知和模式不可知,以及历史和最新的基于记忆的聚类对比学习,以实现有效的特征级模式对齐。

在这里插入图片描述

实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1988703.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RUM技术探索:前端监控数据采集与实践

​​随着互联网技术的不断演进,Web应用程序正日益呈现出复杂多变与高度动态性的特征。用户渴望获得快速的页面加载、流畅的交互体验以及高度的可靠性。为了满足这些,实时监控 Web 应用的性能和行为变得至关重要。前端监控让开发者能够深入了解应用的表现…

Hack The Box-Resource

总体思路 phar反序列化->SSH CA私钥泄露->SSH CA私钥滥用->SSH脚本滥用 信息收集&端口利用 nmap -sSVC itrc.ssg.htb目标开放了两个ssh端口和一个80端口,先查看80端口 网站是一个SSG IT资源中心,主要用于解决网站问题、管理 SSH 访问、清…

免费【2024】springboot 付费自习室管理系统的设计与实现

博主介绍:✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围:SpringBoot、Vue、SSM、HTML、Jsp、PHP、Nodejs、Python、爬虫、数据可视化…

正点原子imx6ull-mini-Linux驱动之Linux 音频驱动实验

虽然mini板子没有这个资源,但是可以学学移植这个软件。 音频是我们最常用到的功能,音频也是 linux 和安卓的重点应用场合。I.MX6ULL 带有 SAI 接口,正点原子的 I.MX6ULL ALPHA 开发板通过此接口外接了一个 WM8960 音频 DAC 芯片,…

《程序猿入职必会(10) · SpringBoot3 整合 MyBatis-Plus》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

使用samba在ubuntu和windows之间共享文件

1、在ubuntu上安装samba 在终端输入命令 sudo apt update sudo apt install samba 2、配置samba 打开samba 的配置文件 sudo nano /etc/samba/smb.conf 在文件末尾添加以下内容 [shared] path /home/lzx available yes valid users lzx read only no browsable yes…

【Redis进阶】Redis的持久化RDB和AOF

目录 持久化 RDB持久化 概念 原理 RDB 持久化的详细工作流程 1触发持久化: 2创建子进程: 3数据写入 RDB 文件: 4替换旧文件: 5回收子进程: RDB持久化的触发方式 1.手动触发: 2.自动触发&#…

鸿蒙应用服务开发【获取天气数据】

获取天气数据 介绍 Weather Service Kit(天气服务)是鸿蒙生态下的一个数据提供服务, Weather Service Kit融合了多家气象行业TOPs供应商,提供专业、精准、稳定的超本地化天气数据服务, 开发者可以通过Weather Servic…

Tomcat 漏洞

1.CVE-2017-12615 抓包,将get改为put jsp文件后加/ 访问木马使用蚁剑连接 2.弱口令 点击后输入默认用户名、密码:tomcat/tomcat 登录成功,在文件上传位置上传war包 使用哥斯拉生成一个jsp木马,打包,改后缀为war,上传…

如何有效防御短信接口遭受恶意攻击?

短信接口若遭遇恶意攻击,不仅加剧企业运营成本,更将严重损害企业形象。为有效预防此类风险,以下策略值得采纳: 1.设定合理的发送间隔:针对同一手机号码,设定合理的重复发送短信时间间隔,建议范…

Unity动态修改按钮点击效果

动态修改按钮色块,达到保留选中效果。 using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.UI;public class Demo: MonoBehaviour {private Button _frontBtn;private Button _backBtn;public ColorBlock NormalC…

【React】深入解析ref的使用与潜在问题

文章目录 一、ref的基本用法二、常见错误解析三、实例解析四、错误分析与解决五、注意事项六、总结 在React开发中,ref常用于访问DOM元素或组件实例。正确使用ref可以极大地提升用户体验,特别是在需要与DOM交互的场景中。然而,错误或不当的re…

奥运会Ⅷ--生成式人工智能的力量倍增器

生成式人工智能在商业领域的崭新时代 随着 OpenAI 的ChatGPT、Anthropic 的Claude和 Google 的Bard的推出,大规模文本分析和自然语言处理 (NLP) 的长期梦想瞬间成为现实。AI 不仅令人信服地通过了图灵测试,还催化了企业战略的范式转变。突然之间&#x…

8.5 day bug

bug1 没有适当的引号,引言就不是真正的引言 问了通义,原来用引言需要使用单引号括起来 bug2 没理解题意,挺好一网站可惜是英文的,顺便帮翻译还没反馈渠道帮… 问了通义,原来是要改变continueLoop的值 bug3 好家伙&a…

ts-node报错ERR_UNKNOWN_FILE_EXTENSION

问题 有个monorepo项目,在最外层一次性打包 3 个项目的脚本已经成功实现,如下: "build:test": "cross-env NODE_ENVtest vite build --mode test && esno ./build/script/postBuild.ts", "build:prod"…

一行代码实现图片懒加载?分享 1 段优质 HTML 代码片段!

本内容首发于工粽号:程序员大澈,每日分享一段优质代码片段,欢迎关注和投稿! 大家好,我是大澈! 本文约 700 字,整篇阅读约需 1 分钟。 今天分享一段优质 HTML 代码片段,只需一行代码…

MBD软件开发之数据管理

模块化开发中,模型集成和代码集成是很多工程师非常关心的问题。 常见的代码集成方式有两种,一是单元级模型上生成代码,在代码上做集成,一是模型集成之后,再去生成集成级别的代码。无论采用哪种方式,模型级…

网络端口转发

一. 如图网络拓扑 光猫改桥接之前光猫自身也会有一层局域网,光猫ip为局域网额的192.168.1.1 当改桥接之后,只有一层路由器的局域网,路由器为局域网的192.168.31.1 此时从公网对内网进行访问时,先访问到路由器的公网ip的某个端口…

从零开始搭建监控系统 (二)

从零开始搭建监控系统 (二) 监控系统架构 部署 文件目录 rootchuango:/opt/prometheus# tree -L 1 . ├── docker-compose.yml ├── grafana_data ├── grafana.ini ├── prometheus_data └── prometheus.yml # grafana_data, prometheus_data 2个文件为空目录do…