【CVPR2024】ReID3D:首个使用激光雷达行人充实别 ReID 的工作!

news2024/11/16 16:47:08

【2024 行人重识别最新进展】ReID3D:首个关注激光雷达行人 ReID 的工作!

  • 摘要:
  • 数据集:
  • 方法模型:
    • 多任务预训练:
    • ReID Network:
  • 实验结果:
  • 结论:

来源:Arxiv 2023
机构:清华大学 & 北京理工大学
论文题目:LiDAR-based Person Re-identification

本文是首个基于激光雷达的人ReID的工作,展示了在具有挑战现实世界的户外场景中,利用激光雷达进行的行人 ReID 的实用性!

论文链接:https://arxiv.org/abs/2312.03033

开源代码:https://github.com/GWxuan/ReID3D

摘要:

基于摄像头的重识别(ReID)系统在公共安全领域得到了广泛的应用。然而,摄像机往往缺乏对人类三维形态信息的感知,并且容易受到各种限制,如照明不足、背景复杂和个人隐私,如图:
在这里插入图片描述

在本文中,我们提出了一种基于激光雷达的 ReID 框架,ReID3D,该框架利用预训练策略来检索三维体型的特征,并引入了基于图的互补增强编码器来提取综合特征。由于缺乏激光雷达数据集,我们构建了第一个基于 LiDAR 的行人 ReID 数据集 LReID,该数据集在几个自然条件变化的室外场景中收集。

此外,我们还介绍了 LReID-sync,一个模拟的行人数据集,设计用于具有点云完成和形状参数学习任务的预训练编码器。在 LReID 上的大量实验表明,ReID3D 取得了卓越的性能,准确率为 94.0%,突出了激光雷达在处理行人重识别(ReID)任务方面的显著潜力。

数据集:

据我们所知,本文首次介绍了基于激光雷达的人ReID的研究。我们构建了 LReID,第一个基于激光雷达的 ReID数 据集,以促进利用激光雷达点云对行人 ReID 的研究。我们使用多个收集节点在几个室外场景中收集数据集,每个节点包括一个激光雷达和一个工业摄像机。LReID 数据集提供了几个独特的特点:

  • 真实场景:该数据集是在室外场景中捕捉到的,行人表现出自然行为,导致行人之间的遮挡,以及存在动态物体,如车辆和自行车,可能会影响人的 ReID;
  • 数据多样性:LReID 包含在不同季节、时间和光照条件下收集的 320 名行人的动态数据和注释,总计 15.6 万帧点云和图像,从而能够全面分析不同因素对行人 ReID 的影响;
  • 精密度:Livox Mid-100激光雷达的距离精度为 2 cm 和角精度为 0.1°,为 ReID 问题提供了高精度的三维结构信息。

与公开的 3D 数据集对比:
在这里插入图片描述
下图显示了从不同的场景中收集到的两个行人的样本:

在这里插入图片描述

LReID 收集了两个广泛的户外场景:一个十字路口和一个建筑前的一个广场,捕捉不同的时间周期和天气条件,如图所示:
在这里插入图片描述

此外,我们还引入了一个模拟数据集,名为 LReID-sync,包括 360,000 帧的点云,用于由多视图同步激光雷达捕获的 600 个行人。LReID-sync 包括从单个视图到全视图的点云注释以及 SMPL 参数。LReID-sync 是使用 Unity3D 软件生成的一个新的行人数据集,它模拟了多个同步激光雷达从不同视图捕获的场景中的行人,如图所示:

在这里插入图片描述

方法模型:

基于点云,行人的识别依赖于他们的静态人体测量特征,包括身高、体型、肢体结构,以及他们的动态步态特征。准确地提取完整的行人形状特征对这两个方面都是有益的。为了解决这个问题,我们提出了一个有效的基于激光雷达的框架,称为 ReID3D。ReID3D 利用一种训练前策略来指导编码器学习基于 LReID-sync 的三维身体特征。此外,为了提取行人的区分静态和动态特征,ReID3D 的 ReID 网络包括一个基于图的互补增强编码器(GCEE)和一个时间模块。对LReID进行的大量实验证明了以下几点:

  • ReID3D 的性能优于最先进的相机处理方法,特别是在弱光下,突出了激光雷达在处理个人ReID任务方面的显著潜力;
  • 使用 LReID-sync 进行预训练,显著提高了模型的特征编码能力;
  • 与常用的点云编码器相比,我们的 GCEE 在提取全面和鉴别特征方面表现出更强的能力。

多任务预训练:

根据我们的观察,可能影响ReID模型性能的关键因素是:1)在交叉视图设置下由不同观点导致的信息变化,以及 2)单视角导致的不完整的信息。此外,真实数据的收集和注释成本较高,而模拟数据的成本较低,且注释丰富、准确。

因此,我们利用模拟数据对编码器进行点云完成和 SMPL 参数学习任务的预训练。我们提出的预训练方法的总体思想如图所示,这使编码器能够有效地提取人体测量特征,并减轻视点差异的影响:

在这里插入图片描述

ReID Network:

为了从点云序列中提取时空特征,ReID3D 的 ReID 网络包括一个 GCEE,它由一个GCN主干和CFE组成,以及一个时间模块,如图所示:
在这里插入图片描述

实验结果:

比较结果见下表:

在这里插入图片描述
可以得到几个结论:

  • ReID3D 和 B-ReID3D(不采用预训练)优于基于视频的方法,主要得益于点云的利用,而点云不受光照条件和复杂背景的影响;
  • 此外,ReID3D在整体和低光条件下取得了最先进的结果,但在正常光照条件下,它落后于基于视频的方法。这是因为基于视频的方法在正常光线下充分利用了外观信息;
  • 基于视频的方法在弱光下表现不佳,而 ReID3D 和 B-ReID3D 在弱光和正常光下都表现出相当的可靠性。

为了证明使用模拟数据集 LReID-sync 的预训练的有效性,我们评估了不同的预训练方法的性能。评估了以下四种方法:1)未经预先训练的ReID3D;2)采用类似的 ReID 任务进行预训练,其中预训练模型和损失与 ReID 网络一致;3)预训练,只使用点云完成的分支;4)进行多任务的预训练。

实验结果见表:

在这里插入图片描述
为了展示编码器通过预训练获得的鲁棒特征编码能力,我们将几个具有不同特征的真实行人点云的完成结果可视化,如图所示:
在这里插入图片描述

我们可以观察到:

  • 从直观上看,其详细而粗糙的形状与实际的人体形状非常相似,这表明编码器已经成功地捕获了人体的完整特征;
  • 详细形状是基于粗形状的扩展,具有更高的分辨率和更多的信息;
  • 预先训练好的编码器有能力估计点云中缺失部分的特征。

结论:

本文首次利用激光雷达提供的精确三维结构信息对人ReID进行了研究。首先,我们提出了一个基于lidar的ReID框架,名为ReID3D,利用预训练指导基于图的互补增强编码器(GCEE)提取全面的三维内在特征。此外,我们建立了第一个基于激光雷达的人ReID数据集,称为LReID,它包含了320个在不同的室外场景和照明条件下的行人。此外,我们还引入了LReID-sync,一个新的模拟行人数据集,设计用于具有点云完成和形状参数学习任务的预训练编码器。我们提出的ReID3D在LReID上表现出了卓越的性能,突出了激光雷达在处理人员ReID任务方面的巨大潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1508621.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mysql中 COALESCE和CASE WHEN的使用以及创建或替换视图

create or replace view 自理能力评估视图 as SELECT ehr_zlnlpg.ID AS ID, ehr_zlnlpg.GRID AS GRID, ehr_zlnlpg.TJID AS TJID, ehr_grjbxx.Name AS 姓名, ehr_grjbxx.Sex AS 性别, ehr_grjbxx.Cardnum AS 身份证号, ehr_zlnlpg.SCORESUM AS 总…

设计模式学习笔记 - 规范与重构 - 5.如何通过封装、抽象、模块化、中间层解耦代码?

前言 《规范与重构 - 1.什么情况下要重构?重构什么?又该如何重构?》讲过,重构可以分为大规模高层重构(简称 “大型重构”)和小规模低层次重构(简称 “小型重构”)。大型重构是对系统…

UI自动化测试使用场景及脚本录制

经常有人会问,什么样的项目才适合进行UI自动化测试呢?UI自动化测试相当于模拟手工测试,通过程序去操作页面上的控件。而在实际测试过程中,经常会遇到无法找到控件,或者因控件定义变更而带来的维护成本等问题。 哪些场…

MySQL 事务的原理以及长事务的预防和处置

transaction_isolation 隔离级别 读未提交 读提交 视图是在每个 SQL 语句开始执行的时候创建的 可重复读 视图是在事务启动时创建的,整个事务存在期间都用这个视图 串行化…

目标检测算法

图像识别三大任务 目标识别:或者说分类,定性目标,确定目标是什么目标检测:定位目标,确定目标是什么以及位置目标分割:像素级的对前景与背景进行分类,将背景剔除 目标检测定义 识别图片中有哪…

数据结构与算法第四套试卷(青科大)

1.图 无向图入度出度之和 所有入度之和为2*边数 2.树 **知识点:**注意二叉排序树!深度平衡树,所以可能会出现极端现象(链表),时间复杂度为0(n),如果为最好情况即为0(logn) 3.图 1.邻接表n个…

STM32利用标准库编写同时输出4路PWM信号的程序(Proteus)仿真

先看看结果: 这个是根据上午发的文章的基础上更改的,很简单,只是用了一个定时器,初始化了4个比较器而已,就可以单独的控制每一路PWM的占空比了,好了,把源文件展示一下,完事去接孩子放…

Wilson威尔逊平滑

1、威尔逊平滑引入的动机 在曝光很少的情况下,计算出的CTR并不真实可靠,而样本数越大,CTR的比例才越准确,更能反应真实情况。 为了衡量样本数对于CTR信区间的影响,我们引入"威尔逊(Wilson&#xff0…

2024暑期实习八股笔记

文章目录 自我介绍MySQL索引索引种类、B树聚簇索引、非聚簇索引联合索引、最左前缀匹配原则索引下推索引失效索引优化 日志、缓冲池redo log(重做日志)刷盘时机日志文件组 bin log(归档日志)记录格式写入机制 两阶段提交undo log&…

骨传导耳机如何选购?新手必看的6个避雷小妙招!

在短短几年内,骨传导耳机的市场规模一路攀升,今年甚至有望成为最受欢迎的蓝牙耳机款式,但与此同时,整个骨传导耳机行业也频繁出现乱象,不专业产品鱼龙混杂,令人吃惊的是,还有许多中小网红品牌也…

ctfshow web入门 php特性总结

1.web89 intval函数的利用,intval函数获取变量的整数值,失败时返回0,空的数组返回,非空数组返回1 num[]1 intval ( mixed $var [, int $base 10 ] ) : int Note: 如果 base 是 0,通过检测 var 的格式来决定使用的进…

【Redis】RedisTemplate序列化传输数据

使用自定义的序列化器 使用RedisTemplate默认的序列化器发送数据,会将key全都当成Object处理,从而按照对象的方式转成json格式发送到服务器,这样会导致两个问题。一是不方便阅读,二是会大大浪费内存。因此,建议自定义…

SQLiteC/C++接口详细介绍(一)

上一篇:SQLiteC/C接口简介 下一篇:SQLiteC/C接口详细介绍(二) 引言: SQLite C/C 数据库接口是一个流行的SQLite库使用形式,它允许开发者在C和C代码中嵌入 SQLite 基本功能的解决方案。通过 SQLite C/C 数据…

企业内部培训考试系统题库功能开发说明

学练考结合中,练是很关键的一环,将考察学习成功的试题导入企业内部培训考试系统的题库中,既可以作为日常学习后的作业巩固练习,又可以组卷进入正式考试里的试卷里。日常考试前更是可以反复练习题库里的各种试题。 校营宝企业内部…

LLM 构建Data Muti-Agents 赋能数据分析平台的实践之①:数据采集

一、 概述 在推进产业数字化的过程中,数据作为最重要的资源是优化产业管控过程和提升产业数字化水平的基础一环,如何实现数据采集工作的便利化、高效化、智能化是降低数据分析体系运转成本以及推动数据价值挖掘体系的基础手段。随着数字化在产业端的推进…

AXI相关知识点

1、Axcache相关知识点 xilinx 文档Pg059推荐: . Xilinx recommends that master devices drive their AW/RCACHE outputs to 0b0011 to allow the AXI Interconnect core to pack data while performing width conversion. 下面这篇文档对Axcache讲解的非常通俗易…

2024年春招|个人简历范本(精选5篇)

HR浏览一份简历也就25秒左右,如果你连「好简历」都没有,怎么能找到好工作呢? 如果你不懂得如何在简历上展示自己,或者觉得怎么改简历都不出彩,那请你一定仔细读完。 个人求职简历第 1 篇 男 22 本科 AI简历 市场营销 123456789 resume@ai-tools.cn 个人概述 以互联…

数据库--SQL语言-1

练习网站:自学SQL网 Select 查询语法复习 SELECT column, another_column, …FROM mytableWHERE condition AND/OR another_condition AND/OR …; 操作符号: 如果属性是字符串, 我们会用到字符串相关的一些操作符号,其中 LIKE&#xff08…

「CISP题库精讲」CISP题库习题解析精讲5道

前言 本节只要对CISP考试中的5道习题进行详细的讲解,时间比较少,敲多少道,就算多少道,反正全部也就1400多道。 习题部分 第一题 某企业内网中感染了一种依靠移动存储进行传播的特洛伊木马病毒,由于企业部署的杀毒软件,为了解决该病毒在企业内部传播,作为信息化负责人…

C++进阶之路---多态(二)

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 一、多态的原理 1.虚函数表 // 这里常考一道笔试题:sizeof(Base)是多少? class Base { public:…