【2024 行人重识别最新进展】ReID3D:首个关注激光雷达行人 ReID 的工作!

news2024/9/23 7:32:43

【2024 行人重识别最新进展】ReID3D:首个关注激光雷达行人 ReID 的工作!

  • 摘要:
  • 数据集:
  • 方法模型:
    • 多任务预训练:
    • ReID Network:
  • 实验结果:
  • 结论:

来源:Arxiv 2023
机构:清华大学 & 北京理工大学
论文题目:LiDAR-based Person Re-identification

本文是首个基于激光雷达的人ReID的工作,展示了在具有挑战现实世界的户外场景中,利用激光雷达进行的行人 ReID 的实用性!

论文链接:https://arxiv.org/abs/2312.03033

开源代码:https://github.com/GWxuan/ReID3D

摘要:

基于摄像头的重识别(ReID)系统在公共安全领域得到了广泛的应用。然而,摄像机往往缺乏对人类三维形态信息的感知,并且容易受到各种限制,如照明不足、背景复杂和个人隐私,如图:
在这里插入图片描述

在本文中,我们提出了一种基于激光雷达的 ReID 框架,ReID3D,该框架利用预训练策略来检索三维体型的特征,并引入了基于图的互补增强编码器来提取综合特征。由于缺乏激光雷达数据集,我们构建了第一个基于 LiDAR 的行人 ReID 数据集 LReID,该数据集在几个自然条件变化的室外场景中收集。

此外,我们还介绍了 LReID-sync,一个模拟的行人数据集,设计用于具有点云完成和形状参数学习任务的预训练编码器。在 LReID 上的大量实验表明,ReID3D 取得了卓越的性能,准确率为 94.0%,突出了激光雷达在处理行人重识别(ReID)任务方面的显著潜力。

数据集:

据我们所知,本文首次介绍了基于激光雷达的人ReID的研究。我们构建了 LReID,第一个基于激光雷达的 ReID数 据集,以促进利用激光雷达点云对行人 ReID 的研究。我们使用多个收集节点在几个室外场景中收集数据集,每个节点包括一个激光雷达和一个工业摄像机。LReID 数据集提供了几个独特的特点:

  • 真实场景:该数据集是在室外场景中捕捉到的,行人表现出自然行为,导致行人之间的遮挡,以及存在动态物体,如车辆和自行车,可能会影响人的 ReID;
  • 数据多样性:LReID 包含在不同季节、时间和光照条件下收集的 320 名行人的动态数据和注释,总计 15.6 万帧点云和图像,从而能够全面分析不同因素对行人 ReID 的影响;
  • 精密度:Livox Mid-100激光雷达的距离精度为 2 cm 和角精度为 0.1°,为 ReID 问题提供了高精度的三维结构信息。

与公开的 3D 数据集对比:
在这里插入图片描述
下图显示了从不同的场景中收集到的两个行人的样本:

在这里插入图片描述

LReID 收集了两个广泛的户外场景:一个十字路口和一个建筑前的一个广场,捕捉不同的时间周期和天气条件,如图所示:
在这里插入图片描述

此外,我们还引入了一个模拟数据集,名为 LReID-sync,包括 360,000 帧的点云,用于由多视图同步激光雷达捕获的 600 个行人。LReID-sync 包括从单个视图到全视图的点云注释以及 SMPL 参数。LReID-sync 是使用 Unity3D 软件生成的一个新的行人数据集,它模拟了多个同步激光雷达从不同视图捕获的场景中的行人,如图所示:

在这里插入图片描述

方法模型:

基于点云,行人的识别依赖于他们的静态人体测量特征,包括身高、体型、肢体结构,以及他们的动态步态特征。准确地提取完整的行人形状特征对这两个方面都是有益的。为了解决这个问题,我们提出了一个有效的基于激光雷达的框架,称为 ReID3D。ReID3D 利用一种训练前策略来指导编码器学习基于 LReID-sync 的三维身体特征。此外,为了提取行人的区分静态和动态特征,ReID3D 的 ReID 网络包括一个基于图的互补增强编码器(GCEE)和一个时间模块。对LReID进行的大量实验证明了以下几点:

  • ReID3D 的性能优于最先进的相机处理方法,特别是在弱光下,突出了激光雷达在处理个人ReID任务方面的显著潜力;
  • 使用 LReID-sync 进行预训练,显著提高了模型的特征编码能力;
  • 与常用的点云编码器相比,我们的 GCEE 在提取全面和鉴别特征方面表现出更强的能力。

多任务预训练:

根据我们的观察,可能影响ReID模型性能的关键因素是:1)在交叉视图设置下由不同观点导致的信息变化,以及 2)单视角导致的不完整的信息。此外,真实数据的收集和注释成本较高,而模拟数据的成本较低,且注释丰富、准确。

因此,我们利用模拟数据对编码器进行点云完成和 SMPL 参数学习任务的预训练。我们提出的预训练方法的总体思想如图所示,这使编码器能够有效地提取人体测量特征,并减轻视点差异的影响:

在这里插入图片描述

ReID Network:

为了从点云序列中提取时空特征,ReID3D 的 ReID 网络包括一个 GCEE,它由一个GCN主干和CFE组成,以及一个时间模块,如图所示:
在这里插入图片描述

实验结果:

比较结果见下表:

在这里插入图片描述
可以得到几个结论:

  • ReID3D 和 B-ReID3D(不采用预训练)优于基于视频的方法,主要得益于点云的利用,而点云不受光照条件和复杂背景的影响;
  • 此外,ReID3D在整体和低光条件下取得了最先进的结果,但在正常光照条件下,它落后于基于视频的方法。这是因为基于视频的方法在正常光线下充分利用了外观信息;
  • 基于视频的方法在弱光下表现不佳,而 ReID3D 和 B-ReID3D 在弱光和正常光下都表现出相当的可靠性。

为了证明使用模拟数据集 LReID-sync 的预训练的有效性,我们评估了不同的预训练方法的性能。评估了以下四种方法:1)未经预先训练的ReID3D;2)采用类似的 ReID 任务进行预训练,其中预训练模型和损失与 ReID 网络一致;3)预训练,只使用点云完成的分支;4)进行多任务的预训练。

实验结果见表:

在这里插入图片描述
为了展示编码器通过预训练获得的鲁棒特征编码能力,我们将几个具有不同特征的真实行人点云的完成结果可视化,如图所示:
在这里插入图片描述

我们可以观察到:

  • 从直观上看,其详细而粗糙的形状与实际的人体形状非常相似,这表明编码器已经成功地捕获了人体的完整特征;
  • 详细形状是基于粗形状的扩展,具有更高的分辨率和更多的信息;
  • 预先训练好的编码器有能力估计点云中缺失部分的特征。

结论:

本文首次利用激光雷达提供的精确三维结构信息对人ReID进行了研究。首先,我们提出了一个基于lidar的ReID框架,名为ReID3D,利用预训练指导基于图的互补增强编码器(GCEE)提取全面的三维内在特征。此外,我们建立了第一个基于激光雷达的人ReID数据集,称为LReID,它包含了320个在不同的室外场景和照明条件下的行人。此外,我们还引入了LReID-sync,一个新的模拟行人数据集,设计用于具有点云完成和形状参数学习任务的预训练编码器。我们提出的ReID3D在LReID上表现出了卓越的性能,突出了激光雷达在处理人员ReID任务方面的巨大潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1335537.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins的特殊操作定时自动执行任务以及测试报告调优

java -Dhudson.model.DirectoryBrowserSupport.CSP -jar Jenkins.war 测试报告 不美丽 执行上面的代码 重启jenkins 就好了

Ensp dhcp全局地址池(配置命令 + 实例)

使用DHCP的好处:减少管理员的工作量、避免输入错误的可能、避免ip冲突 DHCP报文类型: DHCP DISCOVER:客户端用来寻找DHCP服务器 DHCP OFFER:DHCP服务器用来响应DHCP DISCOVER报文,此报文携带了各种配置信息 DHCP REQUEST:客户端配置请求确…

8+WGCNA+免疫+实验,干湿结合的经典生信思路,可冲

今天给同学们分享一篇生信文章“Identifying the key genes of Epstein-Barr virus-regulated tumour immune microenvironment of gastric carcinomas”,这篇文章发表在Cell Prolif期刊上,影响因子为8.5。 结果解读: EBV感染改变了胃癌中的…

【Java注解的作用是什么?】

🍁Java注解的作用是什么? 🍁典型解析🍁扩展知识仓🍁什么是元注解🍁Retention🍁Target🍁Documented🍁Inherited 🍁典型解析 Java 注解用于为 Java 代码提供元数…

【DataGrip使用小技巧】2

【技巧1】要将活动编辑器与剪贴板内容进行比较,请右键单击编辑器中的任意位置,然后从上下文菜单中选择compare with Clipboard. 如图所示 剪贴板和编辑器的比较一目了然 【技巧2】若要创建表的备份副本,请将表拖到数据库树视图中同一数据源的…

AI项目十九:YOLOV8实现目标追踪

若该文为原创文章,转载请注明原文出处。 主要是学习一下实现目标追踪的原理,并测试一下效果。 目的是通过YOLOV8实现人员检测,并实现人员追踪,没个人员给分配一个ID,实现追踪的效果。 也可以统计人数。在小区办公楼…

Linux:线程优先级设置

目录 一、背景二、调整普通线程的优先级通过系统命令通过Linux C代码 三、调整实时线程的优先级通过系统命令通过Linux C代码 四、参考资料(建议一定要阅读) 在操作系统中,线程优先级决定了线程在 CPU 调度时的重要性。较高优先级的线程会在竞…

Python能做大项目(6)Poetry -- 项目管理的诗和远方之一

[Poetry] 是一个依赖管理和打包工具。Poetry 的作者解释开发 Poetry 的初衷时说: 通过前面的案例,我们已经提出了一些问题。但不止于此。 当您将依赖加入到 requirements.txt 时,没有人帮你确定它是否与既存的依赖能够和平共处,这…

java数据结构与算法刷题-----LeetCode633. 平方数之和

java数据结构与算法刷题目录(剑指Offer、LeetCode、ACM)-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/123063846 思路一:双指针 可以使用双指针,不断从两个方向匹配…

分享71个Java源码总有一个是你想要的

分享71个Java源码总有一个是你想要的 学习知识费力气,收集整理更不易。 知识付费甚欢喜,为咱码农谋福利。 链接:https://pan.baidu.com/s/1frK-W3GT8WrydSlQ-E3o6A?pwd6666 提取码:6666 UI代码 def __init__(self):import …

大数据技术学习笔记(十一)—— Flume

目录 1 Flume 概述1.1 Flume 定义1.2 Flume 基础架构 2 Flume 安装3 Flume 入门案例3.1 监控端口数据3.2 实时监控单个追加文件3.3 实时监控目录下多个新文件3.4 实时监控目录下的多个追加文件 4 Flume 进阶4.1 Flume 事务4.2 Flume Agent 内部原理4.3 Flume 拓扑结构4.3.1 简单…

C++之多层 if-else-if 结构优化(三)

C之多层 if-else-if 结构优化(二)-CSDN博客 接上面的内容继续讲解多层 if-else-if结构优化 8、利用规则执行器来进行优化 8.1 业务场景介绍 if (未注册用户){return false; }if (是否国外用户) {return false; }if (刷单用户) {return false; }if (未付费用户 && 不…

数据仓库【2】:架构

数据仓库【2】:架构 1、架构图2、ETL流程2.1、ETL -- Extract-Transform-Load2.1.1、数据抽取(Extraction)2.1.2、数据转换(Transformation)2.1.3、数据加载( Loading ) 2.2、ETL工具2.2.1、结构…

github新建仓库推送代码教学

之前一直用gitee,准备转到github。因为一步一步尝试。如果是新手或许文章会有帮助 点击 new 创建 拉代码 Idea 打开 复制一个 pom 文件作为 maven 管理 提交代码 不出意外的出意外,报错 点击authorize JetBrains 失败 分析问题 本质就是没有…

零基础入门网络安全必看的5本书籍(附PDF)

书中自有黄金屋,书中自有颜如玉。很多人学习一门技术都会看大量的书籍,经常也有朋友询问:零基础刚入门,应该看哪些书?应该怎么学?等等问题。今天就整理了5本零基础入门网络安全必看书籍,希望能帮…

Ubuntu 22.04.3 Server 设置静态IP 通过修改yaml配置文件方法

目录 1.查看网卡信息 2.修改yaml配置文件 3.应用新的网络配置 4.重新启动网络服务 文章内容 本文介绍Ubuntu 22.04.3 Server系统通过修改yaml配置文件配置静态 ip 的方法。 1.查看网卡信息 使用ifconfig命令查看网卡信息获取网卡名称​ 如果出现Command ifconfig not fo…

若依SQL Server开发使用教程

1. sys_menu表中的将菜单ID修改为自动ID,解决不能增加菜单的问题,操作流程如下: 解决方案如下 菜单栏->工具->选项 点击设计器,去掉阻止保存要求更新创建表的更改选项,点确认既可以保存了 2 自动生成代码找不表的解决方案…

智能优化算法应用:基于指数分布算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于指数分布算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于指数分布算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.指数分布算法4.实验参数设定5.算法结果6.…

20231225使用BLE-AnalyzerPro WCH升级版BLE-PRO蓝牙分析仪抓取BLE广播数据

20231225使用BLE-AnalyzerPro WCH升级版BLE-PRO蓝牙分析仪抓取BLE广播数据 2023/12/25 20:05 结论:硬件蓝牙分析仪 不一定比 手机端的APK的效果好! 亿佰特E104-2G4U04A需要3片【单通道】,电脑端的UI为全英文的。 BLE-AnalyzerPro WCH升级版B…

前端---css 的介绍

1. css 的定义 css(Cascading Style Sheet)层叠样式表,它是用来美化页面的一种语言。 没有使用css的效果图 使用css的效果图 2. css 的作用 美化界面, 比如: 设置标签文字大小、颜色、字体加粗等样式。控制页面布局, 比如: 设置浮动、定位等样式。 3. css 的基本语…