读《基于深度学习的跨视角步态识别算法研究》

news2024/11/26 8:51:47

2020

背景:

作为一种新兴的识别技术,步态识别具有在非受控、远距离、低分辨率的场景下进行身份识别的优点,并且步态不易改变和伪装,所以近年来得到的关注逐渐增多。

步态识别作为一种新兴的身份识别技术,可以根据人们走路姿势的不同来区分个体身份。与现有的如人脸、指纹等需要近距离采集且需要人员配合的生物特征相比,步态具有低分辨率、受环境影响小、易采集等优点。此外,行人步态可以在个体毫无觉察的情况下被采集到以进行识别,而且行人走路姿势也难以伪装和模仿。步态识别的这些优势使得其最近受到研究人员的关注越来越多。目前,在丹麦、英国等国家和地区,步态分析己经在刑事犯罪案件中投入使用,办案人员通过步态识别系统分析可疑人员的走路姿态,以提升筛查效率和准确性,降低了因人脸识别、行人重识别等技术失效和人工筛查的低效性所导致嫌犯逃离的可能性。
但是在日常生活中,监控系统中捕获的步态样本与注册的步态样本往往存在视角差异,这会大大的削弱经典步态识别算法的有效性。所以,解决跨视角步态识别问题、提高步态识别的准确性和实时性,是步态识别产品必须要攻克的技术难题。
当前困难
目前跨角度步态识别的困难在于行人步态在不同视角下的视觉差别巨大。由于步态特征仅包含行人的体型轮廓以及走路姿态信息,不包含颜色和纹理特征,这使得从不同视角的步态中,很难提取表征行人身份的视角不变性特征。为了解决步态识别在跨角度时识别率低的问题

当前解决方法

第一类是通过全景相机或多个校准相机进行3D步态信息构建的跨角度识别方法
这些方法需要复杂的可控摄像机的设置,这在实际应用中难以实现。另一方面,这些方法计算负荷大,进一步限制了其实际应用的可能。
第二类是基于视角转换模型VTM的跨视角识别方法。这种方法利用来自其他视角的信息集中使用诸如奇异值分解和回归等技术来构建步态特征。
VTM方法仅仅减小了变换视角的步态特征与原始特征之间的差异,并没有考虑不同个体间的判别性因素,且这类方法在建模计算时很容易造成噪声传播,导致识别率不佳。
第三类是提取具有视角不变性的步态特征。
受限于步态数据跨视角步态标签不足的问题,很难完成模型训练,并且通常使用的损失函数都是生搬硬套人脸识别任务中广泛使用的损失函数

提取对视角变化不敏感的特征可以减小现实场景中视角多变对步态识别技术有效性的影响,实现无论行人以何种角度经过摄像头,都能准确识别出目标身份的目的,这会大大提高步态识别技术的鲁棒性和实际应用价值,推进步态识别技术产业化和标准化,形成完整的产品或服务以在现实生活中发挥作用

当前困难的本质

同一个人的步态从各个角度拍摄成像的步态轮廓是不同的,而且拍摄视角差别越大,同一行人的差异就越大。对于人类而言,这个问题往往可以通过大脑中复杂的运算推理和三维转换判断出这些不同视角的步态是否来自同一个人。但是,对于计算机而言,其输入仅仅是由离散像素点排列而成的二维数字图像,要通过这些像素点来解决视角不变问题是非常有挑战性的。另外一方面,步态特征是不包含行人的穿着等颜色和纹理特征,仅包括行人的轮廓以及行走姿势特征,所以我们无法从颜色和纹理上推理出视角的转换关系,这无疑增加了跨视角的识别难度。对于步态特征而言,可以认为其仅包含三类信息:视角信息、身份信息以及由不同穿着、背包、轮廓分割误差所产生的噪声千扰信息。因此,如果能够将步态特征中的视角信息和身份信息进行分离,仅用只包含身份信息的特征进行识别,会大大提升跨视角步态识别的精度,提高抗视角千扰能力。
给定一个查询样本,跨视角步态识别的目的是从与该查询样本视角不同的某视角的注册数据集中正确找到与该查询样本身份相同的注册样本。
在这里插入图片描述

其中,G表示生成的步态能量图中位置(i,j)的像素值,s表示步态序列中/时刻的步态剪影图的位置(i,j)的像素值,T表示此步态序列的长度。实际应用中,在计算步态能量图之前,要先进行步态的矫正和对齐,使每个时刻的步态剪影图的重心位置重合。

(将仅有的两个特征视角和身份拆开分析)

本章提出了身份与视角特征分离的跨视角步态识别算法,将步态特征中的视角信息和身份信息进行分离,仅用只包含身份信息的特征进行识别,提升了跨视角步态识别的精度,提高了抗视角干扰能力。为了保证所提取的身份特征与视角特征是来自该步态样本的全部信息,本章采用了自编码器的方式来恢复原始输入的步态样本,设计了视角编码器、身份编码器和步态解码器。
(将仅有的两个特征视角和身份一起分析)
在步态识别任务中,如何提取既具有身份判别能力还具有视角不变性的特征是提高步态识别精度的关键。而在现实生活中,人们往往只需要关注行人走路时身体的一部分运动特点和体型特点就可以判断出该行人的身份,这意味着行人身体的不同部分在步态特征表达中所占的权重是不一样的,所以对行人身体进行分块是很有必要的。在具体特征表达方面,水平金字塔是一种在水平方向上的多尺度特征提取方法,并且己经被证明在行人再识别任务上有出色的表现。

展望:

虽然提纯身份特征的损失可以提高识别率,但是这只说明组合损失有利于增强表征判别性,但可能特征里还有干扰。解决思路:研究特征的分布,可视化(TSNE?);GAN分解步态样本
在数据集上的效果并没有明显超越前人,原因是数据集视角较少且相邻视角跨度很小。说明此方法在视角差别很小时对步态样本的身份和视角特征分离的作用不明显,所以未来可以设计更精细的网络来解决此问题;
背包、不同穿着等情况下存在泛化性能挑战。未来可以尝试通过特征选择来解决,对于那些表达背包和穿着的干扰信息,用特征选择的方法将其滤除,可能会取得更好的识别效果。(行人重识别还好说,有颜色啥的分割,这全是白块怎么知道哪是背包,哪是穿着)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/42654.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jsp美食管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 JSP 美食管理系统 是一套完善的web设计系统,对理解JSP java编程开发语言有帮助,系统采用serlvet dao bean mvc模式开发,系统具有完整的源代码和数据库,系统主要采用B/S模式 开发。开发环境为TOMCAT7.0,Myeclipse8…

ZYNQ之FPGA学习----UART串口实验

1 UART串口简介 UART串口基础知识学习:硬件设计基础----通信协议UART 2 实验任务 上位机通过串口调试助手发送数据给 Zynq,Zynq PL 端通过 RS232 串口接收数据并将接收到的数据发送给上位机,完成串口数据环回,管脚分配如下&…

软件测试的分类

这里先讲一些概念,改日从这里边挑几个细讲。(给小白看的) 按测试对象划分: 界面测试: 软件只是一种工具,软件与人的信息交流是通过界面来进行的,界面是软件与用户交流的最直接的一层&#xff…

基于二次近似(BLEAQ)的双层优化进化算法_matlab程序

参考文献如上。 双层优化问题是一类具有挑战性的优化问题,包含两个层次的优化任务。在这些问题中,下层问题的最优解成为上层问题的可能可行候选。这样的要求使得优化问题难以解决,并使研究人员忙于设计能够有效处理该问题的方法。尽管付出了…

Redis常见面试问题总结

文章目录Redis 基础面试说说你对Redis的了解?说说Redis中的数据类型?说说Redis数据类型对应的数据结构?说说Redis对应的Java客户端有哪些?说说Redis 中持久化发生了什么?说说Redis中持久化以及方式?如何理解Redis中RD…

2022年超实用的推特营销策略

Twitter推广需知的13条基础知识: 1、Twitter日活用户达1亿 2、Twitter月活用户3.25亿 3、Twitter广告价格比其他渠道便宜33% 4、每天产生5亿条推文 5、Twitter推广能够提高29%的线下交易 6、37%的Twitter用户在18到29岁之间 7、86%的带链接推文会比普通推文效…

JUC并发编程与源码分析笔记03-CompletableFuture

Future接口理论知识复习 Future接口(FutureTask实现类)定义了操作异步任务执行的一些方法,如获取异步任务的执行结果、取消任务的执行、判断任务是否被取消、判断任务执行是否完毕等。 找到java.util.concurrent.Future,看到里面…

Node.js 入门教程 22 将所有 Node.js 依赖包更新到最新版本

Node.js 入门教程 Node.js官方入门教程 Node.js中文网 本文仅用于学习记录&#xff0c;不存在任何商业用途&#xff0c;如侵删 文章目录Node.js 入门教程22 将所有 Node.js 依赖包更新到最新版本22 将所有 Node.js 依赖包更新到最新版本 当使用 npm install <packagename&g…

pytorch 手写数字识别1

目录 概述 加载图片 绘图部分 backward 前言&#xff1a; 这里以一个手写数字识别的例子,简单了解一下pytorch 实现神经网络的过程. 本章重点讲一下加载数据过程 参考&#xff1a; 课时9 手写数字识别初体验-1_哔哩哔哩_bilibili Pytorch中的backward函数 - …

为了让线上代码可追溯, 我开发了这个vite插件

人生的第一个vite插件 前言 想在控制台输出一下前端代码的一些构建信息&#xff0c; 比如打包时间、打包的人, 代码分支、commit是那个&#xff0c;方便在控制台追溯。 背景 遇到的问题 1、场景一 前端多人协同开发的情况下&#xff0c;比方测试站&#xff0c; 你发的代码…

Java 反射系列 —— 学习笔记

Java 反射系列 1. 类成员 为了更好的描述&#xff0c;我们做个约定个通配符 XXXX&#xff0c; 如果是成员变量就代表 Field&#xff0c;如果是类方法就代表 Method&#xff0c;如果是构造器就代表 Constructor。 1.1 获取方法 那么怎么获取到这三类成员呢&#xff1f; 获…

逆势涨薪3k!新媒体运营毅然转行测试,我的入行秘籍是什么?

不尝试永远都不会成功&#xff0c;勇敢的尝试是成功的一半。 大学毕业做运营&#xff0c;业务难精进&#xff0c;薪资难提升 “你大学专业是商务英语&#xff0c;为什么毕业后会选择做新媒体运营呢&#xff1f;” 其实我当时没有想那么多的&#xff0c;商务英语的就业方向一个…

苹果电容笔值得买吗?2022最新电容笔推荐

如今&#xff0c;许多人都喜欢用IPAD来学习记录&#xff0c;或是安静地作画。很多ipad的用户&#xff0c;都很重视它的实用性&#xff0c;因为他们发现&#xff0c;如果有一款功能不错的电容笔来搭配ipad&#xff0c;那么ipad的实用性就会得到极大的提高。事实上&#xff0c;如…

开发 Chrome 扩展程序的利弊

作为一名软件开发人员,您总是希望从事能够提高您的技术技能并赚钱的项目。有什么比开发现金流 chrome 扩展程序更好的方法呢? 在本文中,我将从软件开发人员的角度概述开发 chrome 扩展程序的一些优点和缺点。 开发 Chrome 扩展程序的好处 Chrome 扩展程序是软件开发人员接…

基于遗传算法与神经网络的测井预测(Matlab代码实现)

&#x1f468;‍&#x1f393;个人主页&#xff1a;研学社的博客 &#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜…

【序列召回推荐】(task4)多兴趣召回MIND模型

note Hinton在2011年提出的capsule network&#xff0c;通过EM期望值最大化算法&#xff0c;用动态路由代替反向传播进行更新参数&#xff0c;学习不同capsule之间的连接权重&#xff0c;实现比CNN更优秀的空间关系建模效果&#xff08;CNN可能对同一个图像的旋转版本识别错误…

Java笔记(十四)

文献种类&#xff1a;专题技术总结文献 开发工具与关键技术&#xff1a; IntelliJ IDEA、Java 语言 作者&#xff1a; 方建恒 年级&#xff1a; 2020 撰写时间&#xff1a; 2022 年 11 月 28 日 Java笔记(十四) 今天我给大家继续分享一下我的Java笔记&#xff0c; 我们继续来…

终于读完了阿里云p9专家分享云原生Kubernetes全栈架构师实战文档

都说程序员工资高、待遇好&#xff0c; 2022 金九银十到了&#xff0c;你的小目标是 30K、40K&#xff0c;还是 16薪的 20K&#xff1f;作为一名 Java 开发工程师&#xff0c;当能力可以满足公司业务需求时&#xff0c;拿到超预期的 Offer 并不算难。然而&#xff0c;提升 Java…

Linux便捷操作

1. Tab 这是你不能没有的 Linux 快捷键。它将节省你 Linux 命令行中的大量时间。 只需要输入一个命令&#xff0c;文件名&#xff0c;目录名甚至是命令选项的开头&#xff0c;并敲击 tab 键。它将自动完成你输入的内容&#xff0c;或为你显示全部可能的结果。 如果你只记一个…

中国住宅设施杂志中国住宅设施杂志社中国住宅设施编辑部2022年第9期目录

景观园林《中国住宅设施》投稿&#xff1a;cnqikantg126.com 市政园林景观工程施工项目管理的基本方法与措施 蒋伟;刘巍;张辉; 1-3 低成本风景园林设计与相关问题分析 魏小静; 4-6 城市文化公园景观设计探究——以临夏河州牡丹文化公园为例 姜丽; 7-9 建筑设计 …