【PVR】《Palm Vein Recognition and Large-scale Research based on Deep Learning》

news2025/4/18 11:18:02

在这里插入图片描述
邬晓毅. 基于深度学习的掌静脉识别及规模化研究[D]. 四川:电子科技大学,2024.

文章目录

  • 1、背景
  • 2、相关工作
  • 3、创新点和贡献
  • 4、方法和实验
    • 4.1、知识介绍
    • 4.2、基于自适应损失函数的掌静脉识别算法研究
    • 4.3、退化图像的掌静脉识别鲁棒性提升研究
    • 4.4、掌静脉识别系统规模化
  • 5、总结

1、背景

本文的研究贯穿一个主线即如何让掌静脉识别算法能够在复杂场景表现良好以适应可能的应用场景如安保、民生等领域。

掌静脉识别主要分为两个部分:

  • 端到端掌静脉识别算法
  • 针对退化图像的掌静脉识别鲁棒性提升方法

本文主要研究基于 940nm 波段图像的掌静脉识别算法。

特征提取是从掌静脉图像中提取具有代表性的特征信息,如静脉血管的分布模式分支情况曲线形状等。

本文主要研究基于轻量化深度神经网络的有监督掌静脉身份识别。

2、相关工作

  • 掌静脉识别的研究现状

    • 传统
    • 深度学习
  • 退化图像的掌静脉鲁棒性提升的研究现状

    • 退化图像衡量方法
    • ROI 定位精度提升
    • 对比度增强
    • 自适应直方图均衡化等
  • 掌静脉识别系统规模化的研究

    • 通过轻量化模型,有效降低边缘设备的负载,并通过 C/S 模式部署到企业的实际应用中,有效提高了效率和鲁棒性,带来了一定的积极经济效益。

在实际应用场景中,镜头获取的数据往往是退化图像即非标准环境数据,需要考虑光照、角度、和距离等因素对数据的影响。

近年来基于深度学习的手势检测与定位得到了科研人员的广泛关注。经过大量真实样本喂养训练的深度神经网络可以对复杂场景下的手部关键点定位和姿态检测具有更好的性能表现。

3、创新点和贡献

  • 掌静脉识别神经网络算法研究(自适应 loss)
  • 退化图像的掌静脉识别鲁棒性提升研究(退化图片过滤、ROI 提取、对比度增强
  • 掌静脉识别系统规模化(功能接口、数据加密、高维向量检索、并发压测)

在这里插入图片描述

4、方法和实验

4.1、知识介绍

Center Loss

在这里插入图片描述

在这里插入图片描述
参考 CenterLoss原理详解(通透)


Triplet Loss

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述

4.2、基于自适应损失函数的掌静脉识别算法研究

在这里插入图片描述
输入 128 x 128,输出 512

把 center loss 改为自适应了

motivation
在这里插入图片描述

前期提高 center 的权重,后期降低

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

实验数据集

在这里插入图片描述
训练过程可视化

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
比原版 center loss 是有提升,但是很有限
在这里插入图片描述

4.3、退化图像的掌静脉识别鲁棒性提升研究

实际上,摄像头获取的图像有一部分往往是退化图像。退化图像是指由于各种原因而失去了原始图像质量的图像。这种退化可以是由摄像机或传感器本身的技术限制、环境条件、图像传输中的噪声、压缩算法或存储过程
等引起的。退化图像可能会丢失细节、清晰度和色彩信息,导致图像模糊、失真或含有噪声。

在这里插入图片描述
作者自建数据集,3000 张手部静脉图像。这些静脉图像分别来自 300 个志愿者的手掌静脉信息

在这里插入图片描述

(1)图像退化衡量研究
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

正常类 prue,非正常类 blur

在这里插入图片描述
Laplacian 法可以很好的分开

在这里插入图片描述
Brenner 法可以很好的分开

作者基于 Laplacian 和 Brenner 算法进行融合来做退化图像衡量方法。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(2)ROI 定位精度鲁棒性研究

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(3)对比度增强研究

在这里插入图片描述
在这里插入图片描述
作者 DCP 和 POSHE 融合增强算法

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.4、掌静脉识别系统规模化

在这里插入图片描述

(1)高维向量检索方法

加速特征匹配

特征向量的高维检索方法 HNSW(Hierarchcal Navigable Small World graphs)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(2)接口设计
在这里插入图片描述
在这里插入图片描述

5、总结

  • 高维向量检索方法 HNSW

  • 对比度增强 POSHE

  • 万精油,weighted

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2331600.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyQt学习记录

PyQt学习记录 要在界面上 创建一个控件,就需要在程序代码中 创建 这个 控件对应类 地一个 实例对象。 在Qt系统中,控件(widget)是 层层嵌套 的,除了最顶层的控件,其他的控件都有父控件。 几个函数 函数mo…

Linux 学习笔记(5)路径知识详解:绝对路径、相对路径与特殊路径符(期末、期中复习必备)

前言 一、相对路径与绝对路径 1、概念阐述 2、实际示例 二、特殊路径符 1.特殊路径符介绍 2.应用场景 三、总结 四、结语 前言 在 Linux 系统的学习过程中,路径的概念至关重要,它是我们在文件系统中定位文件和目录的关键。今天,我们就…

Trae + LangGPT 生成结构化 Prompt

Trae LangGPT 生成结构化 Prompt 0. 引言1. 安装 Trae2. 克隆 LangGPT3. Trae 和 LangGPT 联动4. 集成到 Dify 中 0. 引言 Github 上 LangGPT 这个项目,主要向我们介绍了写结构化Prompt的一些方法和示例,我们怎么直接使用这个项目,辅助我们…

动态规划——两个数组的dp问题

目录 1. 最长公共子序列 2. 不相交的线 3. 不同的子序列 4. 通配符匹配 5. 正则表达式匹配 6. 交错字符串 7. 两个字符串的最小ASCII删除和 8. 最长重复子数组 1. 最长公共子序列 题目链接:1143. 最长公共子序列 - 力扣(LeetCode&#xff0…

stream流Collectors.toMap(),key值重复问题

文章目录 一、问题二、问题示例三、原因四、解决方法4.1、方案一 一、问题 发现Collectors.toMap的一个坑,若key值重复的时候会抛异常。如: IllegalStateException: Duplicate key 男 二、问题示例 报错示例如下: import lombok.AllArgsC…

机器学习 Day10 逻辑回归

1.简介 流程就是: 就是我们希望回归后激活函数给出的概率越是1和0. 2.API介绍 sklearn.linear_model.LogisticRegression 是 scikit-learn 库中用于实现逻辑回归算法的类,主要用于二分类或多分类问题。以下是对其重要参数的详细介绍: 2.1.…

Seq2Seq - Dataset 类

本节代码定义了一个 CMN 类,它继承自 PyTorch 的 Dataset 类,用于处理英文和中文的平行语料库。这个类的主要作用是将文本数据转换为模型可以处理的格式,并进行必要的填充操作,以确保所有序列的长度一致。 ⭐重写Dataset类是模型训…

echarts图表相关

echarts图表相关 echarts官网折线图实际开发场景一: echarts官网 echarts官网 折线图 实际开发场景一: 只有一条折线,一半实线,一半虚线。 option {tooltip: {trigger: "axis",formatter: (params: any) > {const …

idea自动部署jar包到服务器Alibaba Cloud Toolkit

安装插件:Alibaba Cloud Toolkit 配置服务器: 服务器配置: 项目启动Shell脚本命令: projectpd-otb.jar echo 根据项目名称查询对应的pid pid$(pgrep -f $project); echo $pid echo 杀掉对应的进程,如果pid不存在,则不执行 if [ …

Element Plus 图标使用方式整理

Element Plus 图标使用方式整理 以下是 Element Plus 图标的所有使用方式&#xff0c;包含完整代码示例和总结表格&#xff1a; 1. 按需引入图标组件 适用场景&#xff1a;仅需少量图标时&#xff0c;按需导入减少打包体积 示例代码&#xff1a; <template><div>…

链路聚合+vrrp

1.链路聚合 作用注意事项将多个物理接口&#xff08;线路&#xff09;逻辑上绑定在一起形成一条逻辑链路&#xff0c;起到叠加带宽的作用1.聚合接口必须转发速率一致。2.聚合设备两端必须一致 配置命令 方法一 [Huawei]interface Eth-Trunk 0----先创建聚合接口&#xff0c;…

Dynamics 365 Business Central Register Customer Payment 客户付款登记

#Dynamics 365 BC ERP# #D365 ERP# #Navision 前言 在实施过程&#xff0c;经常给客户介绍的 给客户付款一般用Payment Journal. 在客户熟悉系统运行后&#xff0c;往往会推荐客户使用Register Customer Payment.用这个function 工作会快很多&#xff0c;但出错的机会也比较大…

Odoo免费开源ERP:企业销售过程中出现的问题

在企业未上线Odoo免费开源ERP时&#xff0c;企业销售过程中会存在失误。比如&#xff0c;许多销售订单都有如下问题&#xff1a;不当的定价、向客户过多地询问、处理订单延误、错过发货日期等。这些问题源于企业三个未集成的信息系统&#xff1a;销售管理系统、库存系统和财务系…

网络稳定性--LCA+最大生成树+bfs1/dfs1找最小边

1.最大生成树去除重边&#xff0c;只要最大的边成树 2.LCA查最近公共祖先&#xff0c;然后询问的lca(x,y)ff,分别从x,y向上找最小边 3.bfs1/dfs1就是2.中向上找的具体实现 #include<bits/stdc.h> using namespace std; #define N 100011 typedef long long ll; typede…

混合并行技术在医疗AI领域的应用分析(代码版)

混合并行技术(专家并行/张量并行/数据并行)通过多维度的计算资源分配策略,显著提升了医疗AI大模型的训练效率与推理性能。以下结合技术原理与医疗场景实践,从策略分解、技术对比、编排优化及典型案例等维度展开分析: 一、混合并行技术:突破单卡算力限制 1. 并行策略三维分…

【C++面向对象】封装(上):探寻构造函数的幽微之境

每文一诗 &#x1f4aa;&#x1f3fc; 我本将心向明月&#xff0c;奈何明月照沟渠 —— 元/高明《琵琶记》 译文&#xff1a;我本是以真诚的心来对待你&#xff0c;就像明月一样纯洁无瑕&#xff1b;然而&#xff0c;你却像沟渠里的污水一样&#xff0c;对这份心意无动于衷&a…

每日算法-250409

这是我今天的算法学习记录。 2187. 完成旅途的最少时间 题目描述 思路 二分查找 解题过程 为什么可以使用二分查找&#xff1f; 问题的关键在于寻找一个最小的时间 t&#xff0c;使得在时间 t 内所有公交车完成的总旅途次数 sum 大于等于 totalTrips。 我们可以观察到时间的单…

如何实现文本回复Ai ChatGPT DeepSeek 式文字渐显效果?前端技术详解(附完整代码)

个人开发的塔罗牌占卜小程序&#xff1a;【问问塔罗牌】 快来瞧瞧吧&#xff01; 一、核心实现原理 我们通过三步实现这个效果&#xff1a; 逐字渲染&#xff1a;通过 JavaScript 定时添加字符 透明度动画&#xff1a;CSS 实现淡入效果 光标动画&#xff1a;伪元素 CSS 动画…

linux下截图工具的选择

方案一 gnome插件Screenshot Tool&#xff08;截屏&#xff09; ksnip&#xff08;图片标注&#xff09; gnome setting设置图片的默认打开方式为ksnip就可以快捷的将Screenshot Tool截屏的图片打开进行标记了。 但是最近我发现Screenshot Tool的延迟截图功能是有问题的&…

rkmpp 解码 精简mpi_dec_test.c例程

rkmpp 解码流程&#xff08;除 MPP_VIDEO_CodingMJPEG 之外&#xff09; 源码 输入h264码流 输出nv12文件 /** Copyright 2015 Rockchip Electronics Co. LTD** Licensed under the Apache License, Version 2.0 (the "License");* you may not use this file exce…