人脸识别——Webface-OCC遮挡人脸识别算法解析

news2025/1/10 2:32:15

1. 概述

自2019年被誉为人脸识别技术的元年,各地纷纷引入这项技术。然而,自2020年起,为了抵御冠状病毒(COVID-19)的全球传播,人们普遍开始佩戴口罩。众所周知,现有人脸识别模型在面对遮挡物(如口罩)时,其识别精度会显著下降。这一现象的主要原因在于,现有数据集往往没有充分考虑遮挡因素。

目前,尚未有一个公开的数据集能够全面考虑人脸识别中的遮挡问题。尽管已有一些研究提出了针对遮挡感知的人脸识别模型,包括对面具和太阳镜的识别,但这些研究大多是基于自行构建的数据集。然而,这些自行构建的数据集与现实情况存在较大差异,因此其有效性受到限制。

例如,(a) 展示了2016年报道的MaskNet所使用的数据集样本。该数据集通过随机应用不同尺寸的黑色遮罩来模拟遮挡。然而,这种单一的遮挡类型预计会降低模型的泛化能力。此外,考虑到实际应用场景,这种咬合(遮挡)方式显得并不自然。

(b) 展示了2019年报道的成对差分连体网络(PDSN)所使用的三个数据集样本。这里提供了三种不同的遮挡类型,与(a)相比,遮挡类型的多样性有所增加。但是,从实际应用的角度来看,遮挡的位置和大小仍然不够自然。

© 展示了2020年报告的wID所使用的数据集样本。在这个数据集中,人脸图像被随机应用了方形框作为遮挡。尽管采用了综合方法,但这种方法仍然无法很好地适应实际条件。

近年来,使用生成对抗网络(GANs)的方法受到了广泛关注,因为它们能够生成视觉上更自然的遮挡图像。然而,这些图像在细节信息上的变化可能导致在这些图像上训练的人脸识别模型在实际应用中表现不佳。

因此,尽管目前已有一些考虑遮挡的数据集,但它们大多数与现实情况相去甚远。

为了改善这一状况,本文提出了一个新的公共遮挡感知数据集——Webface-OCC。(d) 展示了Webface-OCC的样本数据。该数据集包含10,575个不同主体的804,704张面部图像,涵盖了各种遮挡类型,有望为人脸识别技术的发展提供更贴近实际的支持。


论文地址:https://arxiv.org/abs/2103.02805
源码地址:https://github.com/Baojin-Huang/Webface-OCC

2. Webface-OCC

Webface-OCC是基于广泛使用的CASIA-Webface人脸识别数据集构建的。CASIA-Webface数据集包含了轻微遮挡的人脸图像,使得在该数据集上训练的人脸识别模型在小遮挡情况下表现出色。

为了进一步提升模型在遮挡条件下的表现,我们对CASIA-Webface进行了增强,创建了全新的Webface-OCC数据集。这一改进对于提高模型在面对遮挡时的人脸识别性能具有显著帮助。

以下是Webface-OCC数据集的示例。与以往使用方块随机遮挡人脸的方法不同,我们在Webface-OCC中采用了口罩和太阳镜等更符合实际情境的遮挡物,这些是人们在日常生活中经常遇到的。

Webface-OCC提供了多种类型的(a)纹理/颜色和(b)口罩/太阳镜,具体如下所示。然后,我们从未经遮挡的正常图像中提取了面部特征点。

接下来,利用这些面部特征点,我们通过精确地将口罩映射到覆盖口鼻区域,将太阳镜映射到覆盖眼睛区域,并调整它们的角度和大小,生成了一系列带有遮挡的人脸图像。

通过这种方式,我们增加了数据集的多样性,使得数据集包含了多种遮挡类型的组合。最终,Webface-OCC数据集包含了10,575个不同个体的804,704张人脸图像。
此外,数据集中每个ID都包含了正常和遮挡状态下的人脸图像,且两者数量相等,如下所示。

3.测试实验

Webface-OCC训练的模型在两种不同情境下进行了评估:

  1. 一般人脸识别:使用了Labeled Faces in the Wild (LFW)、Celebrity Frontal-Profile in the Wild (CFP-FP) 和 AgeDB-30 数据集进行评估。
  2. 遮挡人脸识别:使用了最新提出的LFW-mask、CFP-FP-mask、AgeDB-30-mask 和 Real-World Masked Face Dataset (RMFRD) 进行评估。

LFW-mask、CFP-FP-mask 和 AgeDB-30-mask 是在原始数据集的基础上添加了遮挡物,这些数据集在图像数量和比例上与原始数据集保持一致,没有变化。

评估所用的模型基于六种具有代表性的人脸识别架构:CenterFace、SphereFace、FaceNet、CosFace、ArcFace 和 MaskNet。特别地,FaceNet 和 ArcFace 还在 WiderFace 数据集上进行了重新训练,以进一步验证其性能。

评估结果显示,由于人脸方向和年龄差异的影响,CFP-FP 和 AgeDB-30 的准确率显著低于 LFW。然而,使用 Webface-OCC 训练的模型与原始模型相比,准确率仅下降了大约 1%,表明这些模型在一般人脸识别数据集上的整体表现仍然较高。

模型性能比较图

此外,重新训练的模型(特别是 FaceNet 和 ArcFace)在性能上明显优于原始模型。例如,ArcFace 在四个遮挡人脸识别数据集(LFW-mask、CFP-FP-mask、AgeDB-30-mask 和 RMFRD)上的准确率比原始模型分别提高了 36.22%、29.14%、27.04% 和 15.03%。

换言之,重新训练的模型在显著提升对遮挡人脸识别数据集的性能的同时,保持了对一般人脸识别数据集的高准确率。

与模拟遮挡的人脸识别数据集(LFW-mask、CFP-FP-FP-mask 和 AgeDB-30-mask)相比,真实遮挡的人脸识别数据集(RMFRD)的识别精度较低。这可能是由于 RMFRD 中遮挡物的未知性,或者是因为被试者是公众人物,他们可能会故意伪装,以隐藏自己的身份。

4.总结

本文介绍了一个新的公共数据集,专为闭塞感知人脸识别而设计。与传统的合成遮挡方法相比,我们采用了一种创新的面部特征点映射技术来合成遮挡物,这种方法更贴近现实世界的应用场景。我们提出了一种综合的遮挡合成方法,它能够更真实地模拟实际中的遮挡情况。

通过将此方法应用于现有的Webface数据集,我们成功构建了一个包含大规模遮挡图像的公共数据集。此外,我们在该数据集上对ArcFace模型进行了重新训练,结果表明,重新训练后的模型在LFW-Mask和RMFRD数据集上分别达到了97.08%和78.25%的高准确率。

据NIST等多个国际权威机构的报告,传统人脸识别模型在口罩遮挡下的准确率会有显著下降。我们预计,Webface-OCC的推出将为人脸识别领域带来一个规模更大、更多样化、更精确的遮挡人脸识别数据集,从而显著提升人脸识别模型的准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1707641.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus

RAG(检索增强生成)系统的新评估似乎每天都在发布,其中许多都集中在有关框架的检索阶段。然而,生成方面——模型如何合成和表达这些检索到的信息,在实践中可能具有同等甚至更大的意义。许多实际应用中的案例证明,系统不仅仅要求从上…

Docker安装Redis的详细教程

以下是一个使用Docker安装Redis的详细教程 1. 拉取Redis镜像 运行以下命令来从Docker Hub上拉取最新的Redis镜像: docker pull redis:latest如果您需要特定版本的Redis,可以指定版本号: docker pull redis:6.2.72. 运行Redis容器 以下命…

基于AT89C52单片机的智能窗帘系统

点击链接获取Keil源码与Project Backups仿真图: https://download.csdn.net/download/qq_64505944/89276984?spm1001.2014.3001.5503 C 源码仿真图毕业设计实物制作步骤07 智能窗户控制系统学院(部): 专 业: 班 级&…

前端响应式期末作品

网页设计成品_前端响应式 主题:租房网站,共6个html页面,包含首页,登录注册,租房新闻,租房精选,租房详情,数据可视化页面(可以修改内容) 采用技术:…

香橙派KunpengPro测评之使用C语言操控40pin引脚

香橙派KunpengPro测评之使用C语言操控40pin引脚 香橙派KunpengPro介绍香橙派实物图香橙派登录界面香橙派KunpengPro的登录界面香橙派KunpengPro的原始桌面香橙派KunpengPro内安装了VScode等软件香橙派KunpengPro的终端 香橙派硬件参数核心性能图形与显示接口丰富性扩展与兼容性…

刷代码随想录有感(81):贪心算法——分发饼干

题干&#xff1a; class Solution { public:int findContentChildren(vector<int>& g, vector<int>& s) {sort(g.begin(), g.end());sort(s.begin(), s.end());int index s.size() - 1;int res 0;for(int i g.size() - 1; i > 0; i--){if(index >…

设计模型-系统架构师(三)

1、按照《中华人民共和国著作权法》的权利保护期&#xff0c;署名权和修改权 是永久保护的。 发表权、使用权和获取报酬权 保护期限 作者终生和死后的50年。 2、&#xff08;重要&#xff09;面向对象的分析模型主要由 顶层架构图、用例与用例图和&#xff08;&#xff09;构成…

远程户外监控组网方案,工业4G路由器ZR2000

户外监控无人值守4G工业路由器组网应用涉及工业自动化、数据传输和远程监控的重要领域。在户外没有光纤的情况下&#xff0c;想要让监控或传感器等设备联网&#xff0c;仅需一台4G工业路由器即可解决。以下是关于远程监控户外组网的详细分析与应用&#xff1a; 物联网应用场景 …

Java多线程(02)

一、如何终止线程 终止线程就是要让 run 方法尽快执行结束 1. 手动创建标志位 可以通过在代码中手动创建标志位的方式&#xff0c;来作为 run 方法的执行结束条件&#xff1b; public static void main(String[] args) throws InterruptedException {boolean flag true;Thr…

SERVER-----查询(1)

目录 Scott库下载&#xff1a; 一. 查询 1. 计算列 2. distinct 3. betwee... and... 4. in Scott库下载&#xff1a; 在大家学习数据库后期需要使用Scott库进行辅助学习&#xff0c;下面是我从一个叫做 yuhan_Li的博主那复制过来的&#xff0c;大家尽可能访问原文章吧&am…

南卡、韶音、Cleer开放式耳机如何选?全面对比测评拒绝智商税!

随着开放式耳机在生活中日益流行&#xff0c;市场上的多样化选择有时也伴随着质量参差不齐的问题&#xff0c;部分产品因成本控制而牺牲了材质和音质&#xff0c;给消费者在寻找高质量耳机时增添了困扰。 作为一名耳机评测领域的从业者&#xff0c;近期我投入大量精力对多款开…

基于STM32实现智能饮水机控制系统

目录 引言环境准备智能饮水机控制系统基础代码示例&#xff1a;实现智能饮水机控制系统 温度传感器数据读取水泵和加热器控制水位传感器数据读取用户界面与显示应用场景&#xff1a;家庭和办公室的智能饮水管理问题解决方案与优化收尾与总结 1. 引言 本教程将详细介绍如何在S…

1---Linux下进程的概念(逻辑推导,全干货无废话)

一、进程和程序&#xff1a; 1.1什么是程序&#xff1f; 程序由代码、数据、逻辑、接口和文档组成的一组按特定顺序执行的计算机指令&#xff0c;用于实现特定功能或解决问题。程序存储在磁盘上。 1.2什么是进程&#xff1f; 进程是一个正在执行的程序实例&#xff0c;包含程…

数据库查询——kettle开发20

一、数据库查询 数据库查询就是数据库里面的左连接&#xff0c;左连接就是两张表执行左关联查询&#xff0c;把左边的表数据全部查询出来。 如图所示我们在进行数据库查询操作时&#xff0c;我们首先需建立数据库连接&#xff0c;输入表名和查询需要的关键字&#xff0c;最后…

LAMP源码编译安装——CentOS7

文章目录 LAMP是什么LAMP软件组件LinuxApacheMySQLPHP 源码安装Apache一、准备工作二、安装环境依赖包三、配置软件模块四、编译及安装五、优化配置文件路径六、添加httpd系统服务&#xff08;有两种方法&#xff09;方法一&#xff1a;方法二&#xff1a; 七、修改httpd 服务配…

WEB安全:Content Security Policy (CSP) 详解

Content Security Policy (CSP) 是一种强大的网页安全机制,用于防止跨站脚本 (XSS) 和其他注入攻击。通过设置一系列的内容安全策略,CSP 可以限制网页可以加载的资源,从而保护用户数据和网站的安全性。 什么是 XSS 攻击? 跨站脚本攻击 (XSS) 是一种常见的安全漏洞,攻击者…

Svad:一个鲁棒、低功耗、轻量级的语音活动检测与尖峰神经网络

SVAD: A ROBUST, LOW-POWER, AND LIGHT-WEIGHT VOICE ACTIVITY DETECTION WITH SPIKING NEURAL NETWORKS 第二章 目标说话人提取之《Svad:一个鲁棒、低功耗、轻量级的语音活动检测与尖峰神经网络》 文章目录 SVAD: A ROBUST, LOW-POWER, AND LIGHT-WEIGHT VOICE ACTIVITY DETE…

京东二面:Sychronized的锁升级过程是怎样的

引言 Java作为主流的面向对象编程语言&#xff0c;提供了丰富的并发工具来帮助开发者解决多线程环境下的数据一致性问题。其中&#xff0c;内置的关键字"Synchronized"扮演了至关重要的角色&#xff0c;它能够确保在同一时刻只有一个线程访问特定代码块或方法&#…

【Python】 从Python列表中获取唯一值

基本原理 在Python中&#xff0c;列表是一种非常灵活的数据结构&#xff0c;它允许存储不同类型的元素。然而&#xff0c;有时我们可能需要从列表中提取唯一的值&#xff0c;即去除重复的元素。这在处理数据集或进行数据分析时尤其有用。Python提供了几种方法来实现这一目标。…

[SCTF2019]Who is he

unity 游戏&#xff0c;直接输入字符串 直接修改 if 判断&#xff0c;看能不能直接输出flag 修改了程序逻辑&#xff0c;但还是输出了 明明已经把这个 if 删了 不知道为什么还会输出这串字符 应该程序还有什么引入吧&#xff0c;看 wp 应该先查一下程序的动态链接库 DLL 是…