用于低质量蒙面人脸识别的一致子决策网络

news2025/1/11 4:24:21

Consistent Sub-Decision Network for Low-Quality Masked Face Recognition

摘要

        提出了一种利用由多个dropout块组成的在线一致性评估结构来获得对应于人脸不同区域的子决策网络,以获得对应于不同面部区域的子决策,并通过加权双向KL散度来约束子决策,使网络集中在上面而没有遮挡的面部。此外,还进行知识蒸馏,以驱动蒙面人脸嵌入接近原始数据分布,以减轻信息丢失。实验表明,所提出的方法在公共蒙面人脸识别数据集(即 RMFD、MFR2 和 MLFW)上的性能优于基线。

创新点

        1)提出了一致的子决策网络来获得对应于不同面部区域的子决策,并通过加权双向KL散度来约束子决策,使网络更加集中于面部区域(上面的脸没有遮挡)。

        2)进行知识蒸馏,以驱动蒙面人脸嵌入接近原始数据分布,以减轻信息丢失。

模型

        使用 FaceX-Zoo为每个正常人脸图像生成蒙版人脸图像,以获得混合训练数据集。假设正常人脸图像集、混合人脸图像集和身份标签集,组成一对数据集 D 。两个样本 {x_i}^N,{x_i}^M表示为作为来自同一身份的正常人脸图像及其对应的蒙版人脸图像。

        所提出的一致子决策网络的结构。在图的上部,每个人脸被提取成特征图,作为dropout模块的输入以获得多个子决策,不同的颜色区分了具有不同遮罩盖的面部图像的 dropout 模块的输出。应用双向KL散度约束来自动确定子决策一致性的优化方向。在图的下部,使用预训练的正常人脸识别模型来为上面的学生网络提炼指导性知识。

A. 一致的子决策网络

        基于模拟的方法提出从未蒙蔽的面孔生成蒙蔽的面孔。然而,在这些模拟人脸中,仍然存在一些具有负遮挡的低质量样本,从而导致面部特征模糊或缺失。为了解决这个问题,利用由多个dropout块组成的在线一致性评估结构来获得对应于人脸不同区域的子决策。子决策受到加权双向 KL 散度的约束,使网络更多地集中在没有遮挡的上表面上,并提取更多的判别性特征。

        在线子决策一致性评估方法的结构。展平后的特征图通过 dropout 模块生成子决策。一致性是通过子决策之间的 KL 散度来衡量的。

        给定来自D的人脸图像X,首先使用特征图生成器提取输入人脸图像的特征图。然后特征图被展平并通过多个 dropout 块以获得对应于不同面部区域的子决策,这些子决策被收集,并且在实现中设置 n =3。由于已经证明,在网络上重复应用dropout可以近似高斯过程的不确定性,我们进一步将这种不确定性扩展到子决策。在子决策之间应用双向KL散度计算来确定一致性值C(X)。

        子决策一致性可用于从模拟蒙面图像中检测低质量样本。首先,计算子决策之间的分歧。然后,应用激活函数来计算每个输入人脸图像的一致性值。一致性得分输出是[0,1]之间的概率值。如图2所示,可以看到一致性可以应用于从模拟蒙面图像中检测低质量样本。

        子决策一致性可用于从模拟蒙面图像中检测低质量样本。值越大表示子决策一致性和图像质量越高。

        为此,知道低子决策一致性值对应于模拟人脸图像中的低质量样本。然而,不同的子决策侧重于具有不同识别信息的不同面部区域。因此,寻求迫使具有低识别信息的子决策逼近具有高识别信息的子决策,从而使网络更多地集中在上表面而没有遮挡。为了自动评估每个子决策的信息程度,应用概念分支的输出作为双向KL散度约束中的权重。

 B. 知识蒸馏

        正常人脸比蒙面人脸包含更多的识别性身份信息。寻求使蒙面人脸嵌入接近正常人脸嵌入,以减轻信息丢失。具体来说,使用预训练的模型来执行知识蒸馏。给定一对面部图像X^N,X^M,从教师和学生模型中获得正常人脸嵌入 f^N和蒙面人脸嵌入 f^M。为了充分利用不同的面部区域信息,进一步应用概念分支的权重来获得加权嵌入,可以表示为:

        其中,M_{teacher}是预训练模型的嵌入编码器,G是特征图生成器,D_i是第i个dropout块,w^i表示概念分支的输出。使用嵌入之间的余弦距离方法来进行知识蒸馏作为正则项:

        为了保持类间差异和类内聚合,我们使用 CosFace作为我们的分类损失函数,它可以表示为

        总体损失函数公式如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2078107.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Transformer模型-5-Multi-Head Attention

上图红色圈中的部分为 Multi-Head Attention,是由多个Self-Attention组成的,虽然Encoder与Decoder中都有Multi-Head Attention,但他们略有区别。Encoder block包含一个 Multi-Head Attention, 而Decoder block包含两个 Multi-Head…

从聊天机器人到智能算法:Facebook AI技术的最新应用

人工智能(AI)技术的飞速发展正推动社交网络进入一个全新的智能化时代。作为全球领先的社交平台之一,Facebook(现已改名为Meta)在AI技术应用方面不断创新,推动了从聊天机器人到智能算法的诸多突破。本文将探…

C++第十三弹 -- STL之stack深度剖析与模拟实现

文章索引 前言1. stack的介绍2. stack的使用3. stack的模拟实现4. stackOJ题目4.1 最小栈4.2 栈的压入弹出序列4.3 用栈实现队列 总结 前言 在现代C编程中,STL(标准模板库)是一个不可或缺的工具。它提供了一套通用的模板类和算法&#xff0c…

Vue 2.x时间转换为北京时间(+8)

文章目录 当前时间格式效果图理想时间格式效果图转换方法总结 当前时间格式效果图 非中国常用时间格式,在上图中给可以看到,选择的时间为:2024-8-26 ~ 2024-8-27,返回结果却是:2024-08-25TXX:XX:XXZ,明显不…

C/C++开发神器CLion全新发布v2024.2——更适用于嵌入式开发

CLion是一款专为开发C及C所设计的跨平台IDE。它是以IntelliJ为基础设计的,包含了许多智能功能来提高开发人员的生产力。这种强大的IDE帮助开发人员在Linux、OS X和Windows上来开发C/C,同时它还使用智能编辑器来提高代码质量、自动代码重构并且深度整合CM…

教你识别原装与翻新芯片IC

在IC采购中,鉴别芯片真伪至关重要。原装芯片经过严格测试,而散新、翻新芯片可能存在质量和稳定性问题。市面上的IC芯片林林总总、各式各样,如果不注意区分,有时很难看出各种料有何不同。 假芯片制作手段包括翻新、打磨等&#xf…

2024年小红书图文制作超火爆风格,1单19.9!趣味性插画AI表情包项目思路

今天我想跟大家分享一个每天只需花20分钟就能轻松赚钱的AI表情包项目。 这个项目在小红书上非常受欢迎,因为它符合小红书的用户习惯,而且操作简单。下面我来详细讲讲如何利用软件快速创作有趣的插画! 项目简介 这个项目的原理很简单&#x…

自助共享空间小程序怎么做 共享空间小程序系统开发制作方法

最近很多老板想要做一个自己公司的自助共享空间小程序系统,但是不知道该怎么做,本次瀚林就为大家详细介绍一下各种自助共享空间小程序系统的开发制作方法为大家做参考。 目前市面上的自助共享空间有很多类型例如常见的: 娱乐空间、棋牌室、共…

SpringBoot中MyBatis使用自定义TypeHandler

😄 19年之后由于某些原因断更了三年,23年重新扬帆起航,推出更多优质博文,希望大家多多支持~ 🌷 古之立大事者,不惟有超世之才,亦必有坚忍不拔之志 🎐 个人CSND主页——Mi…

2-77 基于matlab-GUI的图像分割程序

基于matlab-GUI的图像分割程序,分别包括超像素 (superpixels)分割 SLIC算法,mean shift 图像分割,H算法(Felzenszwalb和Huttenloch提出的图像分割算法),SEEDS(Superpixels Extracted via Energy…

docker-compose单机部署rocketmq集群(双主双从,同步双写)

1.本文以RocketMQ 5.3.0 版本的镜像为例。 2.首先先更新docker,之前旧版docker,导致rocketmq一直起不来,一直报错。 3.安装docker-compose。 服务器环境(目前只用192.168.25.135后期改ip地址即可) | 1 | 192.168.…

ArcGIS图斑导出CAD后变成三维多段线?

欢迎关注同名微信公众号,更多文章推送: 正常情况下,将ArcGIS中的图层导出为CAD,生成的是闭合多段线: 导出的CAD: 但是有时候导出的CAD变成三维多段线: 三维多段线有多麻烦用过CAD画图的人应该都…

【GD32 MUC 移植教程】从 GD32F10x 移植到 GD32F30x

1. 前言 对于使用 GD32 系列微控制器进行产品开发的设计人员来说,因产品及功能升级,往往需要将一种微控制器替换成另一种微控制器,在保留既有功能的情况下增加新功能。为了更快地推出新产品,设计人员经常要将应用程序移植到新的…

【数据分享】1999—2022年地级市各类交通工具的客货运量和拥有量数据(Shp/Excel格式)

在之前的文章中,我们分享过基于2000-2023年《中国城市统计年鉴》整理的1999-2022年地级市的人口相关数据、各类用地面积数据、污染物排放和环境治理相关数据、房地产投资情况和商品房销售面积、社会消费品零售总额和年末金融机构存贷款余额、一般公共预算收支状况、…

Transformer模型-4-Inputs

Encoder的输入层和Decoder的输入层是一样的结构,都是由Token embedding(词向量 word embedding) 和 Positional embedding(位置向量) 组合而成,并到最终的 输入向量x。 Transformer引入Positional embedding主要是解决词序问题。…

开源程序实操:岩土工程渗流问题的有限单元法应用

有限单元法在岩土工程问题中应用非常广泛,很多商业软件如Plaxis/Abaqus/Comsol等都采用有限单元解法。尽管各类商业软件使用方便,但其使用对用户来说往往是一个“黑箱子”。相比而言,开源的有限元程序计算方法透明、计算过程可控,…

Linux configure.ac:51: error: possibly undefined macro: AC_MSG_ERROR

bug: 解决方法: cd /usr/local/share/autoconf/autoconf  cp *.m4 /usr/share/aclocal

编程语言中的特殊类的设计

文章目录 不能被拷贝的类只能在堆上创建对象的类:方式一方式二 设计类只能创建栈对象实现类, 不能被继承单例模式设计饿汉模式懒汉模式线程安全问题 不能被拷贝的类 c98 只声明(不生成, 编译器默认会生成, 有浅拷贝等的问题), 不实现, 并将其访问设为private c11使用delete来…

Python数据可视化库之bqplot使用详解

概要 在数据科学和机器学习领域,数据可视化是理解和分析数据的重要工具。bqplot 是一个基于 Jupyter Notebook 的 Python 可视化库,专注于交互式数据可视化。它结合了 D3.js 的强大功能和 Python 的易用性,使用户能够在 Jupyter 环境中创建丰富的交互式图表。bqplot 的设计…

如何使用GPT画出带中文的图和表?-已解决GPT画图表出现乱码的问题

众所周知,GPT的中文库有点问题,要求他画带中文的图或表存在中文的时候,就会出现乱码或者方框。 可以发现,GPT的中文库有问题,那么该如何解决这个问题呢? 直接在promote的时候上传你需要它使用的字体&…