【菜鸡读论文】Face2Exp: Combating Data Biases for Facial Expression Recognition

news2024/11/24 12:43:32

【菜鸡读论文】Face2Exp: Combating Data Biases for Facial Expression Recognition

最近上海开始降温了,而且常常下雨,天气开始变得好冷啊!以前年轻的时候冬天经常穿的少,现在膝盖开始有点遭不住了,小伙伴们一定要保护好自己的膝盖啊!
在这里插入图片描述话不多说,你们的菜鸡我闪亮登场,让我们开始这周的读论文吧!
在这里插入图片描述
这是CVPR 2022的一篇文章,还算是非常新。这篇文章主要讲的就是在表情识别任务中存在数据类别不均衡的问题,比如happy类的表情样本可能就比较多,而这样就不可避免的会使得模型在预测的时候存在偏见,从而在不同表情类别上的预测精度参差不齐。那该如何解决这个问题?作者提出使用人脸识别(FR)数据集来进行训练,因为人脸识别数据集往往都是百万规模的,比起表情识别数据集大多了,数据集大了,自然就能接触到更多的不同特征的图片。
但是这也会引来另一个问题,就是使用FR数据集和FER数据集一起训练的时候,这两个数据集之间的类别分布也存在偏差,这该如何解决呢?作者提出引入一个反馈损失,用来对该偏差做出约束。那么,下面让我们具体来看看实现细节。

motivation

表情识别任务存在数据偏差问题,现有的研究只使用标记的面部表情数据集来解决数据偏差问题。与现有的FER方法相反,我们提出利用大型的无标记人脸识别(FR)数据集来增强FER。

FR(Face Recognition)数据集如Webface260M、MS-Celeb-1M 和VGGFace2都是百万级FR数据集,它们包含具有良好综合多样性的人脸图像(即不同的姿态、身份、照明变化,和不同的表情)。相比之下,最大的公共FER数据集(Facial Expression Recognition)只包含440K张图像。然而,这不可避免地提出了另一个数据偏差问题,因为FER数据和FR 数据的分布不匹配,如图所示
在这里插入图片描述
本文的贡献如下:
1、我们解释了两个数据偏差,即FER数据中的类别不平衡和FR和FER数据之间的类别分布不匹配,提出模型Meta-Face2Exp,第一个利用大规模未标记FR数据来提高FER。我们认为Meta-Face2Exp提供了一个通用的框架,利用大规模的未标记FR数据用于其他与面孔相关的缺乏高质量的数据的任务(例如,性别/种族分类,年龄估计) 。

2、我们提出了Meta-Face2Exp框架,通过元优化框架从辅助FR数据中提取去偏信息。

3、我们在广泛使用的FER基准上进行了广泛的实验,包括AffectNet和RAFDB ,以证明我们的Meta-Face2Exp框架的有效性。具体来说,Meta-face2exp使用仅10%的标记FER数据,获得了与最先进的FER方法相比较的结果。

模型架构

首先,我们整体的来看一下这个网络。通过一个采样模块Smp(·)在FER数据集进行采样,以确保类平衡(具体来说就是在不同表情类别上采相同个数的图片)。接下来将这些数据送入基础网络(Base Network)进行训练。之后,使用基础网络在FR数据集上生成伪标签。自适应网络基于伪标签在无标签数据集FR上进行训练。

利用Meta-Face2Exp的去偏机制,根据有偏FR数据和去偏FER数据之间的认知差异,根据适应网络的反馈,逐步改进基础网络。

因此,基础网络可以产生更好的伪标签,用于训练下一代的自适应网络。
在训练过程中,A网络和B网络交替进行更新。在推理阶段,只将自适应模型A用于面部表情预测
在这里插入图片描述
我们来详细看一些右边的这幅图

我们估计了初始的自适应网络(即,用FER数据进行训练),并观察到一个严重倾斜的蓝色精度分布。之后,我们可以观察到越来越平坦的精度分布(即红色准确度分布)从训练步骤1到T的去偏置机制。.同时,基于对平衡的FER数据的反馈,将预测的FR标签一般从悲伤、中性表达校正为快乐表情。

在这里插入图片描述下面我们来看看模型的各个部分:

Adaptation Network(A)
对于自适应网络,由于FR数据具有丰富和全面的多样性,因此利用大规模未标记的FR数据来增强FER。
自适应网络使用无标签的FR数据进行训练,使用基础网络生成的伪标签,希望自适应网络和基础网络可以有相似的预测条件分类分布。

伪标签在训练过程中会动态变化。
在这里插入图片描述
Base Network (B)
采用一个采样模块Smp(·),以确保FER的类分布 数据平衡。具体来说,我们在每个面部表情类上随机选择相同数量的样本,这确保了训练基础网络生成平衡的类。
使用三个损失supervised loss, consistency loss, and feed back loss指导基础网络的学习过程,具体来说,监督损失和一致性损失只适用于基础网络,而反馈损失考虑了自适应网络的元测试的性能
在这里插入图片描述Supervised learning with FER data:
这个损失就是一个分类损失
在这里插入图片描述Consistency learning with FR data:
这是一个一致性损失
在一致性学习方面,基础网络要求原始图像和增强的对应图像具有接近的类条件分布。

在这里插入图片描述
这里的Aug()指的就是数据增强
如图所示,,图像生成有三种类型的增强,包括左框上所有数据的常规变换(随机裁剪、旋转和水平翻转),右框上的FR数据的广泛图像变换(即旋转、移除和像素级图像处理),以及顶框上的表情增强。
考虑到面部表情与面部标志密切相关,我们通过覆盖与面部表情无关的区域来增强面部图像来纯化面部表情特征提取。具体的 最后,我们应用MTCNN 检测5个面部标志,并通过经验确定以标志为中心的斑块,即眼睛50×20像素,鼻子和嘴50×40像素,以及224×50像素 用于前额。

在这里插入图片描述Feedback learning with FR data:
其中,f估计了FR和FER数据之间的认知差异的反馈,以帮助更新基础网络的参数。反馈系数f的定义可以表示为
在这里插入图片描述

其中,f表示为两项的点积。第一项:新的自适应网络在去偏置FER数据上的梯度。第二项:旧的自适应网络在偏FR数据上的梯度。如果两个项具有相同/不同的梯度符号,则根据当前梯度的相同/不利条件更新基础网络。点积的绝对值决定了梯度更新的强度。

在这里插入图片描述Algorithm for Meta-Face2Exp
让我们来看一下完整的算法流程
首先,基础网络从类平衡的FER数据中学习先验表达知识,从而在伪标签生成过程中产生更多的无偏表情预测(B→A)。其次,自适应网络比较去偏FER数据上的认知差异(即更新参数前后),利用反馈损失来更新基础网络的学习,明确解决了FR和FER数据之间的类分布不匹配(A→B)。最后,即使没有标记,自适应网络也具备了去偏表达知识。
在这里插入图片描述

结果展示

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/58361.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Go字符串拼接6种方式及其性能测试:strings.builder最快

Go字符串拼接常见的方式有加号、fmt.Sprintf、strings.Builder、bytes.Buffer、strings.join、切片。 package concat_stringimport ("bytes""fmt""strconv""strings""testing" )const numbers 100// func BenchmarkStri…

Kafka安装与配置

1、Java环境为前提 (1)上传jdk-8u261-linux-x64.rpm到服务器并安装: rpm -ivh jdk-8u261-linux-x64.rpm (2)配置环境变量: vim /etc/profile # 生效 source /etc/profile # 验证 java -version 2、Zook…

贝叶斯定理~~概率分布

还是搬来了基础自己学习用哦 ~~ 从最基础的概率论到各种概率分布全面梳理了基本的概率知识与概念,这些概念可能会帮助我们了解机器学习或开拓视野。这些概念是数据科学的核心,并经常出现在各种各样的话题上。重温基础知识总是有益的,这样我们…

适应性哈夫曼编码(Adaptive Huffman coding)

适应性哈夫曼编码适应性哈夫曼编码简介算法示例适应性哈夫曼编码 简介 适应性哈夫曼编码(Adaptive Huffman coding),又称动态哈夫曼编码(Dynamic Huffman coding),是基于哈夫曼编码的适自适应编码技术。它…

深度学习Day07

Recurrent Neural Network 智慧客服——Slot Filling 根据上 下文产生不同的output

Java搭建宝塔部署实战毕设项目WMS仓库管理系统源码

大家好啊,我是测评君,欢迎来到web测评。 本期给大家带来一套Java开发的毕业设计项目WMS仓库管理系统源码。 技术架构 技术框架:SpringMVC Mybatis Ehcache bootstrap jquery mysql5.7运行环境:jdk8 nginx1.20 tomcat9 In…

基于PSO粒子群算法的MPPT最大功率跟踪Simulink仿真,PSO采用S函数实现

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 MPPT控制器的全称是“最大功率点跟踪”(Maximum Power Point Tracking)太阳能控制器,是传统太阳能充放电控制器的升级换代产品。MPPT控制器能够实时侦测太阳能…

30岁自学Python转行靠谱吗?

前言 30岁自学Python转行靠谱吗?若啃学习任何时候都不晚,关键是学习完用来做什么。提高工作效率,写些脚本实现自动化办公这些完全没问题。如果学python是为了转开发,建议慎重考虑,程序开发转Python相对容易些&#xf…

[附源码]计算机毕业设计血库管理系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

计算机网络——运输层【重点】

运输层概述 概念 进程之间的通信 从通信和信息处理的角度看,运输层向它上面的应用层提供通信服务,它属于面向通信部分的最高层,同时也是用户功能中的最低层。当网络的边缘部分中的两个主机使用网络的核心部分的功能进行端到端的通信时&…

【SpingBoot拦截器】实现两个接口,配置拦截路径

文章目录SpingBoot拦截器拦截器与过滤器的区别:1.HandlerInterceptor接口2.WebMvcConfigurer接口3.示例:SpingBoot拦截器 【SpringWeb框架中的拦截器作用类似于过滤器,都可以对一个请求进行拦截处理。】 我们可以用拦截器做很多事情&#xf…

使用HTML制作静态网站作业——我的校园运动会(HTML+CSS)

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

Java项目:SSM企业门户网站

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 本项目分为前后台,前台主要用于官网展示,后台主要为管理员管理, 管理员角色包含以下功能: 管理员…

Rook Ceph浅谈

storageclass是最省心的,上面三种删除了容器存储还在 下图是管理员定义pv,用户不知道这些细节 PersistentVolume pv会跟后端的存储rbd对接 用户通过PVC调用PV ,根据10G容量去pv里找相匹配的自动关联 上图就叫 pvc-demo StorageClass 更厉害 管理员…

PostgreSQL 内核可观测性体系

文章目录背景Metricspgstat指标展示指标统计相关的guc 参数pgstat 实现pg_stat_statements基本用法及指标内容pg_stat_statements 实现Trace总结背景 PG 作为一个演讲30多年历史的TP 数据库,其复杂度极高,如果帮助DBA 在线上分析复杂查询的问题或者构建…

Nexus私服(二)

(一) SpringBoot配置Maven发布至Nexus私服 Nexus默认会带有四常用个仓库,maven-central、maven-public、maven-releases、maven-snapshotsmaven-central类型是proxy代理类型,地址是指向maven中央仓库地址https://repo1.maven.org/maven2/maven-releases、…

空间复杂度(Space Complexity)

预计阅读时间:10分钟 一、简介 随着计算机空间的发展,空间复杂度逐渐变得不那么重要了,但它在比赛中仍然存在。 推导方法: 用常数1取代运行时间中的所有加法常数。 在修改后的运行次数函数中,只保留最高阶项。…

[附源码]Python计算机毕业设计Django旅游网的设计与实现

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

2013-2020年全国31省数字经济信息化基础数据

2013-2020年全国31省数字经济信息化基础 1、时间:2013-2020年 2、来源:国家统计J和统计NJ 3、范围:31省 4、指标包括: "光缆线路长度(公里)、移动电话基站(万个)、信息传输、软件和信息技术服务业…

基于模糊BP神经网络轨迹跟踪(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…