【菜鸡读论文】Former-DFER: Dynamic Facial Expression Recognition Transformer

news2024/11/28 4:33:27

Former-DFER: Dynamic Facial Expression Recognition Transformer

哈喽,大家好呀!本菜鸡又来读论文啦!先来个酷炫小叮当作为我们的开场!
粉红爱心泡泡有没有击中你的少女心!看到这么可爱的小叮当陪我们一起读论文,是不是感觉瞬间充满动力了呢!突然想到下次确实可以搞一个漂亮妹妹的动图,让漂亮妹妹陪我们一起读论文,不知道大家有没有什么好建议呢!
在这里插入图片描述不知不觉!今天竟然是冬至了!感觉时间真的过得好快,在我们老家,冬至应该吃饺子,不过我也是突然想起来这回事,因为我早上起的太晚了,竟然睡到快11点才醒。其实,我最近有点失眠,就很害怕早上起来看到手机时间才六点或七点这样,因为这样的话,我就要接着努力去睡觉,没想到今天早上起来竟然已经快11点了,感觉像是另一种惊吓。

昨天晚上看了一部电影《伊甸湖》,后劲儿还挺大的,差不多八点看完,结果一直难受到十点多,真的太让人难受了。如果没有看过这部电影的小朋友可以去看一看,真的挺不一样的,我是第一次看这种题材,后来发现竟然还是真实故事改变,更难受了。好像还有一些同类型的电影,不过我应该要再缓缓才能接着看别的电影了。
话不多说,让我们在小叮当的陪伴下,来看今天的论文:

在这里插入图片描述在现实生活中的表情序列识别存在一些挑战,比如遮挡、非额叶姿势和头部运动。如下图:

在这里插入图片描述
基于这些问题,作者提出dynamic facial expression recognition transformer(Former-DFER)。Transformer的自注意力机制可以学习到区域面部特征的相关性以及时间上面部特征之间的相关性,具有处理以上挑战的能力。(哦对了!这篇论文还有github代码,我也去跑了一下,可以跑出来,大家放心去试)
下面,让我们来看一下这个模型的架构图,可以看到这个模型包括两个部分(绿色和蓝色)
1、convolutional spatial transformer(CS-former)
CS-former由五个卷积块和N个空间编码器组成,旨在引导网络从空间角度学习遮挡和姿态稳健的面部特征。
2、temporal transformer(T-former)
T-former由M个时间编码器组成,旨在允许网络从时间的角度学习上下文的面部特征。
在这里插入图片描述
接下来我们详细来看这两个模块的细节

CS-Former

CS-former由五个卷积块和N个Spatial Encoder组成

在这里插入图片描述
输入:首先把视频序列分成U段,接下来从每段序列中间取V帧,最终共输入U*V帧
输入帧首先通过四个卷积块来提取特征映射图,接下来将一个通道数为C的特征映射图组在通道维度上拉成一组序列,如上图所示,加上位置嵌入后,送入编码器,自注意机制的计算如下所示:

在这里插入图片描述在这里插入图片描述
可以将四个卷积块的作用看做是提取局部特征,Spatial Encoder用于提取全局特征,可以看到从Spatial Encoder出来之后又连上一个卷积块,该卷积块的作用相当于对特征进行提炼。

T-Former

每一帧经过CS-Former都会得到一个特征表示,一组帧经过CS-Former会得到一个序列,为了最后的分类,我们增加一个Class Token,如图所示。接下来,加上一个Temporal Positional Embedding来表示时间顺序。

在这里插入图片描述Temporal Encoder的计算流程,如下所示:
在这里插入图片描述
在这里插入图片描述
整个模型就是这样,接下来就是实验部分了,放上一些实验结果图:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/3775.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

有了PySnooper,不用print、不用debug轻松查找问题所在!

PySnooper是一个非常方便的调试器,它是通过python注解的方式来对函数的执行过程进行监督的。 应用起来比较简单,不用一步一步的去走debug来查找问题所在,并且将运行过程中函数的变量值打印出来结果一目了然,相当于替代了print函数…

Boundary Loss 原理与代码解析

paper:Boundary loss for highly unbalanced segmentation Introduction 在医学图像分割中任务中通常存在严重的类别不平衡问题,目标前景区域的大小常常比背景区域小几个数量级,比如下图中前景区域比背景区域小500倍以上。 分割通常采用的交…

SpringBoot实践(三十三):Maven使用及POM详解

文章目录maven是什么maven怎么装settings.xml本地仓库地址:localRepository远程镜像:mirrorsJDK 版本:profile私服配置POM.xml中的常用标签projectmodelVersiongroupIdartifactIdversionpropertiesdependenciesbuild和pluginsresourcesdepend…

【学生管理系统】用户登录三种验证方式—图片验证、短信验证、邮件验证

目录 一、页面需求展示 二、验证方式—按钮组件 三、手机短信验证 四、邮件验证 五、图片验证邮件验证 &#x1f49f; 创作不易&#xff0c;不妨点赞&#x1f49a;评论❤️收藏&#x1f499;一下 一、页面需求展示 二、验证方式—按钮组件 2.1前端 <el-form-item labe…

【Linux】第十章 进程间通信(管道+system V共享内存)

&#x1f3c6;个人主页&#xff1a;企鹅不叫的博客 ​ &#x1f308;专栏 C语言初阶和进阶C项目Leetcode刷题初阶数据结构与算法C初阶和进阶《深入理解计算机操作系统》《高质量C/C编程》Linux ⭐️ 博主码云gitee链接&#xff1a;代码仓库地址 ⚡若有帮助可以【关注点赞收藏】…

工作流的例子

工作流的例子目录概述需求&#xff1a;设计思路实现思路分析1.配置bean2.examples3.no bean4.activiti-api-basic-process-example5.taskspringweb参考资料和推荐阅读Survive by day and develop by night. talk for import biz , show your perfect code,full busy&#xff0c…

C++ 多态类型

多态 C在面向对象中&#xff0c;多态就是不同对象收到相同消息&#xff0c;执行不同的操作。在程序设计中&#xff0c;多态性是名字相同的函数&#xff0c;这些函数执行不同或相似的操作&#xff0c;这样就可以用同一个函数名调用不同内容的函数。简而言之“一个接口&#xff…

2022 国赛postgresql

安装postgresql配置postgresql [root@linux3 ~]# postgresql-setup --initdb //初始化数据库Initializing database in ‘/var/lib/pgsql/data’Initialized, logs are in /var/lib/pgsql/initdb_postgresql.log[root@linux3 ~]# systemctl enable postgresql.service Created …

澳洲最热门职业,护士排第一,医生竟然不如程序员?

2022澳洲最新的职业紧缺名单出炉了&#xff0c;令人惊讶的是护士竟然排行第一名&#xff0c;可见澳洲的医疗人力资源紧缺的问题。 既然人力资源紧缺&#xff0c;那么首当其冲的医生作为高学历且同属医疗行业的代表理应收到重视&#xff0c;然而令人意外的是&#xff0c;通过榜单…

Linux一篇入门(以Ubuntu为例)

一、Linux与Windows区别 Linux&#xff1a;无盘符&#xff0c;只有一个根目录&#xff08;/&#xff09; Windows&#xff1a;有盘符 二、目录相关常见命令 Linux命令格式&#xff1a; cmd -option parameter cdm命令&#xff0c;就是一个操作 parameter一般是要做的对象…

韩国程序员面试考什么?

大家好&#xff0c;我是老三&#xff0c;在G站闲逛的时候&#xff0c;从每日热门上&#xff0c;看到一个韩国的技术面试项目&#xff0c;感觉有点好奇&#xff0c;忍不住点进去看看。 韩国的面试都考什么&#xff1f;有没有国内的卷呢&#xff1f; 可以看到&#xff0c;有8.…

抽象类和接口

文章目录 前言 一、今日回顾 1.《高等数学》 2.阅读&#xff1a; 3.英语&#xff1a; 二、编程的那些事 1.引入库 2.读入数据 总结 前言 一、今日回顾 1.《高等数学》 2.阅读&#xff1a; 3.英语&#xff1a; 二、编程的那些事 1.抽象类的描述 在java中&#xff0…

一次函数与二次函数的联系

首先&#xff0c;无论是一次函数还是二次函数&#xff0c;都是函数&#xff0c;所以便可以从表达式&#xff0c;图像&#xff0c;函数的四个性质&#xff08;即有界性&#xff0c;单调性&#xff0c;奇偶性&#xff0c;周期性&#xff09;去看他们之间的联系 一次函数与二次函…

2022第8届中国大学生程序设计竞赛CCPC桂林站, 签到题4题

文章目录A. LilyM.Youth FinaleC.Array ConcatenationE.Draw a triangleA. Lily A. Lily time limit per test1 second memory limit per test512 megabytes inputstandard input outputstandard output They serve the purpose of changing hydrogen into breathable oxygen,…

MySQL数据库 -- 库和表的操作

关于数据库方面&#xff0c;还是需要多多练习的&#xff0c;否则很多指令不容易记住&#xff0c;所以大家也要在自己的电脑上多写写&#xff0c;熟悉熟悉~ 目录 库的操作 创建数据库 操纵数据库 查看数据库 显示创建语句 修改数据库 数据库的删除 数据库备份和恢复 …

重学数据库基础

幸福找到我&#xff0c;幸福说&#xff1a;“瞧这个诗人&#xff0c;他比我本人还要幸福” 一、数据库相关概念 数据库 存储数据的仓库&#xff0c;数据是有组织的进行存储英文&#xff1a;DataBase&#xff0c;简称 DB 数据库管理系统 管理数据库的大型软件英文&#xff1a;Da…

CSI室内指纹定位——相关通信名词解释

目录 1、无线信道 2、时域与频域 3、信道频率响应&#xff08;Channel Frequency Response,CFR&#xff09; 4、信道冲激响应&#xff08;Channel Impulse Response, CIR&#xff09; 5、信道带宽 6、带宽 7、子载波 9、波长 10、频率 11、振幅 12、相位 13、相位差…

高数值孔径(NA)物镜的聚焦分析

1. 摘要 高NA物镜广泛用于光刻&#xff0c;显微等技术。因此&#xff0c;聚焦仿真中考虑光的矢量性质至关重要。VirtualLab可以非常便捷地对此类镜头进行光线追迹和场追迹分析。通过场追迹&#xff0c;可以清楚地观察由于矢量效应引起的聚焦光斑失对称现象。利用相机探测器和电…

第十四届蓝桥杯(Web应用开发)模拟赛1期-大学组

数据类型检测 请看这篇数据类型检测 渐变色背景生成器 html <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><meta name&…

java面试官:程序员,请你告诉我是谁把公司面试题泄露给你的?

前情提要&#xff1a; 面试官&#xff1a;你好&#xff01;请先做一下自我介绍&#xff01; 程序员&#xff1a;balabalabala... 前戏先过了.... 面试官&#xff1a;先介绍SpringCloud核心组件及其作用 程序员&#xff1a;SpringCloud由以下5个核心组件构成...另外&#x…