文章目录
- 原文
- 总结与评价
- CNN-RNN vs 三维卷积
- 作者的方法
原文
[1]欧阳文汉.反人脸图像欺诈的活体识别方法研究[D].浙江大学,2020.DOI:10.27461/d.cnki.gzjdx.2020.002675.
总结与评价
时序运动信息与传统的空间纹理信息相结合
基于相位平移的运动放大算法不错
视觉大小细胞通路
距离度量
双分支三维卷积模型
动态运动线索分支来模拟人眼视觉系统的大细胞通路,静态纹理信息分支模拟人眼的小细胞通路
基于相位平移的运动放大算法来提高人脸活体检测模型提取运动特征的效率和能力
CNN-RNN vs 三维卷积
CNN-RNN联合方法,先通过CNN网络对原始图像进行高维的特征抽取,从原始图像中提炼出维度较高的特征信息,这些特征信息经过提炼后往往尺寸较小,然后再输入到循环神经网络中的每一个时间节点中,从而有效的减小模型的规模。
仍然有一个无法解决的根本问题,就是不能从原始视频流中获取足够的低维特征信息。
采用三维卷积神经网络作为模型骨架来更好的提取时序运动特征,因为三维卷积不仅能够抽取出高维的抽象化特征,而且更能从较浅层的网络中把一些具象化的浅层特征同样进行概括
同时,三维卷积神经网络又能很好的在时域上进行信息抽取
作者的方法
1)基于运动特征的三维卷积人脸活体模型(3D替换2D)
单帧,都没有很明显的视觉线索来支撑这些图片是非活体样本的依据
2)基于相位平移的运动放大算法
既然运动特征信息的获取对于模型性能提升作用巨大,本章为了进一步获取更多的微小运动特征信息的放大细节,探究通过运动放大的算法来提取更多的时序运动信息
人脸面部血液的流动:人体皮肤表面反射率的规律性周期变化
较常用的运动放大算法包括拉格朗日算法以及线性的欧拉运动放大算法,复频域内相位平移运动放大算法
3)双分支的三维卷积模型
目的是用两条神经网络支路分别模拟人类视觉系统中的大细胞通路与小细胞通路,从而将空间中的静态纹理特征(小)和时间域中的动态运动特征(大)更好的进行结合,从而获得类似人类视觉系统的优异信息特征分析能力
两个分支不同的帧率
Mahalanobis 空间损失函数(基于马氏距离)无量纲