文章目录
- Deepfake Video Detection Using Convolutional Vision Transformer
- key points
- **卷积视觉变压器**
-
- FL
- ViT
- 实验
- 总结
Deepfake Video Detection Using Convolutional Vision Transformer
会议/期刊:2021
作者:
key points
提出了一种用于检测深度伪造的卷积视觉变压器【CNN+VIT】
CNN提取可学习的特征,而ViT将学习到的特征作为输入,并使用注意机制对其进行分类。
我们的工作基于[10,11]指出的Deepfake检测方法的两个弱点:数据预处理和通用性。
我们提出了一种广义卷积视觉变压器(CViT)架构,使用卷积神经网络和变压器架构来检测Deepfake视频。
称我们的方法是一般化的,主要有三个原因。
1)我们提出的模型利用Transformer的注意力机制,利用CNN和Transformer架构学习局部和全局图像特征[6]。
2)我们在训练和分