Masked Relation Learning for DeepFake Detection

news2024/10/6 10:31:15

一、研究背景
1.现有deepfake检测方法大多关注于局部伪影或面部不协调,较少挖掘局部区域间的关系。
2.现有关系挖掘类的工作往往忽略了关系信息的传播。
3.遮挡建模在减轻信息冗余的同时促进高级语义信息(诱导性偏差较小)的挖掘,有助于提升网络的泛化性能。

二、研究动机
1.Deepfake技术会单独操纵视频中的每一帧,伪造结果缺乏时间连贯性。基于视频的检测技术更加关注相邻帧之间的时间不连贯性和时空不一致性,可降低对空间伪影的依赖并提升泛化性能。
2.将关系特征作为一种泛化模式可以提升检测性能,但大量的冗余关系信息会阻碍信息的表达。遮挡建模能减少信息的冗余,迫使模型习得更具泛化性的内在特征。

三、研究目标
从区域级关系中学习通用的鉴别性特征,减轻对视觉伪影的依赖。

四、技术路线

  • 本文将deepfake检测任务定义为图分类问题,每个面部区域作为一个图的结点,并对结点间的关系进行建模。
  • 对部分关系进行屏蔽,减少冗余并促进模型对全局结构的感知
  • 实现在无监督的情况下定位面部伪造区域。
    在这里插入图片描述

1.时空注意力模块(STA):
学习不同面部区域的注意力特征。

  • 将特征图 F 0 t F_{0}^t F0t转换为注意力图 F A t F_{A}^t FAt
  • 用注意力图强调特征图得到注意力特征图 F t F^t Ft
  • 对注意力特征图进行平均归一化得到注意力特征向量 V t V^t Vt
    在这里插入图片描述
  • 设置正交多样性损失 L o d L_{od} Lod使不同注意力特征向量关注不同面部信息
  • T为视频片段划分数量, V t ∈ R N ∗ C V^t\in \mathbb{R}^{N*C} VtRNC N N N为注意力头数量, I I I为单位阵
  • (4)使不同注意力头的输出差异尽可能大
    在这里插入图片描述
  • 设置时间一致性损失 L t c L_{tc} Ltc,使每个注意力头在时间维度上追踪各自区域
  • (5)使相邻帧之间的注意力向量保持一致
    在这里插入图片描述

2.遮挡关系学习模块(MRL):
屏蔽部分区域间的相关性以减少信息冗余,以此促进对本质特征的学习并捕获全局视角下的不规则关系。

  • 最小屏蔽策略:计算门限值 q q q p p p为预定义参数
    在这里插入图片描述

  • 随机屏蔽策略:根据伯努利分布采样 η \eta η
    在这里插入图片描述

  • 利用TGCN捕获不规则关系:TGCN由GCN和GRU构成

  • 在这里插入图片描述

  • 对特征关系图进行图卷积计算
    在这里插入图片描述

  • 对隐藏层进行图卷积计算
    在这里插入图片描述

  • 更新隐藏层
    在这里插入图片描述
    3.特征分类
    在这里插入图片描述
    4.损失函数
    在这里插入图片描述
    5.算法流程
    在这里插入图片描述
    在这里插入图片描述
    五、实验结果
    Although our method has sub-optimal performance on FF++(HQ), it outperforms state-of-the-art approaches on detecting
    unseen deepfake datasets. Strong generalization ability is one of the pursuits of deepfake detection. Our method effectively promotes the generalization ability of detectors.
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    Hereby we localize the fake regions by Grad-CAM in Fig. 9. We observe that our method can highlight the fake regions of
    manipulated faces. For instance, NeuralTextures only modifies the mouth region
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1211939.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java常用的几个图片处理工具对Tiff文件的支持

ImageMagick 官网 https://imagemagick.org/, 支持多种格式。命令行工具很适合调试。功能很强大. 还有一款工具GraphicsMagick 是从ImageMagick的基础上研发出来的。 OpenCV 官网 https://opencv.org/ , github地址https://github.com/opencv/opencv&…

ruoyi若依前端请求接口超时,增加响应时长

问题: 前端查询请求超时 解决: 找到request.js的timeout属性由10秒改成了20秒,因为默认是10秒,请求肯定是超出了10秒 祝您万事顺心,没事点个赞呗,关注一下也行啊,有啥要求您评论哈

父组件用ref获取子组件数据

子组件 Son/index.vue 子组件的数据和方法一定要记得用defineExpose暴露&#xff0c;不然父组件用ref是获取不到的&#xff01;&#xff01;&#xff01; <script setup> import { ref } from "vue"; const sonNum ref(1); const changeSon () > {sonNum.…

FSOD论文阅读 - 基于卷积和注意力机制的小样本目标检测

来源:知网 标题:基于卷积和注意力机制的小样本目标检测 作者:郭永红&#xff0c;牛海涛&#xff0c;史超&#xff0c;郭铖 郭永红&#xff0c;牛海涛&#xff0c;史超&#xff0c;郭铖&#xff0e;基于卷积和注意力机制的小样本目标检测 [J/OL]&#xff0e;兵工学报. https://…

行情分析——加密货币市场大盘走势(11.15)

大饼按照预期等待下跌即可&#xff0c;现在已经下跌到35500&#xff0c;昨日晚上跌破了35000&#xff0c;现在放心大胆空。笔者现在都是空单在手。 空单策略&#xff1a;入场36000附近 止盈34000-32000 止损39000 以太昨日策略进场&#xff0c;已经止盈了&#xff0c;最低跌到…

记录我常用的免费API接口

目录 1.随机中英文句子 2.随机中英文句子&#xff08;带图片和音频&#xff09; 3.随机一句诗 4.随机一句话 5.随机一句情话 6. 随机一句舔狗语录 7.历史上的今天 8.获取来访者ip地址 9&#xff1a;获取手机号信息 10. 垃圾分类查询 11.字典查询 12.QQ信息查询 1.随…

RFID技术在危险废物管理中的应用解决方案

一、背景介绍 随着我国经济的快速发展&#xff0c;轻纺、化工、制药、电子等行业的危险废物排放量逐年增加。然而&#xff0c;由于危险废弃物处理不当&#xff0c;可能导致大气、水体和土壤污染&#xff0c;对环境和人体健康造成严重威胁&#xff0c;制约了经济和健康的可持续…

Docker Rootfs

一、rootfs 介绍 rootfs 是一个操作系统所包含的文件、配置和目录&#xff0c;并不包括操作系统内核。在 Linux 操作系统中&#xff0c;这两部分是分开存放的&#xff0c;操作系统只有在开机启动时才会加载指定版本的内核镜像。 实际上&#xff0c;同一台机器上的所有容器&am…

墨西哥专线一次最多发几条柜?

墨西哥专线一次最多发几条柜这个问题涉及到海运业务中的一些复杂因素。墨西哥是一个重要的贸易国家&#xff0c;其与美国和加拿大之间的贸易往来非常频繁&#xff0c;因此海运业务也非常活跃。在墨西哥专线上&#xff0c;一次最多发几条柜通常取决于以下几个因素&#xff1a; 1…

4+糖酵解+预后模型,结合预后模型为文章加分,思路值得模仿

今天给同学们分享一篇生信文章“A glycolysis-related two-gene risk model that can effectively predict the prognosis of patients with rectal cancer”&#xff0c;这篇文章发表在Hum Genomics期刊上&#xff0c;影响因子为4.5。 结果解读&#xff1a; COAD和READ之间的…

模组知识(1)-CRA-光学知识

&#xff03;灵感&#xff03; CRA算是光学基础知识的一部分&#xff0c;而且最近项目确实color shading 挺严重的。以前记的知识不全&#xff0c;这次再次整理一下。常学常新。 目录 sensor CRA&#xff1a; CRA &#xff1a; Lens CRA: lens CRA和sensor CRA不同大小关…

python基于图卷积神经网络GCN模型开发构建文本数据分类模型(以论文领域数据为例)

GCN&#xff08;Graph Convolutional Network&#xff09;图卷积神经网络是一种用于处理图数据的深度学习模型。它是基于图结构的卷积操作进行信息传递和特征学习的。 GCN模型的核心思想是通过利用邻居节点的特征来更新中心节点的表示。它通过迭代地聚集邻居节点的信息&#x…

百望云斩获“新华信用金兰杯”ESG优秀案例 全面赋能企业绿色数字化

近年来&#xff0c;中国ESG蓬勃发展&#xff0c;在政策体系构建、ESG信披ESG投资和国际合作等方面都取得了阶段性成效&#xff0c;ESG生态不断完善。全社会对ESG的认识及实践也在不断深化&#xff0c;ESG实践者的队伍在不断发展壮大。 ESG作为识别企业高质量发展的重要指标&…

2023年 华为杯数学建模 E题

本科大三的时候&#xff0c;打过一次美赛&#xff0c;当时租了一个民宿&#xff0c;和队友一起度过了专注的四天。当时比赛结束之后&#xff0c;拿着手机&#xff0c;看到四天没回的消息&#xff0c;四天没刷过的朋友圈&#xff0c;有种很新奇的感觉&#xff0c;谢谢美赛给了我…

AM335x核心板LCD信号导致DDR3内存不稳定

调试核心板时&#xff0c;碰到了点问题&#xff0c;DDR3内存始终不稳定&#xff0c;经过仔细调试&#xff0c;发现只要打开LCD显示&#xff0c;DDR3的数据就不定期的会有错误。为此单独在boot下做过内存测试&#xff0c; 就是每个地址都往里写0,0xffffffff&#xff0c;再写0x55…

【坑】idea终端下执行maven命令行报错:mvn clean install -Dspring.profiles.active=dev

直接看报错信息 解决方法 方法一 命令改为&#xff1a;mvn clean install -Dspring.profiles.activedev方法二 使用 cmd 进入命令行执行&#xff1a;mvn clean install -Dspring.profiles.activedev在新版本中的idea终端已经默认使用了类似windons10下的PowerShell窗口的风格…

『亚马逊云科技产品测评』活动征文|阿里云服务器亚马逊服务器综合评测

授权声明&#xff1a;本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 Developer Centre, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道 文章目录 引言一、亚马逊&阿里云发展历史介绍1.1 亚马逊发展历史1.2…

【图像分类】【深度学习】【Pytorch版本】 GoogLeNet(InceptionV3)模型算法详解

【图像分类】【深度学习】【Pytorch版本】 GoogLeNet(InceptionV3)模型算法详解 文章目录 【图像分类】【深度学习】【Pytorch版本】 GoogLeNet(InceptionV3)模型算法详解前言GoogLeNet(InceptionV3)讲解Factorized Convolutions卷积分解InceptionV3结构ⅠInceptionV3结构ⅡInc…

CSGO游戏搬砖项目需要掌握哪些基础知识?

CSGO搬砖之90%饰品商人都不知道的玄学皮肤盘点 CSGO游戏搬砖主要就是倒卖装备&#xff0c;那具体是哪些装备&#xff0c;以及怎么去区分皮肤类型&#xff0c;今天童话就给大家介绍一下。 CSGO游戏搬砖虽然不要求会玩游戏&#xff0c;但是我们作为一个商人&#xff0c;要知道我…

Linux常用命令用法及实现方式有哪些?

接上一篇&#xff0c;它来啦&#xff01; 5.文本文件编辑命令 (1)touch命令&#xff1a;touch命令用于创建空白文件或设置文件的时间&#xff0c;语法格式为“touch [参数] 文件名称”。 (2)mkdir命令&#xff1a;mkdir命令用于创建空白的目录&#xff0c;英文全称为“make dir…