论文阅读-DF-Platter: Multi-Face Heterogeneous Deepfake Dataset(多人脸异构深度伪造数据集)

news2025/1/12 2:58:52

一、论文信息

文章名称:DF-Platter: Multi-Face Heterogeneous Deepfake Dataset

作者团队:

 会议:cvpr2023

数据集地址:http://iab-rubric.org/df-platter-database

二、动机与创新

动机

目前大多数研究工作都集中在个人外表受控的高质量图像和视频上。 但是,deepfake 生成算法现在能够创建具有低分辨率、遮挡和操纵多个拍摄对象的 deepfake,这给检测带来了新的挑战。

 创新

作者提出了DF-Platter数据集,该数据集模拟了deepfake生成的真实场景。

  • 使用多种技术生成的低分辨率和高分辨率深度伪造;

  • 带有印度种族面部图像的单主体和多主体深度伪造。

该数据集中的人脸根据性别、年龄、肤色和遮挡等各种属性进行注释。该数据集使用32个GPU和1,800GB的内存准备了116天,它包含三组共133,260个视频。

三、数据集

1、DF-Platter数据集,是一个多人脸异构的 deepfake 数据集。

  • 该数据集利用低分辨率视频生成 deepfakes,这与使用高分辨率视频合成插值 deepfakes 的现有数据集不同。 通过使用低分辨率视频,可以提高低分辨率 deepfakes 的视觉质量。这是因为deepfake 生成算法针对低分辨率视频进行了优化,从而产生了更高质量的 deepfake。

  • 该数据集是包含多个面部的deepfake集合,这意味着每个视频帧中有多个拍摄对象。视频帧中的每张脸都注释为真实或虚假,这样可以对多面部深度伪造进行全面评估。

  • 该数据集提供了具有印度种族主题的deepfakes的性别均衡分布。这意味着男性和女性受试者人数相等,而且受试者是印度裔。并根据性别、年龄、肤色和遮挡等各种属性进行注释。

 2、DF-Platter数据集是使用三种不同的技术生成的:FSGAN、FaceShifter和FaceSwap。 DF-Platter数据集在分辨率和性别之间是平衡的,且数据集中的所有视频提供两个压缩级别c23 和 c40。

 3、DF-Platter数据集中的视频是从 YouTube 收集的,YouTube 提供的视频种类繁多,包括性别、取向、肤色、脸部大小、光照条件、背景和遮挡等各不相同。 同时,使用Fitzpatrick量表测量肤色,这是一个数字分类系统,根据肤色对紫外线的反应对肤色进行分类。 当手、头发、眼镜或任何其他物体挡住源面部或目标面部的一部分时,就会发生遮挡

4、真实视频:1)Set A 共包含 602 个用于生成 deepfakes 的真实视频。这些视频的性别和分辨率分布几乎相等,有151个视频针对男性,150个视频针对女性。此外,所有视频都是以低分辨率和高分辨率收集的,每个视频的时长约为20秒。 2)Set B 采用 100 个真实视频来生成 deepfake,低分辨率和高分辨率视频的比例相等。这些视频在视频的一帧内有多个对象,这使得检测deepfakes变得具有挑战性。3)Set C 是使用 62 个真实视频生成的,这些深度伪造是在每帧的多个目标拍摄对象上粘贴名人面孔时生成的,涉及在单个帧中操纵多个面孔。 数据集包含三个压缩级别的所有集合,即 c0、c23 和 c40。

5、虚假视频:1)Set A 包含 130,696 个使用 FSGAN 和 FaceShifter 技术生成的单对象deepfake 视频。有150名女性受试者和151名男性受试者,并包括每个受试者的肤色、面部遮挡和表观年龄的注释。面部遮挡物各不相同,包括胡须、眼镜、帽子/头巾和头发,这些遮挡物存在于不受控制的环境中。 2)Set B 包含 900 个内部深度伪造视频,这些视频是使用 FSGAN、FaceSwap 和 FaceShifter 技术合成的。 Set B 中的每个真实视频至少有 2 个,最多 5 个拍摄对象,其中在生成虚假视频期间,最少 2 个,最多 3 个被交换。 3)Set C 与 Set B 类似,但特别关注印度名人作为deepfake视频中的来源面孔。 Set C 中使用的真实视频与单对象名人面孔交换,其中包含 62 个真实视频和 900 个 deepfake 视频。 DF-Platter 数据集的原始形式约为 417 GB,总共包含 133,260 个视频,每个视频的持续时间约为 20 秒。 4)视频以 MPEG4.0 格式提供,具有高分辨率和相应的低分辨率,所有视频的帧速率均为 25 fps。 该数据集在分辨率、压缩和所使用的生成技术方面始终包含相同的视频。 对于 c23 和 c40 级别的压缩,使用 H.264 视频压缩。

6、数据集使用各种属性进行注释,例如性别分辨率遮挡肤色

 

  • 性别分为两类,男性或女性。
  • 使用Fitzpatrick量表,每个受试者的肤色以1到6的等级进行注释,菲茨帕特里克量表是一种广泛使用的人类肤色分类系统。

  • 表观年龄属性分为三类:青少年(18 至 30 岁)、成人(30 至 55 岁)和老年(55 岁以上)。 51.33% 的受试者被归类为 “青少年”,42% 的受试者被归类为 “成人”,6.66% 的受试者被归类为 “老人”。

  • 面部遮挡分为八大类:阴影、胡须、眼镜、阴影、麦克风、帽子、头巾/围巾和头发遮挡。 这些属性本质上是二进制的,这意味着受试者要么有遮挡,要么没有遮挡。 胡子是男性中最常见的遮挡类型,大约90%的男性受试者有胡须。

7、数据集分为三组:训练、验证和测试。8:1:1,训练集包含 80% 的视频,而验证和测试集各包含 10% 的视频。 数据集中的视频被随机分配到三个集合,确保每组视频的深度伪造和真实视频的分布均匀。

 四、实验

三个问题:1)是否可以检测到被遮挡的深度伪造。2)是否可以检测到视频中的多面部深度伪造。3)是否可以检测到网络和社交媒体上的低分辨率和压缩的deepfakes。

三个协议:1) Occludeepfakes,使用SET A 作为测试集,分为三个子集用于训练、验证和测试。该数据集包含真实视频和虚假视频数量之间的显著差异,这可能会导致数据集出现偏差。为了解决这个问题,在训练不同的架构的同时重复真实的视频,以获得几乎相等数量的真实和虚假样本。然后对最先进的模型进行测试,以检测被遮挡的deepfakes,结果以三种压缩设置(c0、c23 和 c40)提供。

2)Multi-Face Deepfakes 使用SET B 和SET C 作为测试集。SET B 包含 500 个视频,其中 500 个真实帧和 4500 个假帧。每帧可以有一张或多张真面孔或假脸,如果操纵了至少一张脸,则视频被视为假脸。SET C 由481个视频组成,其中31个是真实的,450个是假的。这些模型在SET B 和 C 上进行了性能测试,这两个集合有多个受试者使用各种指标。

3)交叉分辨率和交叉压缩,实验以分析在网络和社交媒体上共享深度伪造的现实环境中现有深度伪造探测器的交叉分辨率和交叉压缩性能。在交叉分辨率实验中,模型在(c0,HR)样本上进行训练,并在(c0,LR)样本上进行测试。在交叉压缩实验中,模型在(c23,HR)样本上进行训练,并在(c40,HR)样本上进行测试。在这两个实验中,训练样本均取自SET A,并在所有三个集合上进行测试。

 这些方法在相同的压缩和分辨率设置下进行了训练和测试,以确保评估过程的一致性和公平性。

  • 评估是针对三组进行的:A组(协议1)、B组和C(协议2)。

  • 对于SET A,使用的评估指标是准确度 (%) 和 AUC(曲线下区域)。

  • 对于SET B 和 C,使用的评估指标是 FaceWA (%)、FaceAuc、FLA (%) 和 VLA (%)。 FaceWA (%) 是指正确识别的 deepfake 人脸的百分比,FaceAuc 是指接收器操作特征 (ROC) 曲线下方的面积,用于人脸水平检测,FLA (%) 是指正确识别的虚假视频的百分比。 -报告了每个集合和协议的评估结果,全面分析了DF-Platter数据集上deepfake检测模型的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722489.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【零基础入门学习Python---Python中安全编程和测试之快速入门实践】

🚀 零基础入门学习Python🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜…

Mysql基础之SQL语句

作定期复习和查询用,打开这篇博客提高效率,避免回视频或者百度上找 👂 无论你多怪异我还是会喜欢你(《刺客伍六七》动画推广版片尾曲) - 周子琰 - 单曲 - 网易云音乐 内容来自B站黑马Mysql,检索使用 附上…

浅析Lambda架构

大家好,今天我们来介绍一个用于亿级实时数据分析架构Lambda架构。 Lambda架构 Lambda架构(Lambda Architecture)是由Twitter工程师南森马茨(Nathan Marz)提出的大数据处理架构。这一架构的提出基于马茨在BackType和Tw…

Python GUI编程利器:Tkinker中的消息和文本(7)

小朋友们好,大朋友们好! 我是猫妹,一名爱上Python编程的小学生。 和猫妹学Python,一起趣味学编程。 今日目标 实现下面效果: 消息(Message类) 消息用于显示多行文本消息,对标签进行替代,如果…

【数学建模】国赛真题分析 2012 A题 葡萄酒的评价

2012 A题 葡萄酒的评价 优秀论文地址: 链接:https://pan.baidu.com/s/19WGpybgM6RncxTYhx61JRA?pwdvl22 提取码:vl22 –来自百度网盘超级会员V6的分享 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进…

GWIN入门-完整一个程序

GWIN入门-完整一个程序 新建工程 右击工程名,添加.v文件 编写功能文件 /* timescale是Verilog HDL 中的一种时间尺度预编译指令,它用来定义模块的仿真时的时间单位和时间精度。 */`timescale 1ns/1ps module LED(input wire clk

第三步:STM32F4时钟介绍

1.0 时钟系统框图 1.1 时钟系统知识 1. STM32 有5个时钟源:HSI、HSE、LSI、LSE、PLL。 ①、HSI是高速内部时钟,RC振荡器,频率为16MHz,精度不高。可以直接作为系统 时钟或者用作PLL时钟输入。    ②、HSE是高速外部时钟,可接石英…

机器学习PCA + LogisticRegression 训练和预测 输出混淆矩阵

from sklearn.decomposition import PCA# --------------------------------------------- # 最佳主成分数量 pca = PCA(n_components=None) pca.fit_transform(x_train) var_values = pca.explained_variance_ratio_def select_best_components(var_, goal_var):best_componen…

flutter3.7版本下使用flutter boost解决使用platview崩溃或异常问题

背景 工程使用了混合开发,使用flutter boost插件,flutter 的activity1 frament1 跳转activity2 frament2,frament1 包含platformView,按照上面老哥解决崩溃问题的基础上,出现activity2 frament2返回activity1 framen…

百度--搜索引擎是怎么实现的--如何制作一个搜索浏览器

1.搜索引擎是怎么实现的? 搜索引擎是通过以下步骤实现的: 网页抓取(Crawling):搜索引擎会使用网络爬虫(Web Crawler)自动地从互联网上抓取网页内容。爬虫按照一定的规则遍历网页并提取网页内容…

数组之前缀和

1.前缀和 前缀和的概念:前缀和是指数组中从开始位置到当前位置的所有位置的元素之和,它可以通过累加数组元素来计算,一般来说,我们可以使用前缀和数组在常数时间复杂度内计算任意区间的和. 注意:特别是需要频繁的计算区间和的情况,可以通过先预先计算前缀和数组,可以将时间复…

经典神经网络(7)DenseNet及其在Fashion-MNIST数据集上的应用

经典神经网络(7)DenseNet及其在Fashion-MNIST数据集上的应用 1 DenseNet的简述 DenseNet不是通过更深或者更宽的结构,而是通过特征重用来提升网络的学习能力。 ResNet 的思想是:创建从“靠近输入的层” 到 “靠近输出的层” 的直连。而DenseNet 做得更…

idea取消右侧边缘提示信息;IDEA使用心得:工作区右边框提示信息

idea的提示是很人性的,合理使用一定程度上也会提升个人的编码水平 最终效果:能看到weak warning个数,但侧边栏不会显示直接清爽 但是idea在检查代码时有一种警告叫做weak warning 什么是weak warning 图中这种只是其中一种,这种…

导出本地文件(模板)

/*** 导出模板*/GetMapping("export/template")ApiOperationSupport(order 16)ApiOperation(value "导出模板")public void exportTemplate(HttpServletResponse response) {List<JointExcel> list new ArrayList<>();ClassPathResource cl…

Fortran 中的 goto 语句

注意项 避免滥用&#xff1a;Fortran 90引入了结构化编程的概念&#xff0c;切记不要滥用goto语句明确标签&#xff1a;在使用goto语句时&#xff0c;标签要明确避免跳转过多&#xff1a;过多的跳转会增加代码的复杂性和可读性避免跳转到循环内部&#xff1a;在循环内部使用go…

力扣 93. 复原 IP 地址

题目来源&#xff1a;https://leetcode.cn/problems/restore-ip-addresses/description/ C题解&#xff1a;递归回溯法。 递归参数&#xff1a;因为不能重复分割&#xff0c;需要ind记录下一层递归分割的起始位置&#xff1b;还需要一个变量num&#xff0c;记录ip段的数量。递…

【设计模式】第二十章:解释器模式详解及应用案例

系列文章 【设计模式】七大设计原则 【设计模式】第一章&#xff1a;单例模式 【设计模式】第二章&#xff1a;工厂模式 【设计模式】第三章&#xff1a;建造者模式 【设计模式】第四章&#xff1a;原型模式 【设计模式】第五章&#xff1a;适配器模式 【设计模式】第六章&…

中国移动九天毕昇部署fastchat Ubuntu18.04+torch1.13.1+cuda11.6+python3.9

8核CPU,RAM32G 时间&#xff1a;2023年7月 项目地址:GitHub - lm-sys/FastChat: An open platform for training, serving, and evaluating large language models. Release repo for Vicuna and FastChat-T5. 体验地址:https://chat.lmsys.org/ 时间20230703&#xff0c;fas…

【Web3】Web3连接到以太坊网络(测试网、主网)

目录 什么是Web3 Web3项目连接以太坊网络 1.下载Web3 2.实例化Web3对象 3.infura 获取连接以太坊网络节点 4.添加网络节点 什么是Web3 web3.js开发文档&#xff1a;web3.js - Ethereum JavaScript API — web3.js 1.0.0 documentation web3.js 中文文档 : web3.js - 以…

【观察】技术创新+以行践言双管齐下,戴尔科技加速边缘计算落地

众所周知&#xff0c;随着混合多云的快速发展&#xff0c;来自百行千业的用户都在通过混合多云的策略推进加速企业的数字化转型&#xff0c;其中边缘计算由于能够在靠近数据生成的地点和位置就近提供计算、网络、智能等关键能力&#xff0c;其不仅正成为构建“云边端”一体化的…