谁能更好地检测深度伪造?人还是机器?

news2024/11/15 21:33:22

不知您是否听说过深度伪造(Deepfakes)这种欺诈应用?由它产生的各种虚假信息已威胁到了人类社会的方方面面。随着人工智能技术的进步,我们亟待提升识别虚假内容的能力。那么在实际检测假新闻可信度等用例时,到底是人类还是机器更胜任此类任务呢?

深度伪造的危害

不可否认,深度伪造的危险随着人工智能技术的快速发展,正在与日俱增,我们可以将其危害大体总结为如下方面:

  • 虚假信息:由深度伪造产生的视频和音频,可以广泛地传播假新闻等虚构信息。
  • 冒名顶替:通过冒充个体,深度伪造者可以损害他人的声誉,以及欺骗他们所认识的任何人。
  • 国家安全:深度伪造不但会炮制末日场景,而且能够编造敌对国领导人煽动冲突的视频或音频。
  • 内乱:冲突各方也可能利用欺骗性的镜头和音频,在特定的群体中煽动愤怒和内乱。
  • 网络安全:网络犯罪分子已经在使用人工智能语音克隆工具,向受害个体发送貌似熟人的、令人信服的信息。
  • 隐私侵犯:恶意使用深度伪造技术,会在未经个人同意的情况下,获取其肖像特征。
  • 真假难辨:正所谓:假作真时真亦假,我们甚至无法分辨准确的信息是否真实可信。

可见,面对越来越令人信服的深度伪造信息,我们需要强大的工具和流程来检测与识破。而旨在识别人工智能生成式内容的算法,完全可以作为检测工具运用于该领域,并作为人类判断力的有力补充。

算法能比人类更好地检测深度伪造吗?

目前,各国的技术巨头和研究团体,已经投入了大量资源,来研究和开发应对深度伪造所带来的严重威胁。2019年,Meta、微软和亚马逊等公司曾在针对深度伪造的检测挑战赛中,为那些最准确的检测模型提供了100万美元奖金。

在针对已公开的视频数据集进行测试后,其中表现最好的模型的准确率可达82.56%。然而,相同的模型在对由10,000个新成生成视频组成的“黑盒数据集”进行测试时,其中表现最好的模型准确率仅为65.18%。作为对比,一般来说,人类检测的准确率要么与AI深度检测工具持平,要么高于后者。

2021年发表在《美国国家科学院院刊,PNAS》上的一项研究发现:普通人类检测者的准确率会略高于业界领先的深度伪造检测工具。不过,该研究也发现:人类检测者和人工智能模型容易犯错的类型并不相同。

此外,悉尼大学的一项有趣的研究发现,我们人脑在无意识的情况下,会比有意识地去识别深度伪造要更加有效。

检测深度伪造中的视觉线索

作为一门新兴的科学,深度伪造检测的原理比较复杂,它们所需的分析方法也各不相同,具体主要取决于视频的性质。例如,2020年一段针对朝鲜领导人的恶搞深度伪造视频曾风靡全球。对此,最有效的检测方法是分析其嘴部动作(visemes)和语音(phonemes),进而找出不一致之处。

为了方便人类专家、普通用户、以及AI算法进行分析,麻省理工学院(MIT)定义了八条可以用来协助识别深度伪造视频的建议:

  1. 注意面部。高端的深度伪造几乎都是从面部改造开始的。
  2. 注意脸颊和前额。皮肤是否看起来太光滑或太褶皱?皮肤的老化程度是否与头发和眼睛的老化程度相似?深度伪造的人面可能会在某些方面显得不协调。
  3. 注意眼睛和眉毛。阴影是否出现在您期望看到的位置?毕竟深度伪造可能无法完全表现出自然场景的物理特性。
  4. 注意眼镜。是否有眩光点?眩光点是否太强?人物移动时,眩光点的角度是否会发生变化?同样,深度伪造可能无法完全表现自然照明的物理特性。
  5. 注意面部毛发是否真实。人物的面部毛发看起来真实吗?深度伪造可能会添加或去除胡子、鬓角、以及胡须等毛发,进而导致面部毛发的变化不那么自然。
  6. 注意面部的痣。脸上的痣看起来真实吗?
  7. 注意眨眼。眨眼次数是过少还是过频?
  8. 注意嘴唇的动作。那些基于嘴唇同步的深度伪造是否能够使得嘴唇的动作看起来自然?

其实,最新的人工智能深度防伪检测工具也无非是综合分析了上述因素,只不过不同产品的成功率各不相同罢了。当然,数据科学家们也在不断开发新的方法,例如:检测屏幕上发言者面部的血液自然流动。而这些新的方法显然是人类专家无法一眼识别,或者至少没有注意到的地方。

检测深度伪造中的音频线索

相对前面提到的视觉线索,深度伪造的音频检测完全是另一个领域的挑战。除了由视频提供的视觉线索,深度伪造检测在很大程度上也需要依赖于音频分析。当然,在某些情况下,元数据验证(Metadata Verification)等其他方法也能提供相关帮助。

伦敦大学学院于2023年发表的一项研究发现:人类专家检测出针对英语和普通话的深度伪造语音的准确率可以达到73%。与深层伪造的视频类似,人类专家往往能够凭借直觉,来检测在人工智能生成的语音中,那些不自然的语音模式,纵然他们可能根本无法清晰地说明,到底是哪些地方听起来不对劲。下面是我为您总结了最为常见音频迹象与线索:

  1. 口齿不清
  2. 缺乏顺畅的表达
  3. 背景或干扰噪音
  4. 声音或语言不一致
  5. 声音缺乏“饱和”感
  6. 过度脚本化的交付形式
  7. 看似没有瑕疵(包括:假动作、用词纠正、清嗓子等)

同样,各种算法也可以基于上述方面,有效地分析语音的深度伪造信号。USENIX的一份研究发现:人工智能声道的重建,是无法模拟自然语音模式的。该研究总结道:由人工智能语音生成器生成的音频只能与狭窄的声道(大致相当于一根饮用水吸管的大小)相匹配,却没有人类语音的自然动作。同时,霍斯特-戈尔茨研究所(Horst Görtz Institute)在早前的研究中,也分析了英语和日语中混杂的真假音频,并揭示了真假语音在高频率上的细微差别。

虽然人类专家和人工智能检测模型都可以察觉到声带和高频上的不一致,但是就高频差异而言,人工智能模型的准确度在理论上会越来越高。

人类和算法都会被深度伪造所迷惑,只是方式各不相同

有研究表明,根据测试参数的不同,人类和最新的人工智能检测工具的识别准确率,通常是在50%到90%之间。也就是说,人类和机器也可能会被深度伪造所欺骗,主要区别只是易受干扰的方式有所不同。例如,麻省理工学院(MIT)的研究发现,由于认知的不同,人类比人工智能模型更善于识别各国领导人和名人的深度伪造图像。该研究也发现,在处理有多人出现的镜头场景时,人工智能模型明显不及人类。究其根源,该研究认为,这可能是由于算法往往是在以单个发言人镜头为基础特征被训练出来的缘故。

相反,同一项研究还发现,人工智能模型在处理可能被故意用来欺骗人类观众的低质量镜头(如:模糊、颗粒状、环境暗淡等)时,其表现优于人类。同样,上文提到的最新的人工智能检测方法,也能够监测特定面部区域的血流状况。这可能是人类所不具备的分析能力。

小结

如您所见,随着人工智能深度伪造检测工具的不断迭代,深度伪造内容本身的质量也将不断提升。在某些极端的场景中,一旦人工智能的欺骗能力超过了我们现在所掌握的对其检测的能力,那么可能就只剩下人类的判断力,可以作为我们对抗深度伪造的唯一工具了。

如今,我们每个人都有责任了解虚假信息的迹象,以及该如何识别它们。除了保护自己免受AI诈骗和安全威胁之外,我们也有义务在网上讨论和分享自己对于虚假信息的洞察与发现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1312560.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

营销投放下半场,游戏行业如何寻觅进化空间?

摘要:微博,游戏行业突围市场新利器 游戏行业,格局永远在变。 从2017年互联网大厂集体盯上游戏大蛋糕,到2021年行业收缩,再到今年上半年实际销售收入继去年首次出现同比下滑…几经过山车式行情的游戏行业,…

Vue3上传图片和删除图片

<div class"illness-img"><van-uploader:after-read"onAfterRead"delete"onDeleteImg"v-model"fileList"max-count"9":max-size"5 * 1024 * 1024"upload-icon"photo-o"upload-text"上传图…

Attention机制学习

写在前面 注意力机制是一个很不错的科研创新点方向&#xff0c;但是没有系统记录过学习过程&#xff0c;这里记录科研中遇到的各种注意力机制。 Attention机制解释 本质上来说用到attention的任务都有Query&#xff0c;Key&#xff0c;Value三个关键components&#xff0c;目标…

LeetCode 300最长递增子序列 674最长连续递增序列 718最长重复子数组 | 代码随想录25期训练营day52

动态规划算法10 LeetCode 300 最长递增子序列 2023.12.15 题目链接代码随想录讲解[链接] int lengthOfLIS(vector<int>& nums) {//创建变量result存储最终答案,设默认值为1int result 1;//1确定dp数组&#xff0c;dp[i]表示以nums[i]为结尾的子数组的最长长度ve…

“文思助手”苏哒智能加入飞桨技术伙伴计划,共同打造“大模型+企业办公”新模式

近日&#xff0c;厦门苏哒智能科技有限公司正式加入飞桨技术伙伴计划&#xff0c;双方将发挥各自的专业优势&#xff0c;共同致力于在智能办公和创作领域实现技术突破和业务创新&#xff0c;帮助企业、知识工作者大幅提高生产力。 厦门苏哒智能科技有限公司 厦门苏哒智能科技有…

前端自定义icon的方法(Vue项目)

第一步&#xff1a;进入在线的编辑器进行设计 好用&#xff1a;百度字体编辑器 比如先导入有个ttf文件 添加新字体 双击每个模块进入编辑区域 更改相应的信息&#xff0c;比如name 编辑完了进行导出文件(各种格式就行了)就行了 第二步&#xff1a;在项目中asset文件储存这些文…

TCP为什么可靠之“拥塞控制”

拥塞控制是对网络层面的控制&#xff0c;主要是为了避免发送方发送过多的数据导致网络阻塞&#xff0c;以及出现网络阻塞时能够调整数据发送速率&#xff0c;达到对网络阻塞的一个控制。 拥塞窗口 拥塞窗口cwnd&#xff0c;是发送方维护的一个状态变量&#xff0c;会根据网络…

Vue组件封装知识总结

一、为什么要封装组件 首先&#xff0c;一个好问题&#xff0c;面试要考的&#xff01;为什么要封装组件呢&#xff1f; 提高代码的复用性&#xff1a;通过封装&#xff0c;可以将一段代码或一部分功能抽象为一个独立的组件&#xff0c;并在不同的项目或场景中重复使用。这样可…

simulinkveristand联合仿真——模型导入部署简单人机界面

目录 软件版本 simulink模型编译 veristand导入模型 veristand模型参数设置 veristand配置人机交互界面 veristand模型部署运行 软件版本 matlab2020a&#xff0c;veristand2020 R4 环境搭建及软件获取可看simulink&veristand&labview联合仿真环境搭建-CSDN博客…

记录 | docker报错could not select device driver ““ with capabilities: [[gpu]].

ubuntu18.04 上启动 docker start 报错&#xff1a; could not select device driver “” with capabilities: [[gpu]]. docker: Error response from daemon: could not select device driver “” with capabilities: [[gpu]]. ERRO[0005] error waiting for container: con…

如何做到人均告警减少 90%?B 站新一代告警平台的设计与实践

一分钟精华速览 B 站的业务规模和用户群体不断扩大&#xff0c;对于服务的稳定性和可用性的要求也日益增高。这就需要 B 站的监控告警系统能够及时、准确地发现和定位问题&#xff0c;以便尽快解决&#xff0c;维护好用户的使用体验。 本文是对 B 站在告警监控系统上的一次重…

MySQL如何进行Sql优化

&#xff08;1&#xff09;客户端发送一条查询语句到服务器&#xff1b; &#xff08;2&#xff09;服务器先查询缓存&#xff0c;如果命中缓存&#xff0c;则立即返回存储在缓存中的数据&#xff1b; &#xff08;3&#xff09;未命中缓存后&#xff0c;MySQL通过关键字将SQ…

网络层--TCP/UDP协议

目录 一、TCP/UDP协议介绍 1、UDP(User Datagram Protocol)--用户数据报协议 1.1 UDP报文格式 1.2 UDP协议的特性 2、TCP(Transmission Control Protocol )--传输控制协议 2.1 TCP报文格式 2.2 TCP协议的特性 2.3 TCP三次握手 2.4 四次挥手 三、TCP和UDP的区别 四、t…

关于“Python”的核心知识点整理大全21

9.3.2 Python 2.7 中的继承 在Python 2.7中&#xff0c;继承语法稍有不同&#xff0c;ElectricCar类的定义类似于下面这样&#xff1a; class Car(object):def __init__(self, make, model, year):--snip-- class ElectricCar(Car):def __init__(self, make, model, year):supe…

xcode 修改 target 中设备朝向崩溃

修改xcode的target中的设备朝向导致崩溃。 从日志上看好像没有什么特别的信息。 之后想了想&#xff0c;感觉这个应该还是跟xcode的配置有关系&#xff0c;不过改动的地方好像也只有plist。 就又翻腾了半天plist中的各种配置项&#xff0c;再把所有的用户权限提示相关的东西之…

运筹学经典问题(三):最大流问题

问题描述 给定一个图网络 G ( V , E ) G(V, E) G(V,E)&#xff0c;网络中连边的权重代表最大容量&#xff0c;在这个图中找出从起点到终点流量最大的路径。 数学建模 集合&#xff1a; I I I&#xff1a;点的集合&#xff1b; E E E&#xff1a;边的集合。 常量&#x…

全光谱的灯对人体有什么伤害?考公护眼台灯推荐

什么是全光谱&#xff1f;全光谱是是一种能够模拟自然光谱的照明设备&#xff0c;通过发出包含所有可见光波长的光线&#xff0c;使人们感受到与自然光类似的照明效果。不同于传统的白炽灯或荧光灯&#xff0c;全光谱灯被认为能够提供更好的视觉质量和更健康的光学经验。现在市…

泊松分布、泊松定理

泊松分布 假设随机变量所有可能的取值为&#xff0c;并且取各个值的概率为&#xff1a; &#xff0c; 其中是常数 那么就称服从参数为的泊松分布&#xff0c;记为。 泊松定理 设是常数&#xff0c;是任意正整数&#xff0c;并且&#xff0c;那么对任意一个非负整数&am…

新一代“垫图”神器,IP-Adapter的完整应用解读

导读 不用训练lora&#xff0c;一张图就能实现风格迁移&#xff0c;还支持多图多特征提取&#xff0c;同时强大的拓展能力还可接入动态prompt矩阵、controlnet等等&#xff0c;这就是IP-Adapter&#xff0c;一种全新的“垫图”方式&#xff0c;让你的AIGC之旅更加高效轻松。 …

14个最经典的git命令,你知道吗?

1 学习14个Git命令&#xff0c;因为你将会在99%的时间里使用它们 必须了解的命令整理 1&#xff0c;git init 初始化一个新的Git仓库。 这将在当前目录中创建一个名为".git"的子目录&#xff0c;Git会将所有仓库的元数据存储在其中。 2&#xff0c;git clone 克…