如何分辨AI生成的内容?AI生成内容检测工具对比实验

news2024/9/22 5:20:39

检测人工智能生成的文本对各个领域的组织都提出了挑战,包括学术界和新闻界等。生成式AI与大语言模型根据短描述来进行内容生成的能力,产生了一个问题:这篇文章/内容/作业/图像到底是由人类创作的,还是AI创作的?虽然 LLM 在改进文本方面发挥着无价的作用,但我们也必须承认这种演变给智力生产概念带来的问题。作为人类,我们依靠线索来评估文本的可信度。然而,随着 LLM 驱动的文本生成,越来越难以确定文本是否源自人类,以及它是否呈现了准确或有偏见的想法和陈述。

人工智能在文本生成方面的进步使得区分人类编写的内容和机器生成的内容变得越来越困难。这对依赖准确的标注数据进行机器学习训练和自然语言处理任务的公司构成了重大挑战。市场上有各种人工智能检测器,包括 Open AI 于 2023 年初发布的现已撤回的人工智能检测器。然而,它未能达到预期,仅捕获了 26% 的人工智能生成文本,仅在六个月后就退役了。最近的研究还揭示了人工智能检测器对非母语人士的偏见。这些复杂性凸显了人工智能检测的难度,强调了与其他检测器的区别。

目前市场上可用的解决方案使用基于文本的方法,通过对合成和真实的人类书写文本进行训练后分析词汇、语义或语法线索来检测人工智能生成的文本。正如 Appen 数据科学家 Arjun Patel 和 Phoebe Liu 所描述的那样,这些解决方案在检测 LLM 生成的文本方面存在缺陷,因为 LLM 生成的文本通常与人类书写的内容非常相似。此外,当前的检测方法容易出现误报和漏报。因此,未被发现的人工智能生成的文本被标记为真实可靠的风险进一步加剧了人们对数据准确性和可信度的担忧。

AI生成内容检测的挑战

由于以下几种因素,研究人员在检测人工智能生成的文本方面正面临重大挑战:

  • 大语言模型 (LLM) 性能的提升与使用新示例训练 AI 检测器之间的不断竞争,需要频繁地重新训练检测器。
  • 大语言模型(LLM)的普及度不断提高,从商业产品到开源模型。
  • 捕捉人类使用文本生成工具的真实数据集稀缺,以及对注释提交中人工智能生成文本的普遍性的理解有限。
  • 缺乏标准化指标来评估此类模型。
  • 第三方模型所采用的防止对抗性攻击的方法缺乏透明度。

设定正确的指标

在确定任何事物的有效性时,主要的挑战是确定正确的指标。根据所选的指标,即使某件事不符合预期的使用要求,也可能被视为成功。了解不同的指标并仔细选择真正反映您目标的指标对于准确评估成功至关重要。

尽管模型准确度通常被视为评估性能的关键指标,但它可能会误导人们判断模型是否有效。在处理不平衡数据集或成本敏感性很重要时尤其如此。例如,如果将一段文本误认为是由人工智能生成的,而实际上它是由人类编写的,可能会对人类作者产生严重而有害的影响。模型准确度通常表示为正确预测占总预测数的百分比。在处理不平衡数据集时,有可能实现高准确率,但假阳性率也会很高。这正是人工智能检测器被认为不可靠的原因。

我们的期望是,我们的人群总体上是诚实的,并且在被要求不要使用外部 LLM 进行内容生成时倾向于遵循指示。这意味着我们的人群主要由善意的个人组成,但也有一些坏人。因此,使用准确率高但误报率也高的模型是有害的,因为它可能会破坏我们的贡献者对 Appen 的信任。

除了准确度之外,还可以使用各种指标,例如曲线下面积、假阳性、真阳性等等。确定最有意义的指标在很大程度上取决于 AI 检测器的具体用例和上下文。这就是为什么定义指标通常需要产品和数据科学团队之间的协作,因为这对于满足业务需求至关重要。

在 Appen,我们采取保守的方法,并优先考虑一个指标,即如果 AI 检测器不会对人类(尤其是所分析文本的作者)产生负面影响,则该指标被视为有效。我们的目标是评估 AI 检测器将文本错误地识别为 AI 生成的频率,而这些文本实际上是由人类撰写的。这在我们以人为本的方法中非常重要,因为被错误地标记为 AI 生成的作者几乎没有或根本没有办法挑战这一预测。因此,我们仔细检查了误报率,它表示错误地将人类生成的文本识别为 AI 生成的文本的比例。

Appen 的 AI 检测基准测试实验

最近,Appen 数据科学家Phoebe Liu和Arjun Patel与 Appen 高级产品经理Alice Desthuilliers合作,进行了一项实验,以评估不同市场解决方案的有效性。得益于 Appen 的专业知识和致力于策划有目的的人群并通过精心设计的任务收集高质量的人工数据,这项实验成为了现实。利用我们自己的众包团队,Appen 能够根据不同的基准评估各种 AI 检测器的性能。该实验旨在确定 AI 检测器将人工生成的文本错误地归类为 AI 生成的频率。

[研究人员评估了四种流行的市场解决方案:OpenAI 已撤回的 AI 检测器作为对照、商业解决方案、开源解决方案和澳鹏内部开发的基于机器学习的模型。这些模型中的每一个都基于 Appen 的高质量数据进行了测试。然后将结果与预定义的 95% 准确度基线,高效 AI 检测器的预期性能,进行对比。实验得出的结论是,目前的市场解决方案均未达到此基准,所有模型的误报率均高于 10%,即将10%的人工撰写内容判断为AI生成。]

人群标准

为了开展我们的 AI 检测实验,Appen 团队组建了一支由 24 名贡献者组成的团队,他们的英语水平以美国英语为母语或接近母语。这些贡献者居住在美国或菲律宾。多亏了这个团队,我们才得以创建控制数据集。

任务

在实验中,Appen 团队安排了两种不同的任务:

  • 人类撰写组:在没有任何外部帮助的情况下对提示做出响应。
  • 人工智能组:使用 ChatGPT 等生成式人工智能来响应提示。

在执行每项任务之前,团队都会对参与实验的人员进行一次培训,以确保参与者理解方法并正确执行任务。实验采用的所有提示都是从开源 Dolly 数据集中精心挑选出来的。

对于第一组,团队要求参与者在澳鹏数据标注平台中从头撰写针对prompt的回应,并保证长度超过150字(大多数AI生成内容检测器所需的内容长度),注意不出现错字,并给出正确的答案。整体而言,我们希望参与者扮演一个乐于助人的助手,对问题做出客观细致的回复。

第二组参与者可以选择自己喜欢的生成式AI应用,团队也与他们分享了网上公开的生成式AI使用指南。

结果

Patel、Liu 和 Desthuilliers 通过 7 个作业的组合生成了总共 636 个提示-响应对数据集。其中,334 对是使用生成式AI 工具创建的,而 302 对是由人类写作的。

为了评估性能,Appen 的数据科学和产品团队选择了几种广为使用且以宣传的功效而闻名的 API,其中包括:

  • Sapling AI
  • GPTZero (句子级和文档级)
  • OpenAI GPT2 Detector,这是OpenAI 的一个早期模型,作为基准

每个模型都经过 5 倍分层交叉验证进行评估。综合考虑准确率、f1 分数、假阳性率(False positive rate, FPR)和真阳性率(True positive rate, TPR)等指标,实验结果如下:

准确率F1假阳性率真阳性率
sapling0.620.710.670.90
GPTZero0.700.700.260.66
GPTZero文档级0.610.710.730.91
OpenAI GPT20.510.310.160.21

结果显示,虽然某些模型在某些指标上的表现优于其他模型,但所评估的所有 AI 检测工具均未达到 95% 准确率的预期基准。事实上,实验四个工具的误报率在 16.67% 到 70% 之间,这凸显了 AI 生成内容检测技术需要进一步改进。

与 OpenAI 撤回的 AI 检测模型的比较

请记住,OpenAI 发布了 ChatGPT 分类器,据报道,该分类器的真实阳性率 (TPR) 为 26%,假阳性率 (FPR) 为 9%。虽然这个模型后来被撤回,我们无法使用我们的控制数据集对其进行评估,但值得注意的是,它是少数几个声称可以在现实世界数据上运行的模型之一,来自一家顶级 LLM 公司。如果有人知道人工智能生成的内容应该是什么,那就是 OpenAI!

为了确保 FPR 保持在 9% 以下,我们重新计算了在我们的数据上观察到的每个模型的最佳 TPR,并使用不同的阈值进行优化。这有助于我们衡量这些付费第三方 API 与 OpenAI 的免费撤回模型相比的改进。为此,Appen 数据科学团队测试了 API,以实现低于 9% 的误报率,并尝试使用不同的阈值找到实现的最佳真实阳性率。

假阳性率FPR真阳性率TPR
sapling0.070.05
GPTZero文档级0.070.15
OpenAI GPT20.080.15

我们初步调查发现,所有第三方模型都达不到 OpenAI 撤回的分类器的标准。该分类器的真阳性率为 26%,假阳性率为 9%。在所有模型中,GPTZero 的表现最为出色,真阳性率为 13%,假阳性率为 8%。虽然某些模型的真阳性率非常高,在某些情况下甚至超过 91%,但假阳性率却高得惊人,尤其是表现最好的 GPTZero 模型,高达 73%。这些高假阳性率对贡献者构成了重大风险,导致 OpenAI 撤回了他们最新的分类器。

Patel 表示:“尽量减少误报对于维护系统的信任和确保公平至关重要。虽然真阳性对于发现实际作弊情况很重要,但优先减少误报有助于在准确性和尽量减少对无辜者的伤害之间取得微妙的平衡。”

有趣的是,句子级 GPTZero 模型在我们的观察中缺失。这是因为该模型未能在我们的数据集上实现如此低的假阳性率。Sapling 模型面临类似的问题,因为它必须像 AI 一样预测所有实例才能满足假阳性率要求。只有 GPTZero 文档级分类器表现良好,与已退役的 OpenAI 检测器相比,其假阳性率降低了 3 个百分点。然而,该模型识别出的真阳性比 OpenAI 的解决方案要少。

这可能表明人工智能检测技术中最小化假阳性和最大化真阳性之间的权衡。

努力打造更安全、更道德的数字环境

我们的研究强调了使用现有技术检测 AI 生成内容所面临的挑战。虽然第三方 API 已显示出令人鼓舞的结果,但它们仍未达到预期并有效地以高精度识别 AI 生成的文本。需要进一步改进以确保这些系统能够准确有效地识别 AI 生成的内容并防止有害或欺骗性信息。

随着人工智能技术的不断发展,检测方法需要不断重新评估和更新,以跟上人工智能生成文本不断发展的格局。我们必须保持开放的心态,拥抱新技术,同时保持谨慎和警惕,确保负责任地使用这些技术。有效检测和监管人工智能生成内容的旅程可能充满挑战,但这是朝着在当今世界更负责任、更合乎道德地使用人工智能迈出的重要一步。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1916060.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据库】Redis主从复制、哨兵模式、集群

目录 一、Redis的主从复制 1.1 主从复制的架构 1.2 主从复制的作用 1.3 注意事项 1.4 主从复制用到的命令 1.5 主从复制流程 1.6 主从复制实现 1.7 结束主从复制 1.8 主从复制优化配置 二、哨兵模式 2.1 哨兵模式原理 2.2 哨兵的三个定时任务 2.3 哨兵的结构 2.4 哨…

MT3047 区间最大值

思路&#xff1a; 使用哈希表map和set&#xff08;去重&#xff09;维护序列 代码&#xff1a; #include <bits/stdc.h> using namespace std; const int N 1e5 10; int n, k, A[N]; map<int, int> mp; // 元素出现的次数 set<int> s; // 维护出现…

Android平台GB28181记录仪在电网巡检抢修中的应用和技术实现

技术背景 在探讨Android平台GB28181设备接入端在电网巡检抢修优势之前&#xff0c;我们已经在执法记录仪、智能安全帽、智能监控、智慧零售、智慧教育、远程办公、明厨亮灶、智慧交通、智慧工地、雪亮工程、平安乡村、生产运输、车载终端等场景有了丰富的经验积累&#xff0c;…

linux创建定时任务

crontab方式 先查看是否有cron systemctl status crond 没有的话就安装 yum install cronie 打开你的crontab文件进行编辑。使用以下命令打开当前用户的crontab文件&#xff1a; crontab -e * * * * * /export/test.sh >> /export/test.log 2>&1/export/test.s…

什么是量化机器人?它能来作些什么?一篇文章带你了解!

在科技日新月异的今天&#xff0c;我们经常会听到一些听起来高大上的词汇&#xff0c;比如“人工智能”、“大数据”和“量化交易”。而在这其中&#xff0c;“量化机器人”更是一个让人既好奇又略感神秘的存在。今天&#xff0c;我们就用通俗易懂的语言&#xff0c;一起来揭开…

通知notification

通知 权限&#xff1a;manifest.xml&#xff0c;可以不提前写&#xff0c;后面写代码时显示缺少点击添加即可。 <uses-permission android:name"android.permission.VIBRATE"/>//振动权限 <uses-permission android:name"android.permission.POST_NOT…

洛谷 7.10 数数

Vanya and Books - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) ac代码 #include<bits/stdc.h> typedef long long ll;#define IOS ios::sync_with_stdio(0),cin.tie(0),cout.tie(0) const ll N1e3; using namespace std;int main() {IOS;ll x;cin>>x;ll ans0,px…

阿一课代表随堂分享:红队反向代理之使用frp搭建反向代理

frp反向代理 frp简介 frp 是一个开源、简洁易用、高性能的内网穿透和反向代理软件&#xff0c;支持 tcp, udp, http, https等协议。 frp 是一个可用于内网穿透的高性能的反向代理应用&#xff0c;分为服务端frps和客户端frpc&#xff0c;支持 tcp, udp, http, https 协议。详…

明白这两大关键点,轻松脱单不再是难题!

很多未婚男女都渴望找到心仪的伴侣&#xff0c;建立稳定的情感关系&#xff0c;但往往在脱单的过程中跌跌撞撞。平时与同学、同事之间相处得很融洽&#xff0c;一旦遇到心仪的异性&#xff0c;情商直接掉线&#xff0c;难道情商也会选择性地发挥作用吗&#xff1f;其实&#xf…

怎么将3张照片合并成一张?这几种拼接方法很实用!

怎么将3张照片合并成一张&#xff1f;在我们丰富多彩的日常生活里&#xff0c;是否总爱捕捉那些稍纵即逝的美好瞬间&#xff0c;将它们定格为一张张珍贵的图片&#xff1f;然而&#xff0c;随着时间的推移&#xff0c;这些满载回忆的宝藏却可能逐渐演变成一项管理挑战&#xff…

wifi模组Ai-M62-32S的IO映射和UDP透传测试

wifi模组Ai-M62-32S的IO映射和UDP透传测试 基本IO 映射配网示例开启UDP透传示例复位AT查询wifi是否在线配置DHCP静态IP连接wifi连接UDP开启透传 基本IO 映射 对于wifi模组Ai-62-32S来说其模组 IO 引脚&#xff08;从模组左上角逆时针排序&#xff0c;引脚序号从 1 开始&#x…

10个JavaScript One-Liners让初学者看起来很专业

原文链接&#xff1a;https://pinjarirehan.medium.com/10-javascript-one-liners-for-beginner-developers-to-look-pro-b9548353330a 原文作者&#xff1a;Rehan Pinjari 翻译&#xff1a;小圆 你是不是在辛苦码字时&#xff0c;看到别人轻松甩出一行 JavaScript 就搞定难题…

GitLab和Git

GitLab保姆级教程 文章目录 GitLab保姆级教程一、GitLab安装二、添加组和用户三、新增项目四、Git上传项目说明五、命令行指引 根据以下说明从计算机中上传现有文件&#xff1a;六、创建与合并分支七、GitLab回滚到特定版本八、数据备份与恢复九、docker中创建gitlab GIT 常用命…

maven 依赖冲突

依赖冲突 1、对于 Maven 而言&#xff0c;同一个 groupId 同一个 artifactId 下&#xff0c;只能使用一个 version。 <!-- https://mvnrepository.com/artifact/org.apache.commons/commons-math3 --><dependency><groupId>org.apache.commons</groupId&…

MVC 生成验证码

在mvc 出现之前 生成验证码思路 在一个html页面上&#xff0c;生成一个验证码&#xff0c;在把这个页面嵌入到需要验证码的页面中。 JS生成验证码 <script type"text/javascript">jQuery(function ($) {/**生成一个随机数**/function randomNum(min, max) {…

从0-1搭建一个web项目(路由目录分析)详解

本章分析vue路由目录文件详解 ObJack-Admin一款基于 Vue3.3、TypeScript、Vite3、Pinia、Element-Plus 开源的后台管理框架。在一定程度上节省您的开发效率。另外本项目还封装了一些常用组件、hooks、指令、动态路由、按钮级别权限控制等功能。感兴趣的小伙伴可以访问源码点个赞…

【计算机网络03】不花钱怎么搭建一个网络实验室

使用GNS3和虚拟机搭建网络实验室 1、安装抓包工具分析数据包2、定义和使用抓包筛选器3、安装和配置GNS34、配置路由器和VPCS5、使用WireShark捕获GNS3网络数据包6、VMware创建虚拟机7、使用思科PacketTracer 1、安装抓包工具分析数据包 官网安装wireshark&#xff1a;https://…

前端面试题26(vue3中响应式实现原理)

Vue 3 中响应式系统的实现主要依赖于 ES6 的 Proxy 对象&#xff0c;这与 Vue 2 中使用 Object.defineProperty 的方式有着本质的区别。Proxy 提供了一种更为强大且灵活的方法来拦截和定制对象的操作&#xff0c;例如获取、设置属性值等。下面是对 Vue 3 响应式系统实现方式的详…

鸿蒙语言基础类库:【@ohos.util.TreeSet (非线性容器TreeSet)】

非线性容器TreeSet 说明&#xff1a; 本模块首批接口从API version 8开始支持。后续版本的新增接口&#xff0c;采用上角标单独标记接口的起始版本。开发前请熟悉鸿蒙开发指导文档&#xff1a;gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。 T…

PLC数据采集网关的具体使用说明-天拓四方

PLC数据采集网关通过以太网、串口等通信接口与PLC设备连接&#xff0c;实现数据的实时采集。网关内置数据处理模块&#xff0c;可以对采集到的数据进行清洗、转换和存储&#xff0c;以满足不同应用场景的需求。同时&#xff0c;PLC数据采集网关支持多种通信协议&#xff0c;如M…