Ghostbuster:一个准确度高的AI生成文本检测工具

news2025/1/20 5:56:25

大语言模型如ChatGPT,以其卓越的写作能力引发了问题。学生们纷纷利用这些模型代写作业,导致一些学校不得不采取禁止ChatGPT的措施。此外,这些模型还存在生成带有事实错误的文本的倾向,因此谨慎的读者可能想知道,在信任某些新闻文章或其他来源之前,是否有生成式AI工具用于代写。

image.png

针对这一问题,研究人员提出了Ghostbuster这一先进的AI生成文本检测方法。该方法通过评估文档中每个标记在多个较弱的语言模型下生成的概率,然后将这些概率的函数作为最终分类器的输入进行组合。Ghostbuster无需知道生成文档所使用的具体模型,也无需知道在该特定模型下生成文档的概率。这使得Ghostbuster特别适用于检测由未知模型或黑盒模型生成的文本,例如流行的商业模型ChatGPT和Claude,其概率不可用。研究人员着重确保Ghostbuster具有良好的泛化性能,因此他们在不同领域(使用新收集的散文、新闻和故事数据集)、语言模型或提示下进行了评估。

为什么选择这种方法呢?

当前许多AI生成文本检测系统对于分类不同类型的文本(例如不同的写作风格、或不同的文本生成模型或提示)往往表现脆弱。简单使用困惑度(perplexity)的模型通常无法捕捉更复杂的特征,在新的写作领域表现尤为糟糕。与此相反,基于大型语言模型(如RoBERTa)的分类器虽然能轻松捕捉复杂特征,但容易对训练数据过拟合且泛化性能差。Ghostbuster的方法在这两者之间取得了平衡,既能够捕捉复杂特征,又不容易过拟合。

如何运作

Ghostbuster 采用三阶段训练过程:计算概率、选择特征和分类器训练。

计算概率:通过计算在一系列较弱的语言模型(一个一元模型、一个三元模型和两个非指令调整的 GPT-3模型)下生成文档中每个单词的概率,将每个文档转换为一系列向量、艾达和达芬奇)。

选择特征:使用结构化搜索过程来选择特征,其工作原理是(1)定义一组组合概率的向量和标量运算,以及(2)使用前向特征选择搜索这些操作的有用组合,重复添加最好的剩余特征。

分类器训练:根据最佳的基于概率的特征和一些额外的手动选择的特征训练了线性分类器。

Ghostbuster准确率表现

在同一领域训练和测试时,Ghostbuster在所有三个数据集上取得了99.0的F1分数,超过GPTZero5.9F1和DetectGPT41.6F1。在领域之外,Ghostbuster在所有条件下平均取得了97.0的F1,超过DetectGPT39.6F1和GPTZero7.5F1。与此相对,我们的RoBERTa基线在所有数据集的领域内评估时取得了98.1的F1,但其泛化性能不一致。Ghostbuster在所有领域上的性能均优于RoBERTa,仅在领域之外的创意写作中稍逊一筹,但总体上比RoBERTa在领域之外的性能更好(13.8F1差距)。

为了确保Ghostbuster对用户可能提示模型的各种方式的鲁棒性,例如请求不同的写作风格或阅读水平,研究人员评估了Ghostbuster对多个提示变体的鲁棒性。Ghostbuster在这些提示变体上的性能优于所有其他测试方法,达到99.5的F1。为了测试对模型的跨域泛化,研究人员在Claude生成的文本上评估了Ghostbuster的性能,结果Ghostbuster也在92.2的F1上超过了所有其他测试方法。

image.png

AI生成文本检测器曾被轻微编辑生成的文本所欺骗。研究人员检查了Ghostbuster对编辑的鲁棒性,例如交换句子或段落,重新排列字符,或用同义词替换单词。大多数在句子或段落级别的更改并没有显著影响性能,尽管如果文本通过重复改写,使用商业检测规避器(如Undetectable AI)或进行大量单词或字符级别的更改,则性能会平稳下降。性能在较长的文档上也表现最佳。

由于AI生成文本检测器可能会将非母语英语的文本误判为AI生成的文本,研究人员评估了Ghostbuster对非母语英语写作的性能。所有测试模型在三个测试数据集中的两个上都具有95%以上的准确率,但在第三组较短的散文中表现较差。然而,文档长度可能是主要因素,因为Ghostbuster在这些文档上的表现几乎与其在其他长度相似的领域之外文档上的表现一样好(74.7F1),后者的F1在75.6到93.1之间。

希望将Ghostbuster应用于潜在的文本生成的禁区使用的用户应该注意,对于较短的文本、远离Ghostbuster训练领域的领域(例如不同的英语变体)、非英语母语的文本、人工编辑的模型生成或通过提示AI模型修改人工创作的文本,错误更有可能发生。为了避免延续算法伤害,我们强烈不建议在没有人类监督的情况下自动惩罚所谓的文本生成使用。相反,我们建议在分类某人的写作为AI生成可能会对其造成伤害时,谨慎使用Ghostbuster的人机协同使用。Ghostbuster还可以在一系列较低风险的应用中发挥作用,包括从语言模型训练数据中过滤AI生成的文本,并检查在线信息源是否为AI生成。

Ghostbuster是一种先进的AI生成文本检测模型,在测试的领域中取得了99.0的F1性能,相较现有模型取得了实质性的进展。它在不同领域、提示和模型上表现良好,对于识别来自黑盒或未知模型的文本非常合适,因为它无需访问生成文档的具体模型的概率。

image.png

Ghostbuster未来的方向包括为模型决策提供解释和提高对试图欺骗检测器的攻击的鲁棒性。AI生成文本检测方法还可以与水印等替代方法一起使用。研究人员还希望Ghostbuster能在过滤语言模型训练数据或标记网络上的AI生成内容等各种应用中发挥作用。

工具地址:https://ghostbuster.app/

论文网址:https://arxiv.org/abs/2305.15047

github项目网址:https://github.com/vivek3141/ghostbuster

大家尝试在这里猜测文本是否是人工智能生成的:ghostbuster.app/experiment

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1215297.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【汇编】Debug的使用

文章目录 前言一、Debug是什么?二、为什么Debug如此重要?三、Debug的使用3.1 Debug的运行3.1 R命令查看寄存器的状态改变寄存器的值 3.2 用D命令查看内存中的内容列出预设地址内存内容列出指定地方的内容列出指定地方的指定大小的内容 3.3 使用e命令修改…

OceanBase持续践行“一体化”产品战略,发布首个一体化数据库长期支持版本

11月16日,在OceanBase2023年度发布会上,OceanBase CEO杨冰宣布,OceanBase将持续践行“一体化”产品战略,为关键业务负载打造分布式数据库。 同时,会上发布一体化数据库的首个长期支持版本OceanBase 4.2.1 LTS&#xff…

12-1- GAN -简单网络-线性网络

功能 随机噪声→生成器→MINIST图像。 训练方法 1 判别器的训练,首先固定生成器参数不变,其次判别器应当将真实图像判别为1,生成图像判别为0 loss=loss(real_out, 1)+loss(fake_out, 0) 2 生成器的训练,首先固定判别器参数不变,其次判别器应当将生成图像判别为1 loss =…

<Linux>(极简关键、省时省力)《Linux操作系统原理分析之进程管理2》(4)

《Linux操作系统原理分析之进程管理2》》(4) 3 进程管理3.5 P、V操作3.5.1 信号量3.5.2 信号量的应用3.5.3 进程同步机制 3.6 进程通信3.6.1 消息通信3.6.2 信箱通信 3.7 死锁3.7.1 死锁的定义3.7.2 死锁产生的必要条件3.7.3 死锁的预防3.7.4 死锁的避免…

系列二十六、idea安装javap -c

一、概述 javap -c是一个能够将.java文件反编译为.class文件的指令,例如我在idea中编写了一个Car.java文件,我想看看这个类被编译后长什么样的,就可以使用该指令进行查看。 二、配置 2.1、 Java Bytecode Decompiler File>Settings>Pl…

基于ssm的高校共享单车管理系统(有报告)。Javaee项目,ssm项目。

演示视频: 基于ssm的高校共享单车管理系统(有报告)。Javaee项目,ssm项目。 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 项目介绍&…

ssd202d-logo-cmd_bootlogo分析

cmd_bootlogo.c运行过程 common/autoboot.c:593: disp_logo(0); sprintf(cmd_str, "bootlogo %d 1 0 0 0", logo_id); do_display函数 获取对应结构体,里面有各种参数

【Dolphinscheduler3.1.1】二次开发本地启动项目(前端+后端)

背景说明 由于业务的定制化开发,需要对Dolphinscheduler进行二次开发,现将项目的启动步骤记录如下。 一、 基础软件安装(必装项请自行安装) Maven: v3.5,配阿里云仓库地址即可 Node: v16. MySQL (5.7系列) : 两者任选其一即可 JDK (1.8)…

深入解析Vue中的keep-alive组件:优化组件切换与DOM渲染!

🎬 江城开朗的豌豆:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 📝 个人网站 :《 江城开朗的豌豆🫛 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 ⭐ 专栏简介 📘 文章引言 一、K…

php连接sqlserver 安装sqlserver 驱动windows系统

第一步下载Windows 上的 Microsoft ODBC Driver for SQL Server ODBC 驱动程序 Microsoft ODBC Driver for SQL Server 直接下载安装即可,安装后可查看安装版本 第二步:下载php_sqlsrv 驱动 安装解压后,会有对应php版本的驱动文件&#xf…

单相浪涌保护器和三相浪涌保护器的区别

浪涌保护器,也称为防雷器,是一种为各种电子设备、仪器仪表、通讯线路提供安全防护的电子装置,主要用于限制过电压和泄放电涌电流。浪涌保护器的核心元件是内部的一个非线性元件。根据非线性元件的不同,浪涌保护器可以分为开关型&a…

准「AI 时代」下,如何衡量程序员的工作效率和生产力?

近 20 家科技、金融和制药公司实施了新的研发效能管理方法,并取得了令人鼓舞的初步结果。 客户报告的产品缺陷减少 20%-30%;员工体验分数提高 20%;客户满意度评分提高 60 个百分点。 大模型和 AIGC 技术催生了软件研发的新范式,也…

使用Postman进行压力测试

1.打开Postman新建测试接口 2.点击右边保存,选择一个文件集合,如果没有就创建,然后保存 就是这个东西,这里不便展示出来,压力测试需要在文件夹里面进行 3.选择要测试的接口,iterations 表示请求发起次数&a…

条条大路通罗马!打开CMD的方法不少,有常用的,也有意想不到的

许多人可能不知道这一点,但有几种方法可以在Windows 11/10中打开或启动命令提示符(CMD)。我们将重点关注Windows 11/10,因此由于新的“开始”菜单和其他功能,打开命令提示符的某些方面可能会略有不同。 在Windows 11/10中启动命令提示符 从应用程序菜单中启动CMD 点击开…

vue-数据双向绑定原理

​🌈个人主页:前端青山 🔥系列专栏:Vue篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来vue篇专栏内容:vue-数据双向绑定原理 目录 虚拟DOM与Diff算法 1. 对虚拟DOM的理解? 2. 虚拟DOM的解…

python 基础语法学习 (二)

多变量赋值 当你在Python中进行多变量赋值时,你可以在一行代码中同时为多个变量分配值。这种方法可以简化代码并提高可读性。下面是一些关于Python多变量赋值的基本知识: 基本赋值:你可以使用等号()将一个值分配给一…

Spring 6 提前编译:AOT

1、AOT概述 1.1、JIT与AOT的区别 JIT和AOT 这个名词是指两种不同的编译方式,这两种编译方式的主要区别在于是否在“运行时”进行编译 (1)JIT, Just-in-time,动态(即时)编译,边运行边编译; 在程序运行时…

数字孪生赋能实景三维中国建设分论坛成功举办

数字孪生赋能实景三维中国建设分论坛成功举办 11月10日,第一届中国测绘地理信息大会“数字孪生赋能实景三维中国建设分论坛”在浙江德清成功举办。 (图片来源于网络) 会议上,中国地理信息产业协会会长李维森出席并发表致辞&#x…

Linux_安装docker

安装包管理工具yum-utils,并设置docker储存库(如果已有,不用安装) # 安装包管理工具 sudo yum install -y yum-utils # 安装docker储存库 sudo yum-config-manager \--add-repo \http://mirrors.aliyun.com/docker-ce/linux/cen…

计算机毕设 深度学习 机器学习 酒店评价情感分析算法实现

文章目录 0 前言概述项目所需模块数据数据说明字段说明 数据处理分词处理停用词处理样本均衡建立多层感知机分类模型训练模型网络检测率以及检测结果 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点&a…