OpenAI开发ChatGPT“反作弊神器”,99.9%超高命中率,还没上线

news2024/9/24 11:32:07

检查内容是否用了ChatGPT,准确率高达99.9%!

OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。其能够精准识别出论文或研究报告是否由ChatGPT撰写,甚至能追溯其使用的具体时间点。它能专门用来检测是否用ChatGPT水了论文/作业。

早在2022年11月(ChatGPT发布同月)就已经提出想法了。

但是!

这么好用的东西,却被内部雪藏了2年,现在都还没对外公开。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)和首席技术官米拉·穆拉蒂(Mira Murati)也参与了有关反作弊工具的讨论。一些知情人士表示,阿尔特曼对该项目表示肯定,但并未实际推动其发布。

为啥?

OpenAI对忠实用户做了调查,结果发现近三分之一的人都表示如果用了反作弊工具,他们就弃了ChatGPT。而且还可能对非英语母语的用户影响更大。

但公司内部也有人提出,使用反作弊方法对OpenAI生态有好处。双方一直争执不下,该水印检测工具因此未发布。而除了OpenAI,如谷歌、苹果也都准备了类似工具,有一些已开始内测,但都未正式上线。

f2d4a573412bccaf00fee713a6eadcae.jpeg

ChatGPT没发布前已开始讨论

ChatGPT大火后,不少高中生大学生都拿它来写作业,所以如何甄别AI生成内容也成为了圈内的热议话题。从最新曝光的信息来看,OpenAI早在ChatGPT发布前就考虑到了这一问题。当时开发这项技术的人是Scott Aaronson,他在OpenAI从事安全方面的工作,也是德克萨斯大学计算机科学教授。

7b80e416b01ff2dbd9d823fe3cf7e725.jpeg

2023年初,OpenAI公司联合创始人之一约翰·舒尔曼(John Schulman)在一份共享Google文档中概述了该工具的优势和缺点。

OpenAI高管则决定在采取进一步行动之前,先征求更多人的意见。在接下来的一年半时间里,OpenAI的管理层反复讨论这项技术,并希望通过数据分析来决定到底要不要对外发布。一份内部文件显示,OpenAI于2023年4月委托开展的一项调查指出,有四分之一的用户支持AI检测工具的推出。同月,OpenAI针对ChatGPT用户开展了一项调查,结果显示,高达69%的受访者担忧由于作弊检测技术的误判,使用AI的人可能会无端遭受“滥用AI”的指责。

此外,近30%的受访者强烈表示,如果ChatGPT决定实施水印机制,他们将选择转向那些不采用水印机制的竞争对手平台,或者至少会减少对ChatGPT的使用频率。OpenAI公司内部还一直存在担忧,即反作弊工具可能会损害ChatGPT的写作质量。但知情人士表示,OpenAI今年早些时候进行了一项测试,发现水印并不会影响ChatGPT的性能。根据内部文件,参与测试的员工总结道:“既然我们确认了水印不会降低输出质量,恐怕就很难继续反对文本水印机制的落地了。”

今年6月初,OpenAI的高层团队与研究人员再次开会,就该项目进行了深入讨论。小组内部达成了共识,认为水印技术确实展现出了良好的效果,但同时,去年ChatGPT用户调查的结果依然具有重要的参考价值。据知情人士透露,有观点提出,公司应该探索那些尚未得到验证、但有望在用户群体中引发较少争议的新方法。

6月会议纪要的核心指出:“若未能及时行动,我们的声誉将会受损,公众可能会因此质疑OpenAI的责任感。”

为啥不公开?

总结OpenAI迟迟不公开这项技术的原因,主要有两方面:一是技术,二是用户偏好。

先说技术,早在2023年1月,OpenAI就开发了一种甄别多个AI模型(包括ChatGPT)文本的技术。

这项技术利用了一种类似“水印”的方法,把看不见的标记嵌入文本中。这样,当有人用检测工具分析文本时,检测器可以提供一个分数,表示文本由ChatGPT生成的可能性有多大。

不过当时成功率只有26%,仅过了7个月,OpenAI就撤回了。后来OpenAI逐渐将技术的成功率提到了99.9%,从技术上讲,该项目大约一年前就已经可以发布。然而,围绕技术的另一个争议是,内部员工认为该技术可能会损害ChatGPT写作质量。

同时,员工们还提出了一些关于“人们可能规避水印”的潜在风险。比如大学生都会的“翻译术”,将文本翻译成另一种语言,然后通过类似谷歌翻译的方式再次翻译回来,从而有可能被擦除。再比如有人搞个“上有政策下有对策”,一旦公开使用水印工具的人多了,网友们指定分分钟搞出破解版。

除了技术,另一大阻碍因素就是用户了,OpenAI的多项调查显示,用户们似乎并不看好这项技术。这也不得不提到用户们到底拿ChatGPT在干啥?这个问题可以参考《华盛顿邮报》的一项调研,他们从数据集WildChat中查看了近200,000个英语聊天记录,这些对话由人类与两个基于ChatGPT构建的机器人生成。可以看出,人们主要用ChatGPT来写作(21%)以及帮助完成家庭作业(18%)。

f486b403a20e69321ccf1f23195501fa.jpeg

这样看来,人们反对这项检测技术好像也不难理解。

另外,OpenAI内部还有一种反对的声音是反作弊工具可能会损害ChatGPT的写作质量。知情人士称,OpenAI今年早些时候进行了一项测试,发现文本水印不会降低输出质量。

6月初,OpenAI高级员工和研究人员再次聚会讨论该项目。该组织一致认为水印技术效果良好,但去年的ChatGPT 用户调查结果仍然是一个头疼的问题。内部文件显示,OpenAI需要在今年秋天之前制定一项计划,围绕AI透明度以及相关潜在新法律来左右公众舆论——「如果做不到这一点,我们就有可能失去负责任企业的信誉。」

高性价比GPU算力:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_0808_shemei

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1993366.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ | Leetcode C++题解之第328题奇偶链表

题目: 题解: class Solution { public:ListNode* oddEvenList(ListNode* head) {if (head nullptr) {return head;}ListNode* evenHead head->next;ListNode* odd head;ListNode* even evenHead;while (even ! nullptr && even->next…

VScode的环境编译器选择

按快捷键 Ctrl Shift P 选择即可

中国移动机顶盒【山东】魔百和CM201-2芯片HI3798MV300刷机过程、心得(朝歌代工)【免拆刷机】过程心得

中国移动【山东】魔百和CM201-2芯片HI3798MV300刷机过程、心得(朝歌代工)【免拆刷机】过程心得 先上主板图(虽然是【免拆刷机】但是为了防止刷机失败,建议大家拆一下对比一下主板是否一致) 添加图片注释,不超过 140 字…

前端web开发HTML+CSS3+移动web(0基础,超详细)——第3天

目录 一,列表-无序和有序的定义列表 二,表格-基本使用与表格结构标签 三,合并单元格 四,表单-input标签 五,表单-下拉菜单 六,表单-文本域 七,表单-label标签 八,表单-按钮 …

git 如何把A仓库中的代码提交到B仓库分支

1. git clone A仓库代码到本地 首先将A仓库代码克隆到本地(地址为A仓库地址,替换自己的即可) git clone http://gitlab.cn/sourceA/A.git 2. 添加目标B仓库为远程仓库 git remote add target http://gitlab.cn/targentB/B.git 3. 查看当前远程仓库地址 git remo…

C++ --- std::array容器与std::vector容器的区别

std::array和std::vector的区别 一、内存管理和大小固定性二、性能三、功能特性四 、使用场景 在C中,array和vector都是用于存储一系列相同类型元素的容器,但它们之间存在几个关键的区别。这些区别主要体现在内存管理、大小固定性、性能以及功能特性等方…

18 数据在内存中的存储

目录 一、整数在内存中的存储 二、大小端字节序和字节序判断 (一)什么是大小端 (二)为什么会有大小端 (三)练习 1、设计一个小程序来判断当前机器的字节序 2、练习二 3、练习三 4、练习四 5、练习五…

73 属性

① 公开的数据成员可以在外部随意访问和修改,很难保证用户进行修改时提供新数据的合法性,数据很容易被破坏,也不符合类的封装性要求。解决这一问题的常用方法是定义私有数据成员,然后设计公开的成员方法来提供对私有数据成员的读取…

基于STM32开发的智能门禁系统

目录 引言环境准备工作 硬件准备软件安装与配置系统设计 系统架构硬件连接代码实现 初始化代码控制代码应用场景 公司门禁管理家庭门禁管理常见问题及解决方案 常见问题解决方案结论 1. 引言 智能门禁系统通过RFID卡或密码输入的方式,实现对门禁的智能控制和管理…

gis:高德开放平台的基本使用(高德地图)小计章节3

上一章节说到使用行政区域查询做区域掩膜会有刷新不显示地图问题,这章咱们来解决一下。 关于这个问题,很多博主说是以script异步引入方式,生命周期,本地缓存,监听刷新等方式,但是很多是不生效的。并且vue项…

IDEA系列(二):IDEA配置详细说明【字体编码Maven等等持续更新...】

IDEA系列(二):IDEA配置详细说明【字体编码Maven等等持续更新…】 前言 【本篇使用IDEA版本:IntelliJ IDEA 2024.1.3 (Ultimate Edition)】【若需要码,请扫描关注编程D艺术,回复idea2024,获取码使你的IDEA更加方便快捷…

three.js 模型高亮效果实现说明(结合react)

three.js react 实现鼠标移入模型高亮选中效果 使用EffectComposer和其附加的渲染效果Passes(如RenderPass和OutlinePass)来实现高级渲染效果。首先创建EffectComposer实例,并添加RenderPass和OutlinePass,最后在渲染循环中调用…

MySQL中的索引——适合创建索引的情况

1.适合创建索引的情况 1、字段的数值有唯一性的限制 2、频繁作为 WHERE 查询条件的字段 某个字段在 SELECT 语句的 WHERE 条件中经常被使用到,那么就需要给这个字段创建索引了。尤其是在数据量大的情况下,创建普通索引就可以大幅提升数据查询的效率。 …

AI学习记录 - 如何进行token理论知识,以GPT2为举例

AI学习记录已经发了十几篇,大佬们可以看看,如果有帮助动动小手点赞 token入门版,有空会更新具体代码操作,能学到一点东西的话,大佬们点个赞!!! GPT4当中,我们提问问题是…

免费【2024】springboot 甘肃旅游工艺品商城的设计与实现

博主介绍:✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围:SpringBoot、Vue、SSM、HTML、Jsp、PHP、Nodejs、Python、爬虫、数据可视化…

ubuntu20.04 环境搭建教程

1: Ubuntu 版本说明 我使用版本为 ubuntu20.04 ->镜像文件网上下载最新版本 mirrors.huaweicloud.com/ubuntu-releases/20.04.6/ Ubuntu 其他说明 Ubuntu 安装的位置不建议放到 C 盘(除非你只有一个 C 盘) Ubuntu 需要 120G 的空间 2&#xff1…

从“萝卜快跑”到“东敏快跑”,百度未来路在何方?

在资本市场的波澜中,百度再次被推上了风口浪尖。近日,百度“老板娘”马东敏的减持行为不仅引发了网友的广泛讨论,更让百度Robotaxi(无人驾驶出租车)的商业化前景蒙上了一层阴影。 7月1日,马东敏悄然减持了百…

Swagger的介绍与使用(一)

一. 简介 OpenAPI 规范(以前称为 Swagger 规范)是 REST API 的 API 描述格式。 Swagger 是一个规范且完整的框架,用于生成、描述、调用和可视化 RESTful 风格的 Web 服务。 Swagger 的目标是对 REST API 定义一个标准且和语言无关的接口&am…

Journyx项目管理软件 soap_cgi.pyc XXE漏洞复现

0x01 产品简介 Journyx-Journyx成立于1996年,提供自托管项目管理解决方案ProjectXecute。主要功能包括资源跟踪、待办事项列表、任务分配以及与MS Project的集成。要运行ProjectXecute,需要Windows 2003或更高版本、IIS Web服务器和Intel处理器。也可以在Linux、Solaris、AI…

AI资本泡沫要来了么?——Coatue EMW 2024会议摘要

引言 随着生成式人工智能的快速发展,科技领域正经历着一场前所未有的变革。然而,伴随这一热潮而来的,是关于AI资本泡沫的激烈讨论。历史上,每一次技术革命都带来了巨大机遇,同时也伴随着泡沫和风险。本文将通过Coatue…