为何ChatGPT如此擅长编造故事?

news2024/10/6 3:46:43

在这里插入图片描述

“幻觉”——人工智能中的一个偏见性术语

AI聊天机器人(如OpenAI的ChatGPT)依赖于一种称为“大型语言模型”(LLM)的人工智能来生成它们的响应。LLM是一种计算机程序,经过数百万文本源的训练,可以阅读并生成“自然语言”文本语言,就像人类自然地写作或交谈一样。不幸的是,它们也会犯错。

在学术文献中,AI研究人员经常称这些错误为“幻觉”(hallucinations)。随着这个话题成为主流,这个标签也变得越来越具争议,因为一些人认为它将人工智能模型拟人化(暗示它们具有类人的特征),或者在不应该暗示这一点的情况下赋予它们权力(暗示它们可以做出自己的选择)。此外,商业LLM的创造者也可能以幻觉为借口,将错误的输出归咎于AI模型,而不是对输出本身负责。

尽管如此,生成式AI还是一个很新的领域,我们需要从现有的想法中借用隐喻,向更广泛的公众解释这些高度技术性的概念。在这种情况下,我们觉得“虚构”(confabulation)这个词虽然同样不完美,但比“幻觉”这个比喻要好。在人类心理学中,“虚构”指的是某人的记忆中存在一个空白,大脑以一段令人信服的虚构事实来填补他所遗忘的那段经历,而非有意欺骗他人。ChatGPT不像人脑那样运行,但是术语“虚构”可以说是一个更好的隐喻,因为它是以创造性地填补空白的原则(而非有意欺骗)在工作,这一点我们将在下面探讨。

虚构问题

当AI机器人产生虚假信息时,这是一个大问题,这些信息可能会产生误导或诽谤效果。最近,《华盛顿邮报》报道了一名法学教授发现ChatGPT将他列入了性骚扰他人的法律学者名单。但此事是子虚乌有,完全是ChatGPT编造的。同一天,Ars也报道了一名澳大利亚市长发现ChatGPT声称他被判受贿并被捕入狱,而该信息也完全是捏造的。

ChatGPT推出后不久,人们就开始鼓吹搜索引擎的终结。然而,与此同时,ChatGPT的许多虚构案例开始在社交媒体上广为流传。AI机器人发明了不存在的书籍和研究,教授没有写过的出版物,虚假的学术论文,虚假的法律引用,不存在的Linux系统功能,不真实的零售吉祥物,以及没有意义的技术细节。在这里插入图片描述
然而,尽管ChatGPT倾向于随意撒些小谎,但它对虚构的抑制正是我们今天谈论它的原因。一些专家指出,ChatGPT在技术上是对普通GPT-3(它的前身模型)的改进,因为它可以拒绝回答一些问题,或者当它的答案可能不准确时让你知道。

大型语言模型专家、Scale AI的提示工程师(prompt engineer)Riley Goodside表示,“ChatGPT成功的一个主要因素是,它成功地抑制了虚构,使许多常见问题都不引人注意。与它的前辈相比,ChatGPT明显不太容易编造东西。”

如果用作头脑风暴工具,ChatGPT的逻辑跳跃和虚构可能会导致创造性突破。但当用作事实参考时,ChatGPT可能会造成真正的伤害,而OpenAI也深知这一点。

在该模型发布后不久,OpenAI首席执行官Sam Altman就在推特上写道,“ChatGPT的功能非常有限,但在某些方面足够好,足以造成一种伟大的误导性印象。现在在任何重要的事情上依赖它都是错误的。这是进步的预演;在稳健性和真实性方面,我们还有很多工作要做。”

在后来的一条推文中,他又写道,“它确实知道很多,但危险在于,它在很大一部分时间里是盲目自信的,是错误的。”

这又是怎么一回事?

ChatGPT的运作原理

为了理解像ChatGPT或Bing Chat这样的GPT模型是如何进行“虚构”的,我们必须知道GPT模型是如何运作的。虽然OpenAI还没有发布ChatGPT、Bing Chat甚至GPT-4的技术细节,但我们确实可以在2020年看到介绍GPT-3(它们的前身)的研究论文。

研究人员通过使用一种称为“无监督学习”的过程来构建(训练)大型语言模型,如GPT-3和GPT-4,这意味着他们用于训练模型的数据没有特别的注释或标记。在这个过程中,模型被输入大量的文本(数以百万计的书籍、网站、文章、诗歌、抄写本和其他来源),并反复尝试预测每个单词序列中的下一个单词。如果模型的预测与实际的下一个单词接近,神经网络就会更新其参数,以加强导致该预测的模式。

相反地,如果预测不正确,模型会调整参数以提高性能并再次尝试。这种试错的过程,虽然是一种称为“反向传播”(backpropagation)的技术,但可以让模型从错误中学习,并在训练过程中逐渐改进其预测。

因此,GPT学习数据集中单词和相关概念之间的统计关联。一些人,比如OpenAI首席科学家Ilya Sutskever,认为GPT模型比这更进一步,建立了一种内部现实模型,这样他们就可以更准确地预测下一个最佳令牌(token),但这个想法是有争议的。GPT模型如何在其神经网络中提出下一个令牌的确切细节仍然不确定。
在这里插入图片描述
在当前的GPT模型浪潮中,这种核心训练(现在通常称为“预训练”pre-training)只发生一次。在此之后,人们可以在“推断模式”(inference mode)下使用训练好的神经网络,允许用户将输入输进训练好的网络中并得到结果。在推理期间,GPT模型的输入序列总是由人提供的,它被称为“指令/提示”(prompt)。提示符决定了模型的输出,即使稍微改变提示符也会极大地改变模型产生的结果。

例如,如果你提示GPT-3“玛丽有一个……(Mary had a)”,它通常会用“小羊羔”来完成句子。这是因为在GPT-3的训练数据集中可能有成千上万个“玛丽有只小羊羔(Mary had a little lamb)”的例子,这使得它成为一个合理的输出结果。但是如果你在提示符中添加更多上下文,例如“在医院,玛丽有了一个(In the hospital, Mary had a)”,结果将会改变并返回“婴儿”或“一系列检查”之类的单词。

这就是ChatGPT的有趣之处,因为它被设定为与代理(agent)的对话,而不仅仅是一个直接的文本生成工作。在ChatGPT的情况下,输入提示是你与ChatGPT进行的整个对话,从你的第一个问题或陈述开始,包括在模拟对话开始之前提供给ChatGPT的任何具体指示。在此过程中,ChatGPT对它和你所写的所有内容保持短期记忆(称为“上下文窗口”),当它与你“交谈”时,它正试图完成对话的文本生成任务。
在这里插入图片描述
此外,ChatGPT不同于普通的GPT-3,因为它也接受了人类编写的对话文本的训练。OpenAI在其最初的ChatGPT发布页面中写道,“我们使用监督微调(supervised fine-tuning)来训练一个初始模型:人类AI训练师提供对话,在对话中,他们会扮演双方——用户和人工智能助手。我们为训练师提供了模型编写的建议,以帮助他们撰写自己的回答。”

ChatGPT还使用一种称为“基于人类反馈强化学习”(RLHF)的技术进行了更大的调整,在这种技术中,人类评分者会根据偏好对ChatGPT的回答进行排序,然后将这些信息反馈到模型中。通过RLHF,OpenAI能够在模型中灌输“避免回答无法准确应答的问题”的目标。这使得ChatGPT能够以比基础模型更少的虚构产生一致的响应。但不准确的信息仍会漏过。

为什么ChatGPT会产生虚构

从本质上讲,GPT模型的原始数据集中没有任何东西可以将事实与虚构区分开。

LLM的行为仍然是一个活跃的研究领域。即便是创建这些GPT模型的研究人员仍然在发现这项技术的惊人特性,这些特性在它们最初被开发时没有人预测到。GPT能够做我们现在看到的许多有趣的事情,比如语言翻译、编程和下棋,这一度让研究人员感到惊讶。

所以当我们问为什么ChatGPT会产生虚构时,很难找到一个确切的技术答案。由于神经网络权重有一个“黑匣子”(black box)元素,在给出一个复杂的提示时,很难(甚至不可能)预测它们的准确输出。尽管如此,我们还是知道一些虚构发生的基本原因。

理解ChatGPT虚构能力的关键是理解它作为预测机器的角色。当ChatGPT进行虚构时,它正在寻找数据集中不存在的信息或分析,并用听起来似是而非的词填充空白。ChatGPT特别擅长编造东西,因为它必须处理的数据量非常大,而且它收集单词上下文的能力非常好,这有助于它将错误信息无缝地放置到周围的文本中。

软件开发人员Simon Willison表示,“我认为思考虚构的最好方法是思考大型语言模型的本质:它们唯一知道怎么做的事情是根据统计概率,根据训练集选择下一个最好的单词。”

在2021年的一篇论文中,来自牛津大学和OpenAI的三位研究人员确定了像ChatGPT这样的LLMs可能产生的两种主要类型的谎言。第一个来自其训练数据集中不准确的源材料,例如常见的误解(如,“吃火鸡会让你昏昏欲睡”)。第二种源于对其训练数据集中不存在的特定情况进行推断;这属于前面提到的“幻觉”标签。

GPT模型是否会做出疯狂的猜测,取决于AI研究人员所说的“温度”(temperature)属性,它通常被描述为“创造力”(creativity)设置。如果创造力被设定得很高,模型就会疯狂猜测;如果它被设置为低,它将根据它的数据集确定地吐出数据。

最近,微软员工Mikhail Parakhin在推特上谈到了Bing Chat的幻觉倾向,以及产生幻觉的原因。他写道,“这就是我之前试图解释的:幻觉=创造力。它试图使用其处理的所有数据产生字符串的最高概率连续。它通常是正确的。有时人们从未制作过这样的连续。”

Parakhin补充道,这些疯狂的创造性跳跃正是LLM有趣的地方。你可以抑制幻觉,但你会发现这样超级无聊。因为它总是回答“我不知道”,或者只反馈搜索结果中的内容(有时也不正确)。现在缺失的是语调:在这些情况下,它不应该表现得那么自信。”

当涉及到微调像ChatGPT这样的语言模型时,平衡创造性和准确性是一个挑战。一方面,提出创造性回应的能力使ChatGPT成为产生新想法或消除作者瓶颈的强大工具。这也使模型听起来更人性化。另一方面,当涉及到产生可靠的信息和避免虚构时,源材料的准确性至关重要。对于语言模型的开发来说,在两者之间找到正确的平衡是一个持续的挑战,但这对于开发一个既有用又值得信赖的工具是至关重要的。

还有压缩的问题。在训练过程中,GPT-3考虑了PB级的信息,但得到的神经网络的大小只是它的一小部分。在一篇被广泛阅读的《纽约客》文章中,作者Ted Chiang称这是一张“模糊的网络JPEG”。这意味着大部分事实训练数据会丢失,但GPT-3通过学习概念之间的关系来弥补了这一点,之后它可以使用这些概念重新制定这些事实的新排列。就像一个有缺陷记忆的人根据预感工作一样,它有时会出错。当然,如果它不知道答案,它会给出最好的猜测。

我们不能忘记提示符在虚构中的作用。在某些方面,ChatGPT是一面镜子:你给它什么,它就给你什么。如果你给它灌输谎言,它就会倾向于同意你的观点,并沿着这些路线“思考”。这就是为什么在改变话题或遇到不想要的回应时,用一个新的提示重新开始是很重要的。ChatGPT是概率性的,这意味着它在本质上是部分随机的。即使使用相同的提示,它输出的内容也可能在会话之间发生变化。

所有这些都得出了一个结论,OpenAI也同意这个结论:ChatGPT目前的设计并不是一个可靠的事实信息来源,也不值得信任。AI公司Hugging Face的研究员兼首席伦理科学家Margaret Mitchell博士认为,“ChatGPT在某些事情上非常有用,比如在缩小写作瓶颈或提出创意想法时。它不是为事实而建的,因此也不会是事实。就是这么简单。”

撒谎能被纠正吗?

盲目地相信AI聊天机器人是一个错误,但随着底层技术的改进,这种情况可能会改变。自去年11月发布以来,ChatGPT已经升级了几次,其中一些升级包括准确性的提高,以及拒绝回答它不知道答案的问题的能力。

那么OpenAI计划如何让ChatGPT更准确呢?在过去的几个月里,我们多次就这个问题联系OpenAI,但没有得到任何回应。但我们可以从OpenAI发布的文件和有关该公司试图引导ChatGPT与人类员工保持一致的新闻报道中找到线索。

如前所述,ChatGPT如此成功的原因之一是因为使用RLHF进行了广泛的训练。OpenAI解释称,“为了让我们的模型更安全、更有帮助、更一致,我们使用了一种名为‘基于人类反馈强化学习(RLHF)’的现有技术。根据客户向API提交的提示,我们的标签器提供所需模型行为的演示,并对来自模型的几个输出进行排序。然后,我们使用这些数据对GPT-3进行微调。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/416208.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TCP报头结构和TCP协议特性

TCP报头结构 原端口号/目的端口号:表示数据是从哪个进程来,到哪个进程去; 32位序号/32位确认号:这个序号是取的发送方发送所用数据下一个字节的序号,发送方的序列号和接收方的确认号一样,才算接收成功&…

敏捷开发模式下如何用 PingCode 这类工具进行版本发布管理

在软件团队工作中,版本发布要达到好的发布效果,需要在版本发布前做好版本发布的规划,并对发布流程和进度进行管理 准备工作: 您已经创建了一个 PingCode 帐户【快速注册入口】 您创建了一个 PingCode Scrum或 Kanban 项目 您的…

【周末闲谈】文心一言,模仿还是超越?

个人主页:【😊个人主页】 系列专栏:【❤️周末闲谈】 周末闲谈 ✨第一周 二进制VS三进制 文章目录周末闲谈前言一、背景环境二、文心一言?(_)?三、文心一言的优势?😗😗😗四、文心一…

使用 arm 架构实例搭建 Harbor

使用 arm 架构实例搭建 Harbor事情准备(使用甲骨文云上实例时的准备事项)第1步,准备自签名证书第2步,安装Docker-ce第3步,构建arm镜像第4步,安装Harbor第5步,访问Harbor第6步,上传镜…

TensorFlow 深度学习第二版:1~5

原文:Deep Learning with TensorFlow Second Edition 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 深度学习 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 不要担心自己的形象,只…

2023年【第十四届蓝桥杯】省赛java b组填空题

第一题 令 S 1! 2! 3! ... 202320232023!,求 S 的末尾 9 位数字。 提示:答案首位不为 0。 考试时的想法以及题解: 如果我们直接按照题目描述直接来求每个阶乘和的话恐怕没有什么数据类型能够胜任,在考试时我一开始使用了…

Linux中的read/write和recv/send的区别,并使用recv/send实现简单的聊天功能

Linux中的read/write和recv/send的区别read/writeread/writeread/write的用法recv/sendrecv/sendrecv/send的用法LinuxLinuxLinux中的read/writeread/writeread/write和recv/sendrecv/sendrecv/send的区别下面是一个使用read/write进行文件读写操作的例子:下面是一个…

【云原生】Kubernetes(k8s)部署 MySQL+Dubbo+Nacos服务

一、说明二、部署 MySQL三、部署 Nacos四、部署 Dubbo 服务4.1. 创建镜像仓库的密钥4.2. 部署 provider 服务4.3. 部署 consumer 服务五、测试一、说明 本文介绍基于 Kubernetes(k8s) 环境集成阿里云 私有镜像仓库 来部署一套 Dubbo Nacos 的微服务系统,并使用 Ku…

VUE前端项目环境搭建

背景: 想要使用vue搭建一个前端项目,写个小网站练练手,因为没有前端经验,所以从网上找了一个vue得开源模板使用,经过一番挑选选中了字节公司花裤衩大佬开源得项目,地址如下: 开源项目地址&…

第三代api自动化测试框架使用教程(pytest+allure+sql+yaml)

使用教程一、配置1、环境配置2、框架配置3、启动入口二、用例编写1、用例模板2、参数依赖写法2、函数(方法插件)写法3、接口上传文件和表单参数4、接口上传json参数5、接口无数据填写6、code断言7、body断言7、json断言8、sql断言9、完整断言写法&#x…

三种不同实现ublk的零拷贝I/O的方法

用户态块设备ublk,就是提供/dev/ublkbX这样的标准块设备给业务,业务读写这个块的实际IO处理由编写的用户态的代码决定。这就好比使用FUSE,所有对挂载于FUSE的目录的读写都是编写的IO handler来处理一样。使用用户态块设备,可以方便…

产品经理必读|用户研究方法总结①

众所周知,理解用户需求,识别用户痛点,是产品或功能成型之前绕不开的过程。而要获取到用户真实的需求和痛点,唯一的方法就是做用户调研。而用研的方法都有哪些呢?今天我就来给大家分享一下行业中常见的用研方法。 用研的…

ESP32设备驱动-VL53L0X飞行时间(激光测距)传感器驱动

VL53L0X飞行时间(激光测距)传感器驱动 文章目录 VL53L0X飞行时间(激光测距)传感器驱动1、VL53L0X介绍2、硬件准备3、软件准备4、驱动实现1、VL53L0X介绍 VL53L0X 是新一代飞行时间 (ToF) 激光测距模块,采用当今市场上最小的封装,与传统技术不同,无论目标反射率如何,都能提…

项目中开发固定表头和首列的表格【付代码】

前言 前段时间做移动端的项目,项目中需要一个固定表头和首列的表格,但由于是移动端的,组件库里没有类似的,于是,就去网上找看有没有类似的,结果越找越气,10个文章9个抄,抄也行&#…

安全狗入选网络安全行业全景图(第十版)多个细分领域

4月7日,安全牛正式发布第十版网络安全行业全景图。 作为国内云原生安全领导厂商,安全狗也凭借综合的安全能力脱颖而出入选全景图多个领域。 据悉,全景图报告调研基于企业自主申报,并对申报企业收录有严格要求,安全牛…

Zookeeper集群+Kafka集群

目录 一、Zookeeper Zookeeper 概述 定义 工作机制 Zookeeper特点 Zookeeper数据结构 ZooKeeper应用场景 统一命名服务 统一配置管理 统一集群管理 服务器动态上下线 软负载均衡 第一次启动选举机制 非第一次启动选举机制 二、部署Zookeeper集群 1、实验准备 2…

第60章 用户增、修、删的前端实现

1 \src\components\Users\AddUser.vue <template> <!-- elmentUI 子页面的渲染显示注意事项说明&#xff1a; 子页面的渲染显示必须的使用“<el-dialog></el-dialog>标签及其所包含的子标签&#xff0c;否则子页面将不会被渲染显示出来。” --> <…

Python学习笔记--判断语句

&#xff08;一&#xff09; 布尔类型和比较运算符 1. 布尔类型&#xff1a;判断结果 True&#xff1a;表示真&#xff08;是、肯定&#xff09; False&#xff1a;表示假&#xff08;否、否定&#xff09; """ 演示布尔类型的定义 以及比较运算符的应用 "…

BCM系统组成及控制原理

1 输入控制 由于负载能力、抗干扰能力等客观情况。许多信号量无法直接施加至MCU之上&#xff0c;须有适当的输入电路(Input circuit)将信号进行隔离、调理&#xff0c;方可安全可靠地传递给MCU。 下面以开关信号和脉冲信号2种来分述。 1)开关信号的输入。 即将系统与电源正…

高频算法:Leetcode53 最大子数组和

今天讲的是Leetcode第53题&#xff0c;最大子数组和 首先观察题目&#xff0c;题目需要我们找出具有最大和的连续子数组&#xff0c;直接拿题目中的示例来做一个演示&#xff0c;找一找什么规律下的连续子数组才能得到最大的和 先从-2开始&#xff0c;-2 1 -1 此时我们的和…