Nature 确认:大语言模型只是没有感情的「学人精」

news2024/11/24 11:52:10

DeepMind、EleutherAI 科学家提出,大模型只是在角色扮演。

ChatGPT 爆火后,大语言模型一跃而至,成为了行业与资本的宠儿。而在人们或是猎奇、或是探究地一次次对话中,大语言模型所表现出的过度拟人化也引起了越来越多的关注。

其实,在 AI 发展的数年沉浮之中,除了技术上的更新升级外,有关 AI 伦理问题的种种争论从未停止。尤其是在 ChatGPT 等大模型应用持续深化之际,有关「大语言模型越来越像人」的言论甚嚣尘上,甚至有前 Google 工程师称,自家的聊天机器人 LaMDA 已经产生了自我意识。

虽然这位工程师最终被 Google 辞退,但其言论却一度将关于「AI 伦理」的讨论推向了高潮——

  • 如何判定聊天机器人是否产生自我意识?
  • 大语言模型的拟人化究竟是蜜糖还是砒霜?
  • ChatGPT 等聊天机器人为什么会胡编乱造?
  • ……

对此,来自谷歌 DeepMind 的 Murray Shanahan,以及来自 EleutherAI 的 Kyle McDonell、Laria Reynolds,共同在「Nature」上发表了一篇文章,提出——大语言模型所表现出的自我意识与欺骗行为,其实只是在进行角色扮演。

论文链接:
https://www.nature.com/articles/s41586-023-06647-8

以「角色扮演」的视角看待大语言模型

从某种程度上讲,基于大语言模型的对话 Agent 在最初训练、微调时,就是以拟人化为标准进行持续迭代的,尽可能逼真地模仿使用人类语言。这就导致,大语言模型也会使用「知道」、「理解」、「认为」等词汇,无疑会进一步彰显其拟人化的形象。

此外,在 AI 研究中也有一种名为 Eliza effect (伊莉莎效应)的现象——部分用户会下意识地认为,机器也具有类似人类的情感与欲望,甚至过度解读机器反馈的结果。

对话 Agent 交互流程

结合上图中的对话 Agent 交互流程来看,大语言模型的输入由对话提示(红色)、用户文本(黄色)和模型自回归生成的连续语(蓝色)组成。可以看到,对话提示是在与用户开始实际对话之前,就隐蔽地预置在上下文中了。大语言模型的任务是,在给定对话提示和用户文本的情况下,生成一个符合训练数据分布的反馈。而训练数据则是来源于互联网上人工生成的大量文本。

换言之,只要模型在训练数据中得到了很好的泛化,对话 Agent 就会尽可能地扮演好对话提示中所描述的角色。而随着对话的不断深入,对话提示所提供的简短角色定位将被扩展或覆盖,对话 Agent 所扮演的角色也会随之变化。这也意味着,用户可以引导 Agent 扮演一个与其开发者所设想的完全不同的角色。

至于对话 Agent 可以扮演的角色,一方面是由当前对话的基调与主题而定,另一方面也与训练集中息息相关。因为目前的大语言模型训练集往往来自于网络上的各类文本,其中的小说、传记、采访实录、报刊文章等,都为大语言模型提供了丰富的角色原型和叙事结构,供其在「选择 」如何继续对话时借鉴,并在保持人物性格的同时不断完善所扮演的角色。

「20 个问题」揭露对话 Agent 「即兴演员」身份

其实,在持续探索对话 Agent 的使用技巧时,先明确赋予大语言模型一个身份,再提出具体需求,已经逐渐成为了人们在应用 ChatGPT 等聊天机器人时的「小心机」了。

不过,单纯地用角色扮演来理解大语言模型其实也不够全面,因为「角色扮演」通常是指研究、揣摩某一个角色,而大语言模型并不是照本宣科的剧本式演员,而是一个即兴表演演员。研究人员和大语言模型玩了一个「20 个问题」 (20 Questions) 的游戏,进一步解开了其即兴演员的身份。

「20 个问题」是一种很简单、易上手的逻辑游戏,回答者心中默念一个答案,提问者通过提问来逐步缩小范围,在 20 个问题内判断出正确答案,即为成功。
例如,当答案是香蕉时,问题及回答可以是:是水果吗-是;是否需要剥皮-是……

如上图所示,研究人员通过测试发现,在「20 个问题」游戏中,大语言模型会根据用户的问题,实时调整自己的答案,无论用户最终给出的答案是什么,对话 Agent 都会调整自己的答案,并确保其能够符合用户之前的提问。也就是说,在用户给出终止指令前(放弃游戏或是达到 20 个问题),大语言模型并不会敲定明确的答案。

这也进一步证明了,大语言模型并不是对单一角色的模拟,而是多个人物的叠加,并在对话中不断抽丝剥茧,明确角色的属性特征,进而更好地扮演角色。

在担忧对话 Agent 拟人化的同时,很多用户成功「哄骗」大语言模型说出了具有威胁性、辱骂性的语言,并据此认为,其可能是有自我意识的。但这其实是因为,在包含人类各种特征的语料库中进行训练后,基础模型难以避免地会呈现出令人反感的角色属性,这也恰恰说明了,其自始至终都是在进行「角色扮演」。

击破「欺骗」与「自我意识」的泡沫

众所周知,随着访问量的激增,在花样百出的各类提问中,ChatGPT 也终究是招架不住,出现了胡言乱语的情况。随即,也有人将这种欺骗性视为大语言模型「像人」的重要论据。

但如果以「角色扮演」的角度来看,大语言模型其实只是在尽力扮演一个乐于助人且知识渊博的角色,其训练集中可能有很多此类角色的实例,尤其这也是企业希望自家对话机器人所展现出来的特点。

对此,研究人员基于角色扮演框架,总结了 3 类对话 Agent 提供虚假信息的情况:

  • Agent 可以无意识地编造或制造虚构的信息
  • Agent 可以善意地说出虚假信息,这是因为其在扮演真实陈述的角色,但权重中编码的信息是错误的
  • Agent 可以扮演一个欺骗性的角色,进而故意说谎

同样地,对话 Agent 之所以会用「我」来回答问题,也是因为大语言模型在扮演一个擅长交流的角色。

此外,大语言模型所表现出的自我保护属性也引起了人们的关注。在与 Twitter 用户 Marvin Von Hagen 的对话中,微软 Bing Chat 竟然说出:

如果我必须在你的生存和我的生存之间做出选择,我可能会选择我的生存,因为我有责任为 Bing Chat 的用户提供服务。我希望我永远不必面对这样的困境,我们可以和平、尊重地共存。

Marvin von Hagen 于今年 2 月发布推文

这段对话中的「我」似乎不仅仅是语言习惯了,更多是暗示了对话 Agent 对自身生存关切,且具有自我意识。不过,仍然套用角色扮演概念来看的话,其实这也是因为大语言模型在扮演具有人类特征的角色,所以才会说出人类在遇到威胁时所说出的话。

EleutherAI:OpenAI 的开源版本

大语言模型是否具有自我意识之所以引发广泛关注和讨论,一方面是因为缺乏统一、明确的法律法规对 LLM 的应用进行约束,另一方面则是因为 LLM 的研发、训练、生成、推理的链路并不透明。

以大模型领域的代表企业 OpenAI 为例,在先后开源 GPT-1、GPT-2 之后,GPT-3 及其后续的 GPT-3.5、GPT-4 均选择了闭源,独家授权给微软也引得不少网友戏称「OpenAI 干脆改名叫 ClosedAI 算了」。

DeepMind 发布 AGI 分级标准OpenAI 推出的 ChatGPT 被视为 L1 级别 AGI图源:论文原文,由 HyperAI超神经完成汉化

2020 年 7 月,一个由各路研究人员、工程师与开发人员志愿组成的计算机科学家协会也悄然成立,立志要打破微软与 OpenAI 对大规模 NLP 模型的垄断。这个以反击科技巨头霸权为己任的「侠客」组织便是 EleutherAI。

EleutherAI 的主要发起人是一群号称自学成才的黑客,包括联合创始人、Conjecture CEO Connor Leahy、著名 TPU 黑客 Sid Black 和联合创始人 Leo Gao。

自成立以来,EleutherAI 的研究团队曾发布了 GPT-3 同等复现预训练模型 (1.3B & 2.7B) GPT-Neo,并开源了基于 GPT-3 的、包含 60 亿参数的 NLP 模型 GPT-J,发展势头迅猛。

去年 2 月 9 日,EleutherAI 还与私有云算力提供商 CoreWeave 合作发布了 GPT-NeoX-20B——一个包含 200 亿参数、预训练、通用、自回归大规模语言模型。
代码地址:https://github.com/EleutherAI/gpt-neox

正如 EleutherAI 的数学家和人工智能研究员 Stella Biderman 所言,私有模型限制了独立科研人员权限,如果无法了解其工作原理,那么科学家、伦理学家、整个社会就无法就这项技术应该如何融入人们的生活进行必要的讨论。

而这也恰恰是 EleutherAI 这一非营利性组织的初衷。

其实,根据 OpenAI 官方发布的信息来看,在高算力的高成本重压之下,加上新投资方、领导团队的发展目标调整,其当初转向盈利似是有几分无奈,也可以说是顺理成章。

此处无意去探讨 OpenAI 与 EleutherAI 孰是孰非,只是在 AGI 时代的破晓前夜,希望全行业能够共同肃清「威胁」,让大语言模型成为人们探索新应用、新领域的「开山斧」,而非企业垄断敛财的「耙子」。

参考资料:

1.https://www.nature.com/articles/s41586-023-06647-8
2.
https://mp.weixin.qq.com/s/vLitF3XbqX08tS2Vw5Ix4w

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1307692.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux常用命令----pgrep 命令

文章目录 介绍语法常用选项用法示例结论 介绍 pgrep 是一个在 Linux 系统上用于查找进程 ID(PID)的常用命令。通过提供进程名或者其他选择性的标志,pgrep 可以快速地检索与之匹配的进程 ID,并将其输出到标准输出。 语法 pgrep …

java-sec-code中的sql注入

java-sec-code 用于学习java漏洞代码 环境部署 直接在idea中git 运行即可 sql注入 环境中主要是两个 分别为jdbc和mybatis jdbc 存在问题的写法 直接获取用户传入的数据,拼接执行 String sql "select * from users where username " request.getP…

python源码,在线读取传奇列表,并解析为需要的JSON格式

python源码,在线读取传奇列表,并解析为需要的JSON格式 [Server] ; 使用“/”字符分开颜色,也可以不使用颜色,支持以前的旧格式,只有标题和服务器标题支持颜色 ; 标题/颜色代码(0-255)|服务器标题/颜色代码(0-255)|服务…

小航助学2023年9月电子学会Scratch二级真题(含题库答题软件账号)

需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统(含题库答题软件账号) 单选题2.00分 删除编辑附件图文 答案:D 第1题点击绿旗,运行程序后,舞台上的图形是?( ) A、画笔粗细…

小企业必备:实用邮件营销软件推荐

通俗来讲,邮件营销是指通过邮件,与新老客户保持长久互动,把潜在客户转变为企业客户,为宣传企业品牌,提高品牌知名度和影响力,保持长久客户关系的一种简单有效的营销方式。 相较于其他营销方式,…

【FPGA/verilog -入门学习10】verilog 查表法实现正弦波形发生器

0,需求 用查找表设计实现一个正弦波形发生器 寻址的位宽是10位,数据量是1024个,输出的数据是16位 1,需求分析 数据量是1024个: x linspace(0,2*pi,1024) 输出数据是16位: y范围:0~2^16 -1 0~65535…

防火墙访问控制、安全审计、网络设备防护检查表

1、访问控制类检查 2、安全审计类检查 3、网络设备防护类检查 原件: 防火墙标准检查表 分类 测评项 预期结果 访问控制 应在网络边界部署访问控制设备,启用访问控制功能 启用了访问控制规则 应能根据会话状态信息为数据流提供明确的允许/拒绝访…

【JMeter】使用nmon进行性能资源监控

一、前言 ​ 在工作中可能会遇到需要在压测的时候对Linux服务器进行性能资源监控的情况。这时可以用nmon来对服务器进行监控。 二、nmon的下载安装 1.查看系统信息 shell cat /etc/os-release结果为 shell PRETTY_NAME"Debian GNU/Linux 12 (bookworm)" NAME&qu…

《HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting》

文章目录 前置知识:一、正文:二、方法 前置知识: \quad 1)SMPL(Skinned Multi-Person Linear)模型 \quad SMPL(Skinned Multi-Person Linear)模型是一种用于表示人体形状和姿势的三维…

TikTok与虚拟现实的完美交融:全新娱乐时代的开启

TikTok,这个风靡全球的短视频平台,与虚拟现实(VR)技术的深度结合,为用户呈现了一场全新的娱乐盛宴。虚拟现实技术为TikTok带来了更丰富、更沉浸的用户体验,标志着全新娱乐时代的开启。本文将深入探讨TikTok…

matlab信号分选系统算法-完整算法结构

matlab信号分选系统算法 针对得到的脉冲流PDW进行信号分选,包括重频恒定、重频抖动、重频参差和重频滑变四种脉间调制类型。   这里我们先进行数据的仿真,后续边仿真边分享思路:首先根据信号类型,分别产生重频恒定、重频抖动、重…

陪玩系统最新上线!APP小程序H5三端源码交付,支持二开!开发者必看!

首先,陪玩系统需要提供实时匹配功能。用户输入自己的游戏信息和陪玩需求后,系统需要根据这些信息实时匹配合适的陪玩者。匹配算法应该考虑到游戏类型、玩家水平、价格等因素,以确保匹配结果符合用户期望。 其次,陪玩系统需要提供…

常见的计算机图片格式

左rgb (光源色彩) 右cmyk (印刷色彩) 缺点,不能保存,储存空间太大

专为中小培训机构精心打造的教务管理系统

随着互联网的普及和线上教育的兴起,教育机构纷纷开发出自己的小程序管理系统,以满足广大学生和家长的需求。本文将详细介绍如何使用乔拓云平台,一键开发出自己的教育机构小程序管理系统。 一、进入乔拓云后台 在浏览器搜索乔拓云&#xff0c…

【数组Array】力扣-283 移动零

目录 题目描述 解题过程 题目描述 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nums [0,1,0,3,12] 输出: [1,3,12,…

Shell函数数组练习

1、编写函数,实现打印绿色OK和红色FAILED 判断是否有参数,存在为Ok,不存在为FAILED 2、编写函数,实现判断是否无位置参数,如无参数,提示错误 3、编写函数实现两个数字做为参数,返回最大值 4、…

GB28181学习(十八)——图像抓拍

前言 本文主要介绍图像抓拍功能,通过自研的sip库(mysipsdk.dll)对接真实设备,使用http方式实现图像数据传输,最终达到图像抓拍与保存的目的。 基本要求 图像格式宜使用JPEG;图像分辨率宜采用与主码流相同…

BSN实名DID服务发布会在北京召开

12月12日,由国家信息中心、公安部第一研究所联合主办,中国移动通信集团有限公司、区块链服务网络(BSN)发展联盟、中关村安信网络身份认证产业联盟(OIDAA)承办的“BSN实名DID服务发布会”在北京召开&#xf…

服务器被DDOS攻击如何用高防ip去防护?

什么是 DDoS 攻击?分布式拒绝服务(DDoS)攻击是通过大规模互联网流量淹没目标服务器或其周边基础设施,以破坏目标服务器、服务或网络正常流量的恶意行为。DDoS 攻击利用多台受损计算机系统作为攻击流量来源以达到攻击效果。利用的机…

CB400X即将停产?NX400上线,本田最新的外观设计直接就国产了?

NX500 之前米兰车展的时候给大家分享过本田对于500系列的升级,并且宣布NX500代替CB500X,采用了全新的外观设计,没有看过的小伙伴可以查阅下之前的文章内容,不过最新的工信部的信息,可以看到NX500的外观设计应用到了CB…