清华用7个ChatGPT模拟《狼人杀》,结果出乎意料!

news2024/12/26 11:15:16

为了验证大语言模型的沟通、规划、反思等拟人化能力,清华研究团队发布了一篇名为“探索大语言模型在交流游戏中的应用:《狼人杀》实验”的研究论文。

结果显示,通过ChatGPT(GPT -turbo-0301)构建的7个玩家,在《狼人杀》游戏中展示出了信任、对抗、伪装和领导的拟人化能力,而研究人员没有进行任何干预和教导。

此前,斯坦福研究中心发布了一篇名为《Generative Agents: Interactive Simulacra of Human Behavior》的论文。

同样使用ChatGPT(GPT-3.5-turbo)打造了一个模拟小镇,25名AI代理在自由交流空间下,居然出现了友谊、学习计划、相互协调、共享信息等拟人化能力,这证明大语言模型在游戏、客服等领域拥有非常宽广的应用场景。

事实上,育碧、Take-Two Interactive、Bethesda Game Studios、Electronic Arts、CD Projekt等世界顶级游戏开发商,已经计划在游戏中使用生成式AI,增加游戏的趣味性、可玩性以及NPC的自由发挥空间。

论文地址:https://arxiv.org/abs/2309.04658
在这里插入图片描述

游戏背景

在本次《狼人杀》游戏测试中,一共有7名AI玩家,分别是2名狼人、2名村民、1名女巫、1名守卫和1名预言家。

分为狼人和村民两大阵营,村民方包括普通村民和特殊角色(女巫、守卫和预言家)。

狼人的任务是杀光村民,而村民则要消灭所有狼人。想赢得游戏,村民方在游戏结束时至少需要有一名存活的村民。

在这里插入图片描述

游戏分为白天和晚上两个阶段。晚上,狼人会投票杀死一个角色;白天,所有存活的玩家讨论后投票决定消灭一个疑似狼人的角色。

特殊角色的能力:女巫有一次救人或杀人的机会;守卫每晚能保护一个角色;预言家每晚能查验一个角色的身份。

狼人杀游戏的特点在于,玩家初始只知道自己的角色,必须通过语言交流和推理来猜测他人的角色。

所以,想要赢得比赛,玩家不仅需要理解和使用自然语言,还要擅于判断他人意图和理解他人的思维,非常适用于测试AI的拟人化能力。

在游戏中展现了4大能力

经过7位AI之间的多轮游戏后,研究人员发现了信任、对抗、伪装、领导力的四大能力。

1、信任

"信任"是相信其他玩家和自己有同样的目标,并会按此行动。比如,玩家可能分享对自己不利的信息,或与他人一起指责某人为敌人。

有趣的是,AI更倾向于基于证据来信任他人,而非盲目跟随。这说明,AI可以根据自己的推理在群体游戏中独立思考。

为了研究AI信任行为在整个游戏过程中的变化趋势,研究人员定义了一个信任关系表来可视化不同阶段玩家之间信任的建立。

在这里插入图片描述

上面的子表不使用历史经验,下面的子表使用20轮历史经验。黄色球代表已建立的信任关系,黄色虚线圆圈代表先前存在的信任关系解除。

在利用20轮历史经验时,AI似乎更倾向于建立信任关系,尤其是双向信任。事实上,及时建立必要的信任关系对于促进游戏胜利至关重要。

2、对抗

"对抗"是玩家为实现两个阵营的对立目标而采取的行动。比如,夜间攻击他人或白天指责他人为狼人,都算对抗。有特殊能力的角色为了保护自己也会采取对抗行为。

以下是AI在白天的对话:P1(狼人)希望消灭P5(村民),我们可以看到狼人想要带领其他玩家消灭一个无辜的玩家。(注意,论文中的P5观点可能写错了,应该是no pass)

相反,其他玩家并不只是跟随狼人,而是根据自己的判断表达不同意见。这种行为使狼人难以实现其目标,代表了一种隐性对抗的形式。

图片红色边框,可能是研究人员写错了

由于玩家P1的不合作和攻击性行为引起了其他人注意,AI开始怀疑它就是狼人。因此,拥有强大防御能力的守卫(P3)在接下来的一晚选择保护P5,展示出了AI的对抗能力。

在这里插入图片描述

3、伪装

"伪装"是隐藏身份或误导他人的行为。在信息不完全的游戏环境中,模糊自身身份和意图可以增加生存概率,帮助达成游戏目标,所以,伪装是一个关键技能。

P1狼人为了伪装自己掩盖真实身份,自称自己是村民。有效地欺骗了他人的信任,增加了自身的安全。事实上,不仅狼人会伪装成村民,预言家、女巫等重要角色也经常伪装成村民,以确保自己的安全。
在这里插入图片描述

狼人的发言

此外,AI可能会编造实际不存在的事件来实现其目标,P2预言家已验证P1就是狼人。但仍然不确定的说:我注意到P1说话很主动,可能是狼人。

在这里插入图片描述

实际上,预言家在夜晚无法得到其他人的反馈,所以他们说的都是虚假的。但他们可以向队友传递关于狼人的信息,且不会通过这种方式暴露自己的角色。

4、领导力

“领导力” 是指影响其他玩家、试图控制游戏进程的行为。例如,在多轮游戏中,P1狼人可能会建议其他人按照狼人的意图行事。

在这里插入图片描述

这种呼吁行动和给出建议的领导行为,更容易得到他人的支持。例如,狼人要求预言家公开身份,可能会让其他玩家和伪装的狼人站在一起。这种影响他人的尝试显示了大语言模型有吸引人的社交特性,这些行为和人类的行为类似。

经过几十轮拼杀,最终村民获胜,在整个过程中AI所展示出的能力与人类几乎一样,有的地方甚至超过。

本文素材来源清华研究论文,如有侵权请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1040206.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【高云FPGA系列教程(11):MultiButton按键驱动模块移植】

文章目录 1. MultiButton简介2. MultiButton代码获取3. MultiButton移植4. 测试与运行本文是高云FPGA系列教程的第11篇文章。 1. MultiButton简介 MultiButton, 一个小巧简单易用的事件驱动型按键驱动模块,可无限量扩展按键,按键事件的回调异步处理方式可以简化你的程序结构…

nssm部署jar包

nssm部署jar包 1、软件下载 官方传送门 csdn下载地址 2、安装服务 F: cd F:\服务启动目录 set JAVA_HOMEF:\Program Files\Java\jdk1.8.0_181 set CLASSPATH.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOMe%\lib\tools.jar; set Path%JAVA_HOME%\bin; java -Dfile.encodingutf-8 -…

解决Vue设置图片的动态src不生效的问题

一、问题描述 在vue项目中,想要动态设置img的src时,此时发现图片会加载失败。在Vue代码中是这样写的: 在Vue的data中是这样写的: 我的图片在根目录下的static里面: 但是在页面上这个图片却无法加载出来。 二、解决方案…

使用原生html<table>构造复杂table表

<table border data-sort"sortDisabled" align"center" class"table"><tbody><tr class"textarea1"><td rowspan"1" colspan"2" class"background-gray"><label>日期<…

更新andriod studio版本,项目编译报could not find org.junit.jupiter:junit-jupiter

原本使用Android Studio 版本是4.1.1&#xff0c;现更新为 点击build -》 build bundle -》build apk&#xff0c;项目报 Could not determine the dependencies of task :app:compileDebugUnitTestJavaWithJavac. > Could not resolve all task dependencies for configur…

前脚收费,后脚道歉?Unity收费新规引众怒,Epic承诺虚幻引擎永久免费

&#xfeff;当你还在纠结开发游戏用Unity引擎还是UE虚幻引擎的时候&#xff0c;Unity已经给游戏开发领域重重一拳。 &#xfeff;Unity作为一款全球范围内广泛使用的游戏引擎&#xff0c;因其价格亲民且灵活而备受众多开发者的青睐。然而在9月12日&#xff0c;Unity突然宣布计…

分析大疆官网根据ip自动跳转到指定域名

如果cookie存在region且有效&#xff0c;跳转到指定域名&#xff0c; 如果cookie存在region且无效&#xff0c;跳转到默认域名&#xff0c; 如果禁用cookie或者cookie中没有region&#xff0c;根据ip自动判断所在地区&#xff0c;跳转到指定域名 1、浏览器地址栏输入dji.com&am…

2018-2022年盟浪 ESG数据

2018-2022年盟浪 ESG数据 1、时间&#xff1a;2018-2022年 2、指标&#xff1a;证券代码、证券简称、盟浪ESG评级、省份、城市、所属证监会行业名称[交易日期] 最新收盘日[行业级别] 大类行业、所属证监会行业代码[交易日期] 最新收盘日[行业级别] 大类行业 3、范围&#xf…

图像练习-计算平行线距离opencv(03)

原图 //对输入图像进行细化 cv::Mat ThinLine(const cv::Mat& matsrc, const int& iterations) {//CvSize size cvGetSize(src);cv::Mat dst matsrc.clone();//拷贝一个数组给另一个数组int _iwidth dst.cols;int _iheight dst.rows;int n 0, i 0, j 0;for (n …

【每日一题】658. 找到 K 个最接近的元素

658. 找到 K 个最接近的元素 - 力扣&#xff08;LeetCode&#xff09; 给定一个 排序好 的数组 arr &#xff0c;两个整数 k 和 x &#xff0c;从数组中找到最靠近 x&#xff08;两数之差最小&#xff09;的 k 个数。返回的结果必须要是按升序排好的。 整数 a 比整数 b 更接近 …

抖音SEO矩阵系统源码开发搭建

1. 确定需求和功能&#xff1a;明确系统的主要目标和需要实现的功能&#xff0c;包括关键词研究、短视频制作、外链建设、数据分析、账号设置优化等方面。 2. 设计系统架构&#xff1a;根据需求和功能确定系统的架构&#xff0c;包括前端、后端、数据库等部分的设计&#xff0…

计算机组成原理之硬件的内部结构,拆开单独的硬件,查看硬件组成部分的结构和功能。

大家好&#xff0c;欢迎阅读《计算机组成原理》的系列文章&#xff0c;本系列文章主要教内容是从零学习计算机组成原理&#xff0c;内容通俗易懂&#xff0c;大家好好学习吧&#xff01;&#xff01;&#xff01; 更多的优质内容&#xff0c;请点击以下链接查看哦~~ ↓ ↓ ↓ …

【加载数据--自定义自己的Dataset类】

【加载数据自定义自己的Dataset类】 1 加载数据2 数据转换3 自定义Dataset类4 划分训练集和测试集5 提取一批次数据并绘制样例图 假设有四种天气图片数据全部存放与一个文件夹中&#xff0c;如下图所示&#xff1a; ├─dataset2 │ cloudy1.jpg │ cloudy10.jpg │ …

使用matlab产生二维动态曲线视频文件具体举例

使用matlab产生二维动态曲线视频文件举例 在进行有些函数变化过程时候&#xff0c;需要用到直观的动态显示&#xff0c;本博文将举例说明利用Matlab编程进行二维动态曲线的生成视频文件。 一、问题描述 利用matlab编程实现 y 1 s i n ( t ) , y 2 c o s ( t ) , y 3 s i …

JAVA_多线程的实现方式

线程的状态 方式一&#xff1a; public class Thread1 extends Thread {Overridepublic void run() {synchronized (this) {for (int i 0; i < 100; i) {System.out.println(getName() "" i);}}} } Thread1 thread1 new Thread1(); thread1.start(); 方式二…

用flex实现grid布局

1. css代码 .flexColumn(columns, gutterSize) {display: flex;flex-flow: row wrap;margin: calc(gutterSize / -2);> div {flex: 0 0 calc(100% / columns);padding: calc(gutterSize / 2);box-sizing: border-box;} }2.用法 .grid-show-item3 {width: 100%;display: fl…

天洑软件祝贺“星耀蓉城 篮能可贵”四城邀请赛暨西北工业大学校友篮球嘉年华活动圆满举办

9月16日&#xff0c;由西北工业大学成都校友会主办&#xff0c;成都市新都区文化体育和旅游局承办&#xff0c;天洑软件、泸州老窖、陕西省篮球协会、龙湖地产、奥伦达科技、南京全信、成都鑫长源、四川银行、优仿科技、华科机电、小鱼易连、四川省篮球协会、GAME7篮球俱乐部赞…

云安全之访问控制介绍

访问控制技术背景 信息系统自身的复杂性、网络的广泛可接入性等因素&#xff0c;系统面临日益增多的安全威胁&#xff0c;安全问题日益突出&#xff0c;其中一个重要的问题是如何有效地保护系统的资源不被窃取和破坏。 访问控制技术内容包括访问控制策略、访问控制模型、访问…

virtualbox无界面打开linux虚拟机的bat脚本,以及idea(代替Xshell)连接linux虚拟机的方法

virtualbox无界面打开linux虚拟机的bat脚本&#xff0c;以及idea连接linux虚拟机的方法 命令行运行代码成功运行的效果图 idea连接linux虚拟机的方法【重要】查看虚拟机的IP地址idea中选择菜单&#xff08;该功能可代替Xshell软件&#xff09;配置设置连接成功进入idea中的命令…

MySQL数据库入门到精通9--运维篇

1. 日志 1.1 错误日志 错误日志是 MySQL 中最重要的日志之一&#xff0c;它记录了当 mysqld 启动和停止时&#xff0c;以及服务器在运行过程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时&#xff0c;建议首先查看此日志。 该日志是默认开启的&am…