七个LLM的狼人杀之夜

七个LLM的狼人杀之夜

news2026/2/13 5:03:05

深度学习自然语言处理原创
作者：Winnie

在最新一篇论文中，研究团队让一群大语言模型(LLM)开了一局狼人杀游戏。通过多种Prompt方法集成，LLM不仅成功地参与了游戏，还涌现出了信任、欺诈和领导力等团体能力。

Paper: Exploring Large Language Models for Communication Games: An Empirical Study on Werewolf
Link: https://arxiv.org/abs/2309.04658

进NLP群—>加入NLP交流群

问题定义

在这场狼人杀游戏中，七名LLM被分配了五种不同的角色，包括狼人、村民、女巫、守卫和预言家。游戏在白天和黑夜之间交替进行，每个阶段都有特定的活动和决策需要做出。

Prompt方法

为了让LLM智能体能够更好地适应这种动态和策略性十足的游戏环境，研究团队运用了多种prompt方法来促进推理。对于每个LLM参与者，它的prompt如下图所示：

研究人员为每个角色定义了一些基本问题。这些问题旨在回忆有用的信息。此外，它们还起到了指导LLM初始思维的作用。这些问题如下表所示。

实验结果

为了评估prompt方法，作者变体模型输出中提取了50个响应，进行了人工评估。在这个过程中，评注者需要判断每个输出的合理性，其中包括检查是否存在幻觉、是否忽视了其他因素的影响或是否采取了反直觉的行动。下图展示了方法的效果。结果清楚地表明，完整的prompt方法可以比其他任何变体产生更合理和更现实的响应。

此外，游戏中观察到LLM在游戏规则或提示中表现出一些没有明确预编程的战略行为。这些行为分为四类，包括信任、对抗、伪装和领导。

结语

经过一系列游戏实验，LLM不仅展示了深刻的游戏理解力，还成功地模拟了人类玩家在游戏中可能展示的多元特质。这项实验不仅丰富了我们对LLM在策略游戏中的能力理解，还为未来的多LLM合作解决任务打开了新的可能性。

进NLP群—>加入NLP交流群

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1014171.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

校园网web免认真,大量服务器

校园网web免认真,大量服务器

服务器加满了，没有几个人来，传点图片看实力什么方法解web认证方式校园网？ 一般的校园网是对学生免费开放的，假如你是学生输入学号密码上网就是了，假如你不是那就是想蹭网了，再假如你不想让管理员或上网行为…

阅读更多...

idea部署javaSE项目(awt+swing项目)/idea导入eclipse的javaSE项目

idea部署javaSE项目(awt+swing项目)/idea导入eclipse的javaSE项目

一.idea打开项目选择需要部署的项目二、设置JDK 三、引入数据库驱动包四、执行sql脚本四、修改项目的数据库连接找到数据库连接文件五.其他系统实现 JavaSwing实现学生选课管理系统 JavaSwing实现学校教务管理系统 JavaSwingsqlserver学生成绩管理系统 JavaSwing用…

阅读更多...

【mysql】1044 - Access denied for user ‘root‘@‘%‘ to database ‘test_job‘

【mysql】1044 - Access denied for user ‘root‘@‘%‘ to database ‘test_job‘

登录mysql 为新建的库创建账号和授权创建和授权命令 grant all on test_job.* to job% identified by 12345;flush privileges; 返回信息 grant all on test_job.* to job% identified by 12345 > 1044 - Access denied for user root% to database test_job > 查询…

阅读更多...

vscode和HBuilderx设置快捷键注释

vscode和HBuilderx设置快捷键注释

一、vscode设置快捷键注释 1.打开vscode，使用快捷键：ctrlshiftp mac的话快捷键是：commandshiftp 然后在行中输入snippets 2.选择“新建”，选择将要配置的文件类型（以vue类型为例）我这里创建的名字为vue.…

阅读更多...

数据安全至上：使用API接口定期备份设备的维修保养记录

数据安全至上：使用API接口定期备份设备的维修保养记录

在设备管理中，维修保养记录是非常宝贵的信息，不仅记录了设备的维修历史，还有助于未来的决策和分析。然而，数据丢失或损坏可能会导致重大问题。为了确保数据的安全性，定期备份是必不可少的。本文将详细介绍如何使用API接…

阅读更多...

牛客: BM7 链表中环的入口结点

牛客: BM7 链表中环的入口结点

牛客: BM7 链表中环的入口结点文章目录牛客: BM7 链表中环的入口结点题目描述题解思路题解代码题目描述题解思路用一个哈希表存储链表节点,遍历链表,将节点加入哈希表,如果该节点在哈希表中出现过,意味着该节点是入口节点题解代码 package mainfunc EntryNodeOfLoop(p…

阅读更多...

etcd之读性能主要影响因素

etcd之读性能主要影响因素

1、Raft模块-线性读ReadIndex-节点之间的RTT延时、磁盘IO 线性读时Follower节点首先会向Raft 模块发送ReadIndex请求，此时Raft模块会先向各节点发送心跳确认，一半以上节点确认 Leader 身份后由leader节点将已提交日志索引 (committed index) 封装成 Rea…

阅读更多...

Linux下如何查看正在运行的Nginx使用的配置文件

Linux下如何查看正在运行的Nginx使用的配置文件

Linux下如何查看正在运行的Nginx使用的配置文件 1. 查看nginx的进程id2. 查询对应端口的nginx路径3. 使用-t参数获取改进程对应的配置文件路径nginx命令 1. 查看nginx的进程id #查询nginx是9000端口的PID netstat -lntup | grep 90002. 查询对应端口的nginx路径 ll /proc/150…

阅读更多...

万兆网络变压器(网络滤波器/脉冲变压器)在光模块产品上的应用

万兆网络变压器(网络滤波器/脉冲变压器)在光模块产品上的应用

Hqst盈盛（华强盛）电子导读：随着5G网络技术的发展，万物互联的愿景变得越来越现实，在网络技术高速发展的过程中，网络设备和元器件的发展也在适应着这种技术变化，其中的光电器件：光模块…

阅读更多...

回顾多线程

回顾多线程

1.线程有几种状态 public enum State {//新生NEW,//运行RUNNABLE,//阻塞BLOCKED,//等待WAITING,//超时等待TIMED_WAITING,//终止TERMINATED;} 2.wait和sleep的区别 1.来自不同的类 wait>Object类 sleep > Thread类 2.关于锁的释放 wait 会释放锁， s…

阅读更多...

智能远程监考方案助力企业考试化繁为简

智能远程监考方案助力企业考试化繁为简

在音视频数字化之旅中，轻装上阵。近年来，在数字化浪潮之下，远程考试频繁成为各领域热词，各企业也纷纷改革求新，将原本的企业内部考试转移到线上，从而获取更低廉的组考成本，更高的管理效率&…

阅读更多...

程序和进程

程序和进程

一些基本概念： 进程的状态转换

阅读更多...

Ardupilot — EKF3使用光流室内定位代码梳理

Ardupilot — EKF3使用光流室内定位代码梳理

文章目录前言 1 Copter.cpp 1.1 void IRAM_ATTR Copter::fast_loop() 1.2 void Copter::read_AHRS(void) 1.3 对象ahrs说明 2 AP_AHRS_NavEKF.cpp 2.1 void AP_AHRS_NavEKF::update(bool skip_ins_update) 2.2 void AP_AHRS_NavEKF::update_EKF3(void) 2.3 对象EKF3说…

阅读更多...

LeetCode【27. 移除元素】

LeetCode【27. 移除元素】

为国捐躯赴战场，丹心可并日争光。给你一个数组 nums 和一个值 val，你需要原地移除所有数值等于 val 的元素，并返回移除后数组的新长度。不要使用额外的数组空间，你必须仅使用 O(1) 额外空间并原地修改输入数组。元素的顺…

阅读更多...

[面试] 15道最典型的k8s面试题

[面试] 15道最典型的k8s面试题

文章目录在 Kubernetes 中，有以下常见的资源对象：1.什么是 Kubernetes？它的主要特点是什么？2. Kubernetes 中的 Pod 是什么？它的作用是什么？3.Kubernetes 中的 Deployment 和 StatefulSet 有何区别&#x…

阅读更多...

无涯教程-JavaScript - MATCH函数

无涯教程-JavaScript - MATCH函数

描述 MATCH函数在单元格范围内搜索指定的项目,然后返回该项目在该范围内的相对位置。当您需要某个项目在范围中的位置而不是项目本身时,请使用MATCH而不是LOOKUP函数之一。如。您可以使用MATCH函数为INDEX函数的row_num参数提供一个值。语法 MATCH (lookup_value, lookup…

阅读更多...

【送书活动】大模型赛道如何实现华丽的弯道超车

【送书活动】大模型赛道如何实现华丽的弯道超车

文章目录导读前言AI/ML 模型训练任务对数据平台的需求01 具备对海量小文件的频繁数据访问的 I/O 效率02 提高 GPU 利用率，降低成本并提高投资回报率03 支持各种存储系统的原生接口04 支持单云、混合云和多云部署核心密码01 通过数据抽象化统一数据孤岛02 通过分布…

阅读更多...

Linux命令200例：apt-get软件包管理工具的使用

Linux命令200例：apt-get软件包管理工具的使用

🏆作者简介，黑夜开发者，CSDN领军人物，全栈领域优质创作者✌。CSDN专家博主，阿里云社区专家博主，2023年6月csdn上海赛道top4。 🏆数年电商行业从业经验，历任核心研发工程师&#xff0…

阅读更多...

一文带你了解2023年最新央企名单、业务和管理机构（附资料）

一文带你了解2023年最新央企名单、业务和管理机构（附资料）

前两天有个朋友留言问华研荟关于国企和央企的问题，他说经常在电视或网上看到国企、央企的表述，这两个的区别是什么？国企不都是国家所有吗？为什么还要有央企一说呢？ 今天华研荟就来带大家了解一下两者的区别&#xff0…

阅读更多...

RISC-V Reader 笔记（六）RV32V

RISC-V Reader 笔记（六）RV32V

RV32V 早期并行数据计算：采用 SIMD 单指令多数据，把一个64位宽寄存器拆成若干个32 16 8 位长度部分并行计算。这种方法前期看起来十分简单诱人。但是后来如果要扩展 SIMD 寄存器宽度，也要复杂化指令集，复杂开销越来越大。向量操作…

阅读更多...

推荐文章

最新文章