Thinking for Doing:让LLMs能推断他人心理状态来做出适当的行动。

news2024/12/23 13:32:59

LLMs通常能回答有关心理状态的问题,但往往不能将这些推断用于实际行动。例如,如果一个故事中的角色正在寻找他的背包,而模型知道背包在厨房里,那么模型应该能推断出最好的行动是建议角色去厨房查看。

T4D 的目的就是要求模型不仅要能回答有关其他人心理状态的问题(这是许多现有评估方法的焦点),还要能根据这些推断来选择最佳的行动方案。

论文:arxiv.org/abs/2310.03051
PDF:arxiv.org/pdf/2310.03051…

解决方案

为了解决这一问题,作者引入了一个零样本提示框架,名为“Foresee and Reflect”(FaR),该框架能显著提高LLMs在T4D上的性能。
工作原理

Foresee and Reflect”(FaR)主要由两个组件组成:预见(Foresee)和反思(Reflect)。

1. 预见(Foresee)
在这一阶段,模型被引导去预测或预见可能的未来事件或行动,并对它们进行初步的评估。这通常涉及到对故事或场景中角色的心理状态(如信念、意图等)的理解,并基于这些理解来预测他们可能会采取哪些行动。

2. 反思(Reflect)
在预见阶段之后,模型进入反思阶段。在这里,模型需要重新考虑其先前的预测和评估,以确定是否需要调整或优化。这可能涉及到更深入地理解角色的心理状态,或者考虑更多的环境因素和可能的结果。
FaR 在 T4D 中的应用

通过结合预见和反思两个阶段,FaR 框架能够引导模型进行更结构化、更深入的推理。这不仅有助于模型更准确地理解角色的心理状态,还使其能够更有效地将这些理解转化为适当的行动或决策。例如,如果在一个故事中,一个角色想找到他的背包,模型首先会在预见阶段预测角色可能会去哪里找。然后,在反思阶段,模型可能会考虑其他因素,如角色过去在哪里找到过背包,或者在当前环境中哪些地方最可能存放背包,从而优化其行动建议。a290f304ff0d345af8defe96761c9de6.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1068949.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript-mooc(纯分享)

第一步下载软件 mooc_v1.3.2_windows_amd64.zip - 蓝奏云 解压后打开有这么多文件 用记事本的打开方式打开config的文件 第一个尖头改成你学校对应慕课英华网址 第二个箭头是你的账号 第三个箭头是你的密码 改好后点击文件保存 最后一步点击运行 {"global": {&qu…

零代码编程:用ChatGPT一键自动制作英文绘本音频

读英文绘本,对于儿童的英语启蒙非常重要。在这个过程中,必然要父母给孩子读大量的英文绘本,这会非常累。有些英文绘本自带音频,直接播放即可,这就轻松多了。如果没有自带音频呢?这时候可以从YouTube下载绘本…

应用在智能家电中的触摸感应芯片

智能家电就是将微处理器、传感器技术、网络通信技术引入家电设备后形成的家电产品,具有自动感知住宅空间状态和家电自身状态、家电服务状态,能够自动控制及接收住宅用户在住宅内或远程的控制指令;同时,智能家电作为智能家居的组成…

Linux常见指令3

Linux常见指令3 一.Linux指令1.时间相关的指令1.date指定格式显示时间2.时间戳3.补充内容-日志3.Cal 2.find补充1.which2.whereis 3.uname-a-r 4.重要的几个热键5.关机命令 二.grep-i选项-n选项-v选项grep其他用途1.搜索指定进程信息2.查找日志等级 补充命令补充命令:sort补充命…

void * 类型指针

目录 一、什么是void *类型指针 二、void *类型指针作用 三、void *类型指针的用法 一、什么是void *类型指针 void *类型指针是无具体类型指针。不能直接进行解引用操作,也不能进行加减整数的操作。 二、void *类型指针作用 void *类型指针可以用于接收任意类型…

【2023集创赛】平头哥杯一等奖作品:基于无剑100开源SoC平台构建双核TEE安全系统

本文为2023年第七届全国大学生集成电路创新创业大赛(“集创赛”)平头哥杯一等奖作品分享,参加极术社区的【有奖征集】分享你的2023集创赛作品,秀出作品风采,分享2023集创赛作品扩大影响力,更有丰富电子礼品…

超全整理,Jmeter接口性能测试-Beanshell调用jar包加密(详细)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、添加beanshell…

Jmeter控制RPS

一、前言 ​ RPS (Request Per Second)一般用来衡量服务端的吞吐量,相比于并发模式,更适合用来摸底服务端的性能。我们可以通过使用 JMeter 的常数吞吐量定时器来限制每个线程的RPS。对于RPS,我们可以把他理解为我们的TPS,我们就不…

《软件方法(下)》第8章2023版连载(05)关于实体类

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 8.2 建模步骤C-1 识别类和属性 8.2.2 三种分析类 8.2.2.2 关于边界类 边界类的责任是接受输入、提供输出以及做简单的过滤。 图8-20中提到边界类的映射方法——每个有接口的外系统…

Linux TCP协议通信 (流程 三次握手 四次挥手 滑动窗口)

TCP通信流程 Socket函数 TCP通信实现&#xff08;服务器端&#xff09; #include <stdio.h> #include <arpa/inet.h> #include <unistd.h> #include <string.h> #include <stdlib.h> int main() {//1.创建socketint lfd socket(AF_INET, SOCK_…

微软首款AI芯片代号“雅典娜”;马斯克四年内将让“星舰”上火星丨 RTE 开发者日报 Vol.61

开发者朋友们大家好&#xff1a; 这里是**「RTE 开发者日报」&#xff0c;每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE &#xff08;Real Time Engagement&#xff09; 领域内「有话题的新闻**」、「有态度的观点」、「有意思的数据」、「有思考的文章」…

关于对XSS原理分析与绕过总结

一、原理 该文章仅用于信息防御技术教学&#xff0c;请勿用于其他用途。 1、XSS原理 XSS&#xff08;跨站脚本攻击&#xff09;是一种常见的网络安全漏洞&#xff0c;攻击者通常会在网页中插入恶意的 JavaScript 代码。由于服务器对输入数据的过滤和验证不严格&#xff0c;这…

刘京城:我的《软件方法》学习经历(有彩蛋)

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 写在前面&#xff08;潘加宇&#xff09; 下面是刘京城写的关于他学习《软件方法》的经历。我在前面啰嗦几句。 我做软件建模方面的研究和普及工作已经24年了&#xff0c;和各行各业…

机器学习-数值特征

离散值处理 import pandas as pd import numpy as npvg_df pd.read_csv(datasets/vgsales.csv, encoding "ISO-8859-1") vg_df[[Name, Platform, Year, Genre, Publisher]].iloc[1:7]NamePlatformYearGenrePublisher1Super Mario Bros.NES1985.0PlatformNintendo2…

30 数据分析常见概念(略写可跳)

文章目录 数据科学领域概述数据如何驱动运营给企业带来价值岗位关键词说明业务的商业模式 数据指标数据指标定义及常用数据指标如何选取指标分析角度计数流量导向的工具内容导向的工具用户导向的工具业务导向的工具 数据分析方法对比分析多维分析漏斗分析留存分析总结 用户画像…

王兰去(黑客)自学

前言&#xff1a; 想自学网络安全&#xff08;黑客技术&#xff09;首先你得了解什么是网络安全&#xff01;什么是黑客 网络安全可以基于攻击和防御视角来分类&#xff0c;我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术&#xff0c;而“蓝队”、“安全运营”、“…

京东数据分析软件:2023年8月京东彩妆行业品牌销售排行榜

鲸参谋监测的京东平台8月份彩妆市场销售数据已出炉&#xff01; 根据鲸参谋平台的数据显示&#xff0c;今年8月份&#xff0c;京东平台上彩妆行业的销量将近390万&#xff0c;其中&#xff0c;环比来看增长约11%&#xff0c;同比则降低约34%&#xff1b;销售额为6.3亿&#xf…

springcloud之项目实战环境准备

写在前面 为了更好的学习springcloud&#xff0c;我们来一起开发一个实战项目&#xff0c;加深理解。 1&#xff1a;项目介绍 在开始项目实战之前先来做一个整体的项目介绍&#xff0c;从而能够让对项目的整体架构和模板有一个比较清晰的认知。 大家都知道双11&#xff0c;…

百元开放式耳机哪款好一点耐用、百元耳放推荐

在耳机品类中&#xff0c;佩戴无需入耳、可保持耳道舒适的开放式耳机正成为新的潮流&#xff0c;不仅不少消费者趋之若鹜&#xff0c;相对于传统入耳式耳机&#xff0c;开放式耳机具备开放双耳的特性&#xff0c;能敞开耳道&#xff0c;让耳朵随时呼吸&#xff0c;保持干燥透气…

华为云CodeArts Check代码检查插件(CodeArts IDE本地版本)使用指南

CodeArts Check 代码检查插件&#xff08;CodeArts IDE本地版本&#xff09; 本插件致力于守护开发人员代码质量&#xff0c;成为开发人员的助手和利器。秉承极简、极速、即时看护的理念&#xff0c;提供业界规范&#xff08;含华为云&#xff09;的检查、代码风格一键格式化及…