LLM reasoners 入门实验 24点游戏

news2025/4/17 22:35:18

LLM reasoners

Ber666/llm-reasoners

实验过程

实验样例24games，examples/tot_game24，在inference.py中配置使用代理和open ai的api key。

首先安装依赖

git clone https://github.com/Ber666/llm-reasoners
cd llm-reasoners
pip install -e .

然后在多个案例中，本例使用24点游戏作为实验（因为这个案例默认使用chatgpt-3.5，相比其它要下载模型参数的实验更简单）。

放置数据集文件，刚开始只需要一个样例1 2 3 4（单单一个样例，程序都要运行几分钟才能得到最终答案）

修改代码中的路径，使其指向正确文件，主要是24点数据集，以及prompt的json文件。修改后的相应代码如下：

dataset = utils.read_data(file='./data/24.csv')[0:1]
...
def main(batch_size: int = 2,
         prompts: str = './prompts/game24.json',
         disable_log: bool = False,
         model: str = 'gpt-3.5-turbo',
         temperature: float = 0.7,
         **kwargs):

然后配置运行，等了几分钟，发出几十个请求后，终于看到结果。

调试发现，程序大部分时间在beam_search.py的for循环内执行，从代码阅读猜测，每个beam是一个搜索路径，程序不断在规划、探索每个搜索路径，尝试找到正确的24点计算公式。
在这里插入图片描述

拓展阅读

发现有其它关于TOT的仓库，且都有3K start，相比当前仓库的300 star更多。

https://github.com/princeton-nlp/tree-of-thought-llm
https://github.com/kyegomez/tree-of-thoughts
https://www.youtube.com/watch?v=ut5kp56wW_4 YK解读Tree of thoughts

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/839990.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

JVM入门到精通

JVM入门到精通

一、JVM概念 1.1、什么是JVM Java Virtual Machine：Java虚拟机，用来保证Java语言跨平台 Java虚拟机可以看做是一台抽象的计算机，如同真实的计算机那样，它有自己的指令集以及各种运行时内存区域 Java虚拟机与Java语言并没有必然…

阅读更多...

Maven-搭建私有仓库

Maven-搭建私有仓库

使用NEXUS REPOSITORY MANAGER 3在Windows上搭建私有仓库。 NEXUS REPOSITORY MANAGER 3 是一个仓库管理系统。下载NEXUS3 官网上是无法下载的,所以网上搜nexus-3.18.1-01-win64就能搜到,下载即可。安装NEXUS3 下载nexus-3.18.0-01-win64.zip至相应目录下(路径不要有中文)。 …

阅读更多...

[Realtek sdk-3.4.14b]RTL8197FH-VG+RTL8812F WiFi开启访客网络之后无法扫描到SSID问题分析及解决方案

[Realtek sdk-3.4.14b]RTL8197FH-VG+RTL8812F WiFi开启访客网络之后无法扫描到SSID问题分析及解决方案

问题描述 realtek sdk-3.4.14b 开启访客网络之后，发现无法扫描到SSID，可以看到接口已经up，但是设备无法搜到WiFi热点问题分析查看网口状态 ifconfig查看wlan0-va0接口TX/RX的数据包都是0，表示没有发送或者接收到数据包，正常wifi启动之后，都会有Beacon包发出，也会接…

阅读更多...

【Redis】——RDB快照

【Redis】——RDB快照

Redis 是内存数据库，但是它为数据的持久化提供了两个技术，一个是AOF日志，另一个是RDB快照： AOF 文件的内容是操作命令；RDB 文件的内容是二进制数据。 RDB 快照就是记录某一个瞬间的内存数据，记录的是实际…

阅读更多...

Vue中，$forceUpdate()的使用

Vue中，$forceUpdate()的使用

在Vue官方文档中指出，$forceUpdate具有强制刷新的作用。那在vue框架中，如果data中有一个变量:age，修改他，页面会自动更新。但如果data中的变量为数组或对象，我们直接去给某个对象或数组添加属性，页面是识…

阅读更多...

JMeter 4.x 简单使用

JMeter 4.x 简单使用

文章目录前言JMeter 4.x 简单使用1. 启动2. 设置成中文3. 接口测试3.1. 设置线程组3.2. HTTP信息请求头管理器3.3. 添加HTTP请求默认值3.4. 添加HTTP cookie 管理3.5. 添加http请求3.5.1. 添加断言 3.6. 添加监听器-查看结果树3.7. 添加监听器-聚合报告 4. 测试前言如果您觉…

阅读更多...

TBB库中实现协程(coroutine)的源码说明

TBB库中实现协程(coroutine)的源码说明

源码请见: https://github.com/oneapi-src/oneTBB/blob/master/src/tbb/co_context.h 在windows系统，TBB(也就是intel 的 oneTBB库)，通过windwos fiber(纤程)来实现协程(coroutine)。创建一个协程,代码很简洁: inline void create_coroutine(corouti…

阅读更多...

docker【安装、存储、镜像、仓库、网络、监控】

docker【安装、存储、镜像、仓库、网络、监控】

docker-0110.0.0.51docker-0210.0.0.52docker-0310.0.0.53 【1】docker安装 docker-01 [rootdocker-01 ~]# vim /etc/yum.conf [main] cachedir/var/cache/yum/$basearch/$releasever keepcache1 debuglevel2 logfile/var/log/yum.log exactarch1 obsoletes1 gpgcheck1 plugin…

阅读更多...

安防监控视频融合EasyCVR平台接入RTSP流后设备显示离线是什么原因？

安防监控视频融合EasyCVR平台接入RTSP流后设备显示离线是什么原因？

安防监控视频EasyCVR视频汇聚融合平台基于云边端智能协同架构，具有强大的数据接入、处理及分发能力，平台支持海量视频汇聚管理、全网分发、按需调阅、鉴权播放、智能分析等视频能力与服务。平台开放度高、兼容性强、可支持灵活拓展与第三方集成&#xff…

阅读更多...

GO学习之函数(Function)

GO学习之函数(Function)

GO系列 1、GO学习之Hello World 2、GO学习之入门语法 3、GO学习之切片操作 4、GO学习之 Map 操作 5、GO学习之结构体操作 6、GO学习之通道(Channel) 7、GO学习之多线程(goroutine) 8、GO学习之函数(Function) 文章目录 GO系列前言一、什么是函数？二、函数声明…

阅读更多...

vue响应数据为二维码如何渲染到页面

vue响应数据为二维码如何渲染到页面

在postman测试请求后发现响应数据为一个二维码图片,不是链接,如何解决? 然后如果在vue中使用请求还会报Uncaught (in promise) SyntaxError: Unexpected token o in JSON at position 1的错误。这个就是使用了JSON.parse导致的响应格式不对)，使用JSON.stringify解决…

阅读更多...

＜dependency＞ idea中为什么这个变黄色

＜dependency＞ idea中为什么这个变黄色

在IDE中，当你的代码出现黄色高亮时，通常表示存在警告或建议的提示。对于Maven的<dependency>标签来说，黄色高亮可能有以下几种原因： 依赖项未找到：黄色高亮可能表示IDE无法找到指定的依赖项。这可能是由于配置错…

阅读更多...

【前端】鼠标事件计算与圆心形成的角度

【前端】鼠标事件计算与圆心形成的角度

在业务需求中，常常出现一些我们无法完成的效果图，这时需要UI切图给我们，而切图后不可避免的一些点击事件无法方便的监听如该图圆环，其实是一张单独的图片，这种情况下只能通过js判断用户点击、拖动的鼠标位置&#xf…

阅读更多...

【Python】基础：OpenCV库基本应用

【Python】基础：OpenCV库基本应用

😏★,:.☆(￣▽￣)/$:.★ 😏 这篇文章主要介绍OpenCV库基本应用。学其所用，用其所学。——梁启超欢迎来到我的博客，一起学习，共同进步。喜欢的朋友可以关注一下，下次更新不迷路&…

阅读更多...

【项目计网1】4.1 网络结构模式 4.2MAC地址、IP地址、端口

【项目计网1】4.1 网络结构模式 4.2MAC地址、IP地址、端口

文章目录第四章 Linux网络编程4.1 网络结构模式C/S结构（client-server）B/S结构（Browser/Server，浏览器/服务器模式） 4.2 4.3MAC地址、IP地址、端口（1）（2）MAC地址IP地址(…

阅读更多...

abp vnext升级到指定版本并处理升级后的问题

abp vnext升级到指定版本并处理升级后的问题

在使用abp vnext时当版本更新后可能会跨越net的版本，如果我们想升级到指定版本该怎么做呢，升级之后又有一些问题需要处理，下面一起看一下： 当前我的项目是.net5 abp vnext4.2.1 当前的最新abp版本是7.* 对应的net版本是 net7,由于…

阅读更多...

FFmpeg常见命令行（二）：FFmpeg转封装

FFmpeg常见命令行（二）：FFmpeg转封装

前言在Android音视频开发中，网上知识点过于零碎，自学起来难度非常大，不过音视频大牛Jhuster提出了《Android 音视频从入门到提高 - 任务列表》。本文是Android音视频任务列表的其中一个， 对应的要学习的内容是：如何使…

阅读更多...

【Verilog/D8】

【Verilog/D8】

2023年8月5日 HDBits/Cs450/counter 2bc状态机异步复位noteHDBits/Cs450/history shiftHDBits/Cs450/gshare HDBits/Cs450/counter 2bc状态机 Cs450/counter 2bc LSB最低有效位 module top_module(input clk,input areset,input train_valid,input train_taken,output reg[1…

阅读更多...

选读SQL经典实例笔记18_Exactly

选读SQL经典实例笔记18_Exactly

1. 问题9 1.1. 只讲授一门课程的教授 1.2. sql select p.*from professor p,teach twhere p.lname t.lnameand p.lname not in ( select t1.lnamefrom teach t1,teach t2where t1.lname t2.lnameand t1.cno ＞ t2.cno ) LNAME DEPT SALARY …

阅读更多...

抖音seo矩阵系统源代码开发搭建技术分享

抖音seo矩阵系统源代码开发搭建技术分享

抖音SEO矩阵系统是一个较为复杂的系统，其开发和搭建需要掌握一定的技术。以下是一些技术分享： 技术分享抖音SEO矩阵系统的源代码可以使用JAVA、Python、PHP等多种语言进行开发。其中，JAVA语言的应用较为广泛，因为JAVA语言有良好…

阅读更多...

推荐文章

最新文章