大模型推理革新：探索思维图（DoT）框架的逻辑与应用

大模型推理革新：探索思维图（DoT）框架的逻辑与应用

news2025/12/21 16:44:19

姚期智院士领衔推出了大模型新推理框架，CoT的“王冠”已难以承载。

提出了思维图（Diagram of Thought，DoT），使大模型的思考方式更接近人类。

团队为这一推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）对DoT进行了正式化（formalize），确保了其逻辑一致性和合理性。

相比于将推理过程表示为线性序列的CoT，DoT更能捕捉人类推理的复杂性。

与引入分支结构的ToT和GoT不同，DoT不依赖外部控制机制或多个模型协作，使训练和部署更加简单。

秘诀在于，DoT将大语言模型（LLM）中的迭代推理建模为在单一模型内部构建有向无环图（DAG）。

DAG由代表命题、批评、精炼和验证的节点组成，边表示它们之间的逻辑或依赖关系，且所有边均有方向，不存在任何循环路径。

这种无环特性确保推理过程不受循环依赖的影响，更真实地反映合理的逻辑推导。

在DoT的帮助下，诸如“9.11和9.8哪个大”、“strawberry中有几个‘r’”等问题都能迎刃而解。

值得注意的是，当前大模型中的“顶流”OpenAI o1已具备生成CoT的能力，而更强大的DoT的到来，是否意味着可以通过强化学习内化到模型中？

这项研究提出后引起了广泛关注。

网友纷纷表示这是一条正确的路径。

具体来看DoT的结构。

大模型复杂推理新框架

如前所述，DoT将逻辑推理过程建模为在单个LLM内构建有向无环图（DAG）。

其框架内管理着三个关键角色：

提议者：生成命题或推理步骤，添加新节点。
批评者：评估命题，识别错误、不一致或逻辑谬误，并添加批评节点。
总结者：将经过验证的命题综合成一个连贯的思维链，有效地执行DAG的拓扑排序（topological sort），以产出最终推理输出。

这三个角色通过特定token（如<proposer>、<critic>、<summarizer>）在模型输出中被明确定义。LLM在生成过程中能够在这些角色间无缝切换，利用自回归能力根据上下文预测下一个token。

推理过程始于提议者引入一个命题，并向DAG添加一个节点。

随后，批评者对该命题进行评估。如果提供了批评，则会添加新节点，并在命题与批评之间建立边。

基于批评，提议者生成精炼后的命题，表示为DAG中的新节点。

这一过程会不断重复，命题经过精炼，直到得到验证。

一旦形成足够有效的命题，总结者将综合这些推理，对DAG进行拓扑排序，产生连贯的思维链。

通过让模型接触正确与错误的推理，DoT使得LLM能够从错误中学习，逐步精炼推理过程，这更接近人类的解决问题方式。

这种方法不仅捕捉了推理的非线性和迭代特性，还通过自然语言批评提供了比二元信号更为丰富的反馈。

DoT的训练使用格式化为DoT结构的训练样例，包括角色特定token和DAG表示。在推理过程中，模型根据上下文线索和角色特定token生成命题、批评和总结。

这种方法简化了部署，消除了对多个LLM协作或外部控制机制的需求，同时与标准LLM训练范式保持一致，便于集成到现有工作流程中。

作者为DoT框架提供了严谨的数学基础，利用Topos Theory对推理过程进行了形式化描述。

在该框架中，命题被建模为拓扑中终端对象的子对象，逻辑关系和推理步骤用态射表示，批评与改进过程则分别对应子对象分类器的态射和命题间的态射。

通过引入PreNet范畴，他们成功捕捉了推理过程的动态和并发特性。

这种数学基础不仅确保了推理过程的逻辑一致性与完备性，还为下一代专门用于推理的AI模型设计提供了概念框架。

清华交叉信息研究院的姚期智、袁洋领衔了这篇论文，第一作者为张伊凡。

张伊凡于2021年本科毕业于北京大学元培学院，现为清华大学交叉信息学院的博士研究生，师从袁洋助理教授。其研究方向包括基础模型（大语言模型）的理论与算法、自监督学习及可信人工智能。

袁洋是清华大学交叉信息学院助理教授，博士生导师，主要研究方向为智能医疗、AI可解释性及AI大系统，在非凸优化理论、神经网络优化理论及机制设计等领域有丰富的研究成果。

姚期智教授是中国科学院院士、清华大学交叉信息研究院院长，是“图灵奖”创立以来首位获奖的亚裔学者，至今唯一的华人计算机科学家。2004年，他辞去普林斯顿大学的终身教职回到清华任教，并创办了多个重要的计算机科学项目。

一年前的同一时间，姚期智院士领衔提出了累积推理（Cumulative Reasoning，CR）的方法，而DoT是对CR的进一步深化。

CR协调了涉及不同专业化大语言模型的迭代过程，由不同模型承担提议者、验证者和报告者的角色。而DoT则直接在单一模型内构建有向无环图，避免了外部控制机制或多个模型的依赖，训练和部署更为简便。

此外，在DoT中，模型生成的批评反馈为自然语言形式，而非CR中仅提供的二元信号，使模型能够接收到关于错误的详细解释，更有效地改进命题。

这次DoT还引入了强有力的数学基础，阐明了推理过程与范畴逻辑的关系，理论上确保了推理的一致性与可靠性。

论文链接：https://arxiv.org/abs/2409.10038

参考链接：
[1]https://x.com/omarsar0/status/1835882277563179512
[2]https://hub.baai.ac.cn/users/16897
[3]https://hub.baai.ac.cn/users/19790

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2160997.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【Finetune】（六）、transformers之IA-3微调

【Finetune】（六）、transformers之IA-3微调

文章目录 0、IA-3基本原理1、IA-3微调实战1.1、导包1.2、加载数据集1.3、数据预处理1.4、创建模型1.5、LORA微调1.5.1、配置文件1.5.2、创建模型 1.6、配置训练参数1.7、创建训练器1.8、模型训练1.9、模型推理 0、IA-3基本原理 IA3的基本思想就是抑制和放大内部激活&#xff0c…

阅读更多...

外包功能测试干了4年，技术退步太明显了。。。。。

外包功能测试干了4年，技术退步太明显了。。。。。

先说一下自己的情况，本科生生，18年通过校招进入武汉某软件公司，干了差不多4年的功能测试，今年中秋，感觉自己不能够在这样下去了，长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能…

阅读更多...

详细七种msvcr71.dll丢失的解决方法，快速修复错误的msvcr71.dll问题

详细七种msvcr71.dll丢失的解决方法，快速修复错误的msvcr71.dll问题

今天，我打算跟大家分享一个有关电脑提示“msvcr71.dll丢失”的问题，并且会给出7种msvcr71.dll丢失的解决方法。但愿在大家工作期间遇到类似问题的时候，这些方法能够起到一定的帮助作用。同时在帮助大家了解msvcr71.dll文件。如果遇到“msvcr…

阅读更多...

面试知识点总结篇二

面试知识点总结篇二

一、makefile链接库参数 LIBS -L/path/to/lib -lmylib//，-lmylib会链接名为libmylib.so或libmylib.a的库。all: myprogrammyprogram: myprogram.ogcc -o myprogram myprogram.o $(LIBS)//此处使用myprogram.o: myprogram.cgcc -c myprogram.c二、shell指令 Shell…

阅读更多...

JAVA开源项目影城管理系统计算机毕业设计

JAVA开源项目影城管理系统计算机毕业设计

本文项目编号 T 045 ，文末自助获取源码 \color{red}{T045，文末自助获取源码} T045，文末自助获取源码目录一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析六、核心代码6.1 用…

阅读更多...

无人机视角下的车辆数据集

无人机视角下的车辆数据集

车辆数据集无人机视角下的车辆数据集。数据集为无人机俯拍的真实场景下的车辆机动车数据集。数据集已经标注好，yolo格式，txt标签。数据集已经划分好训练集（20970张图片）验证集（5242张图片）测试集&#xff…

阅读更多...

企业级Windows server服务器技术（1）

企业级Windows server服务器技术（1）

windows server服务器安装准备工作： 1.准备安装的镜像 2.安装好虚拟机VMware或者virtual box 3.准备安装的位置（选择你的电脑的磁盘上比较空闲的位置，新建一个文件夹并命名） 4.开始安装（按步骤）----…

阅读更多...

Threejs绘制圆锥体

Threejs绘制圆锥体

上一章节实现了胶囊体的绘制，这节来绘制圆锥体，圆锥体就是三角形旋转获得的，如上文一样，先要创建出基础的组件，包括场景，相机，灯光，渲染器。代码如下： initScene() {this…

阅读更多...

电力系统中有哪些好的运维的平台?

电力系统中有哪些好的运维的平台?

摘要：介绍台商大厦，采用综合保护装置、多功能仪表、变压器温控仪、直流屏、烟雾传感器、门磁开关、网络摄像头等设备，采集配电现场的各种电参量和状态信号。系统采用现场就地组网的方式，组网后通过现场网关远传至阿里云平台&#…

阅读更多...

【模板进阶】std::enable_if

【模板进阶】std::enable_if

一、 SFINAE 在介绍 s t d : : e n a b l e _ i f std::enable\_if std::enable_if之前，先介绍一个概念： S F I N A E SFINAE SFINAE，全称是： S u b s t i t u t i o n F a i l u r e i s n o t a n E r r o r Substitution\ Fai…

阅读更多...

【java21】java21新特性之JavaDoc中支持代码片段

【java21】java21新特性之JavaDoc中支持代码片段

在Java18之前，已经支持在JavaDoc中引入代码片段，这样可以在某些场景下更好的展示描述信息，但是之前的支持功能有限，比如我想高亮代码片段中的某一段代码是无能为力的。现在Java18优化了这个问题，增加了snippet来引入更…

阅读更多...

短视频矩阵管理系统贴牌源码开发

短视频矩阵管理系统贴牌源码开发

抖音账号矩阵的开发核心维度包括： 多账号管理开发维度：通过运用不同类型的账号矩阵，可以实现统一且便捷的管理。目前，矩阵系统支持管理抖音、快手、视频号,b站的账号，未来计划加入小红书,tk等等的账号管理。矩阵账号…

阅读更多...

如何编写高质量的用户故事

如何编写高质量的用户故事

本文详细介绍了如何在敏捷开发过程中编写高质量用户故事（User Story），包括用户故事的定义、结构、撰写技巧以及如何与产品待办列表（Product Backlog）中的其他工作项（PBI）相结合，以提…

阅读更多...

【Elasticsearch系列廿二】特殊参数

【Elasticsearch系列廿二】特殊参数

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…

阅读更多...

解释器模式原理剖析和Spring中的应用

解释器模式原理剖析和Spring中的应用

解释器模式原理剖析和Spring中的应用解释器模式是一种行为型设计模式，它定义了一种语言的文法表示，并提供了一个解释器来处理该文法的表达式。解释器模式可以用于构建语法解释器，例如计算器、简单编程语言的解释器等。核心思想&#xff1a…

阅读更多...

成功使用DDNS动态域名访问我的群晖NAS（TP-link路由器）

成功使用DDNS动态域名访问我的群晖NAS（TP-link路由器）

当NAS设备部署在动态IP环境中（如家庭或小型办公室宽带），远程访问常常受到IP地址频繁变动的困扰。为了解决这一问题，结合神卓互联NAS公网助手提供的DDNS（动态域名服务）功能，我们可以轻松实现通过…

阅读更多...

蓝牙、WiFi、2.4G、Zigbee、LoRa、NB-IoT的区别与应用场景

蓝牙、WiFi、2.4G、Zigbee、LoRa、NB-IoT的区别与应用场景

在现代科技的推动下，无线通信技术已经成为我们生活中不可或缺的一部分。从智能家居到工业自动化，从远程监控到环境传感，每一种技术都有其独特的优势和应用场景。今天，我们将深入探讨六种主流的无线通信技术——蓝牙、WiFi、2.4G、…

阅读更多...

基于vue框架的大参林药品信息管理系统的设计与实现8b4gt（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。

基于vue框架的大参林药品信息管理系统的设计与实现8b4gt（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。

系统程序文件列表项目功能：用户,药品分类,药品信息,医生开题报告内容基于Vue框架的大参林药品信息管理系统的设计与实现开题报告一、引言随着医疗健康行业的快速发展和信息化浪潮的推进，药品信息管理已成为提升医疗服务效率、保障患者用药安全、…

阅读更多...

Activiti7《第九式：破气式》——流畅驱动工作流进程。面试题大全

Activiti7《第九式：破气式》——流畅驱动工作流进程。面试题大全

冲冲冲！开干这篇文章将分为九个篇章，带你逐步掌握工作流的核心知识。“破气式”，代表着工作流中的无形之力，它是贯穿整个流程的关键驱动不知不觉已经到了独孤九剑最后一式了，我相信到这里之后各位都已经出神入化…

阅读更多...

状态模式原理剖析

状态模式原理剖析

《状态模式原理剖析》状态模式（State Pattern） 是一种行为设计模式，它允许对象在其内部状态改变时改变其行为。换句话说，当对象状态发生变化时，它的行为也会随之变化。核心思想： 状态模式将对象的不同状…

阅读更多...

推荐文章

最新文章