计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-08

news2024/11/24 2:06:53

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-07


目录

文章目录

  • 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-07
    • 目录
    • 1. GraphRouter: A Graph-based Router for LLM Selections
      • 摘要
      • 创新点
      • 算法模型
      • 实验效果
      • 结论
      • 推荐阅读指数
    • 2. DOTS: Learning to Reason Dynamically in LLMs via Optimal Reasoning Trajectories Search
      • 摘要
      • 创新点
      • 算法模型
      • 实验效果
      • 结论
      • 推荐阅读指数
    • 3. Empowering Domain-Specific Language Models with Graph-Oriented Databases: A Paradigm Shift in Performance and Model Maintenance
      • 摘要
      • 创新点
      • 算法模型
      • 实验效果
      • 结论
      • 推荐阅读指数
    • 4. Godel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement
      • 摘要
      • 创新点
      • 算法模型
      • 实验效果
      • 结论
      • 推荐阅读指数
    • 5. ImProver: Agent-Based Automated Proof Optimization
      • 文章标题翻译
      • 摘要
      • 创新点
      • 算法模型
      • 实验效果
      • 结论
      • 推荐阅读指数
    • 后记


1. GraphRouter: A Graph-based Router for LLM Selections

Authors: Tao Feng, Yanzhen Shen, Jiaxuan You
https://arxiv.org/abs/2410.03834
代码:ttps://github.com/ulab-uiuc/GraphRouter.

GraphRouter: 大语言模型选择的图基路由器

摘要

随着大型语言模型(LLMs)的数量和种类迅速增长,针对特定查询高效选择合适LLM的任务面临挑战,尤其是在性能和计算成本之间的权衡。现有的LLM选择方法往往难以泛化到新的LLM和不同任务,因为它们在利用任务、查询和LLM之间的上下文交互能力有限,并且依赖于归纳学习框架。为了解决这些不足,我们引入了一个新颖的归纳图框架,名为GraphRouter,充分利用任务、查询和LLM之间的上下文信息来增强LLM选择过程。GraphRouter构建了一个包含任务、查询和LLM节点的异构图,将交互表示为边,有效地捕获查询需求和LLM能力之间的上下文信息。通过创新的边预测机制,GraphRouter能够预测潜在边的属性(LLM响应的效果和成本),从而提供优化的推荐,适应现有和新引入的LLM,而无需重新训练。在三种不同的效果-成本权重情景下的全面实验表明,GraphRouter大大超过了现有的路由器,至少提高了12.3%的性能。此外,它在新LLM设置中实现了更好的泛化,并支持多样化的任务,至少提高了9.5%的效果,并显著降低了计算需求。

创新点

  1. 图基框架:首次从图的角度构建LLM选择路由器,充分利用任务、查询和LLM之间的上下文信息。
  2. 异构图构建:构建包含任务节点、查询节点和LLM节点的异构图,通过边表示它们之间的交互。
  3. 边预测机制:通过预测边的属性(效果和成本)来优化LLM的选择。
  4. 无需重新训练:能够适应新引入的LLM,无需重新训练,提高了模型的泛化能力。

在这里插入图片描述

算法模型

GraphRouter使用异构图神经网络(GNN)来实现LLM的选择。它通过以下步骤工作:

  1. 节点和边的初始化:为任务、查询和LLM节点生成初始嵌入。
  2. 异构GNN预测:使用异构GNN来聚合不同类型节点的信息,并通过迭代加权聚合局部网络邻域来学习节点嵌入。
  3. 边预测:将LLM选择问题建模为边预测问题,通过训练数据确定每个查询的最佳LLM。
    在这里插入图片描述

实验效果

  • 性能提升:在三种不同的效果-成本权重情景下,GraphRouter至少比现有方法提高了12.3%的性能。
  • 泛化能力:在新LLM设置中,GraphRouter不仅节省了显著的训练时间,而且至少比基线提高了9.5%的性能。
  • 计算需求降低:GraphRouter在新LLM设置中显著降低了计算需求。

结论

GraphRouter通过图基方法有效地利用上下文信息,提高了LLM选择的性能和泛化能力,同时降低了计算成本。实验结果表明,GraphRouter在多种设置下均优于现有方法。

推荐阅读指数

★★★★☆

推荐理由:这篇论文提出了一个创新的LLM选择框架,通过图基方法有效地利用上下文信息,提高了选择过程的性能和泛化能力。

2. DOTS: Learning to Reason Dynamically in LLMs via Optimal Reasoning Trajectories Search

Authors: Murong Yue, Wenlin Yao, Haitao Mi, Dian Yu, Ziyu Yao, Dong Yu
https://arxiv.org/abs/2410.03864

DOTS: 通过最优推理路径搜索在大型语言模型中动态推理的学习

摘要

近年来,提升大型语言模型(LLMs)的推理能力受到了显著关注。先前研究表明,各种提示策略如逐步思考、回答前的反思、编程求解及其组合,对于辅助LLMs进行推理(称为“推理行为”)是有效的。然而,这些方法通常对所有问题应用静态、预定义的推理行为,而没有考虑每个问题的具体特点或任务解决LLM的能力。本文提出了DOTS,一种使LLMs根据每个问题的特点和任务解决LLM的固有能力,通过最优推理路径搜索动态推理的方法。我们的方法包括三个关键步骤:i) 定义可以组合成各种推理行为轨迹的原子推理行为模块;ii) 通过迭代探索和评估,为每个训练问题搜索特定的任务解决LLM的最优行为轨迹;iii) 使用收集到的最优轨迹训练LLM来为未见问题规划推理轨迹。特别地,我们提出了两种学习范式,即微调外部LLM作为规划器以指导任务解决LLM,或直接微调具有内部推理行为规划能力的任务解决LLM。我们在八个推理任务上的实验表明,我们的方法一贯优于静态推理技术和普通指令调整方法。进一步分析揭示了我们的方法使LLMs能够根据问题复杂度调整其计算,将更深入的思考和推理分配给更难的问题。代码可在GitHub上获得。

创新点

  1. 动态推理路径搜索:根据问题的特点和LLM的固有能力,动态地为每个问题搜索最优推理路径。
  2. 原子推理行为模块:定义了可以组合成多种推理行为轨迹的原子模块。
  3. 两种学习范式:提出了外部规划器微调和内部规划器微调两种不同的学习设置,以适应不同的LLM可访问性限制。

算法模型

DOTS的核心是三个步骤:

  1. 定义原子推理模块:构建代表不同推理行为的原子模块。
  2. 搜索最优行为轨迹:通过探索和评估,为训练数据中的每个问题识别最优推理行为。
  3. 微调LLM规划最优推理轨迹:使用收集到的最优轨迹通过监督式微调来训练LLM。
    在这里插入图片描述
    在这里插入图片描述
    算法伪代码:
    在这里插入图片描述

实验效果

  • 性能提升:在多个推理任务上,DOTS一致性地优于静态推理技术和普通指令调整方法。
  • 问题复杂度适应:分析表明,DOTS可以根据问题的复杂度调整其计算深度和推理步骤。
  • 外部规划器微调:在MATH、BBH、Game of 24和TheoremQA数据集上,DOTS显示出较基线方法更高的准确率。
  • 内部规划器微调:在Game of 24任务中,与仅使用CoT方法相比,DOTS实现了性能提升。

结论

DOTS通过动态规划最优推理路径,提升了LLMs的推理能力。实验结果表明,DOTS在各种推理挑战中表现优越,展现了在不同任务中的强大鲁棒性和泛化能力。

推荐阅读指数

★★★★☆

推荐理由:这篇论文提出了一种新颖的方法,通过动态搜索最优推理路径来提升大型语言模型的推理能力。

3. Empowering Domain-Specific Language Models with Graph-Oriented Databases: A Paradigm Shift in Performance and Model Maintenance

Authors: Ricardo Di Pasquale and Soledad Represa
https://arxiv.org/abs/2410.03867

通过图导向数据库赋能领域特定语言模型:性能和模型维护的范式转变

摘要

在数据主导的时代,领域特定语言的管理与利用成为了各种应用领域的关键挑战,尤其是那些具有特定行业需求的领域。本文旨在有效管理并处理特定应用领域内大量短文本文件的需求。通过利用领域特定知识和专长,我们的方法旨在塑造这些领域内的事实数据,从而促进最终用户的利用和理解。我们的方法的核心是将领域特定语言模型与图导向数据库集成,从而在目标领域内无缝处理、分析和利用文本数据。我们的工作强调了领域特定语言模型与图导向数据库合作的变革潜力。这种合作旨在帮助研究人员和工程师在度量使用、减轻延迟问题、提高可解释性、增强调试和改善整体模型性能方面取得进展。展望未来,我们希望我们的工作能作为AI工程师的指南,为实施与图导向数据库结合使用的领域特定语言模型提供有价值的见解,并为此类产品的全生命周期维护提供宝贵的经验。

创新点

  1. 领域特定语言模型与图导向数据库的集成:提出了一种新的方法,将语言模型与图数据库结合起来,以改善特定领域的文本数据处理。
  2. 自动化知识图谱创建:使用LLMs自动从文档中提取实体和关系,以构建知识图谱。
  3. 检索增强生成技术:探索了利用图数据库支持的检索增强生成技术。
  4. 提高可解释性:通过链式思考(Chain of Thought)技术提高LLMs的可解释性。
  5. 记忆、上下文和个性化:提出使用图数据库增强聊天机器人的记忆表示,并实现客户个性化。

算法模型

本文提出了一个将领域特定语言模型与图导向数据库(GODB)集成的框架。该框架包括以下几个关键组成部分:

  1. 知识图谱(KG)构建:使用LLMs从文档中提取信息,并将其存储在GODB中。
  2. 检索增强生成(RAG):使用GODB中的KG来增强LLMs的回答,以提供更准确和相关的信息。
  3. 可解释性技术:通过CoT技术提高LLMs的决策过程的可解释性。
  4. 记忆和上下文管理:使用GODB来维护聊天机器人的会话历史,以提供更好的个性化服务。

实验效果

文章中没有提供具体的实验数据或结果。但是,作者提到了他们的方法在理论上可以提高性能、减少延迟、提高可解释性和改善模型维护。

结论

作者强调了领域特定语言模型与图导向数据库结合的重要性,并提出了一个集成框架,以提高特定领域的文本数据处理能力。他们认为这种合作可以作为实施生成性AI解决方案的主要方法。

推荐阅读指数

★★★★☆

推荐理由:这篇文章提出了一个创新的框架,将领域特定语言模型与图导向数据库结合起来,以提高特定领域的文本数据处理能力。这对于AI工程师和研究人员来说是一个有价值的见解,尤其是在处理大量文本数据的领域。

4. Godel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement

Authors: Xunjian Yin and Xinyi Wang and Liangming Pan and Xiaojun Wan and
William Yang Wang
https://arxiv.org/abs/2410.04444
在这里插入图片描述
Gödel Agent: 一种用于代理递归自我改进的自引用框架

摘要

随着大型语言模型(LLMs)的快速发展,AI驱动的代理在各种任务上的能力得到了显著提升。然而,现有的代理系统,无论是基于固定流程算法还是预定义的元学习框架,都由于人类设计组件的限制而无法搜索整个代理设计空间,因此可能会错过全局最优的代理设计。在本文中,我们介绍了Gödel Agent,这是一个受Gödel机器启发的自我进化框架,使代理能够通过提示引导递归地改进自己,而无需依赖预定义的例程或固定的优化算法。Gödel Agent利用LLMs动态修改自己的逻辑和行为。在编码、科学和数学等多个领域的实验结果表明,Gödel Agent的实现能够实现持续的自我改进,在性能、效率和泛化能力方面超过了手工设计的代理。

创新点

  1. 自引用框架:提出了一种新颖的自我进化框架,使代理能够递归地改进自己,而无需依赖预定义的例程或固定的优化算法。
  2. 动态逻辑修改:Gödel Agent利用大型语言模型动态修改自己的逻辑和行为,以适应不同的任务。
  3. 递归自我改进:代理能够通过递归自我更新,理论上能够随时间进行越来越好的改进。
    在这里插入图片描述
    在这里插入图片描述

算法模型

Gödel Agent的核心是递归自我改进,它通过以下步骤实现:

  1. 自感知:通过在运行时内存中读取自己的代码来实现。
  2. 自我改进:通过动态修改运行时内存中的代码来实现。
  3. 环境交互:与环境交互以评估性能并收集反馈。
  4. 递归改进机制:在每一步中确定要执行的操作序列,包括推理、决策和执行操作。

实验效果

  • 性能提升:在多个任务上,Gödel Agent实现了显著的性能提升,包括数学问题解决、阅读理解和多任务问题解决。
  • 效率:Gödel Agent在自我改进过程中表现出更高的效率,需要的迭代次数和计算成本远低于现有的自动化代理设计方法。
  • 泛化能力:相同的Gödel Agent实现能够轻松适应不同任务,只需指定环境描述和反馈机制。

结论

Gödel Agent作为一种自我引用的代理框架,能够递归地改进自己,克服了手工设计代理和元学习优化代理的限制。实验结果表明,Gödel Agent在性能、效率和适应性方面优于传统代理。

推荐阅读指数

★★★★★

推荐理由:这篇文章提出了一个创新的自我进化框架,使代理能够动态地改进自己的逻辑和行为,具有很高的研究价值和应用前景。

5. ImProver: Agent-Based Automated Proof Optimization

Authors: Riyaz Ahuja, Jeremy Avigad, Prasad Tetali, Sean Welleck
https://arxiv.org/abs/2410.04753

文章标题翻译

IMPROVER: 基于代理的自动证明优化

摘要

大型语言模型(LLMs)已被用于在如Lean的证明助手中生成数学定理的正式证明。然而,我们经常需要根据不同的标准优化正式证明,这取决于其下游用途。例如,我们可能希望证明遵守某种风格,或者希望证明是可读的、简洁的或模块化结构的。对于学习任务来说,拥有适当优化的证明也很重要,尤其是因为人类编写的证明可能不是最优的。为此,我们研究了一个新的自动证明优化问题:重写证明,使其正确并优化任意标准,例如长度或可读性。作为自动证明优化的第一种方法,我们提出了ImProver,这是一个大型语言模型代理,用于重写证明以优化Lean中任意用户定义的度量。我们发现,简单地应用LLMs进行证明优化是不够的,我们为ImProver纳入了各种改进,例如使用符号化Lean上下文的新Chain-of-States技术,以及错误更正和检索。我们在重写真实世界的本科、竞赛和研究级数学定理方面测试了ImProver,发现ImProver能够重写证明,使其更短、更模块化、更易读。
在这里插入图片描述

创新点

  1. 自动证明优化:提出了一个新的问题,即自动优化证明过程,以满足不同的标准,如长度或可读性。
  2. ImProver代理:开发了一个大型语言模型代理,用于重写证明,优化用户定义的度量。
  3. Chain-of-States技术:提出了一种新颖的技术,通过显示中间证明状态,帮助模型更好地理解证明过程。
  4. 错误更正和检索:纳入了错误更正和检索机制,以提高证明优化的准确性和效率。

算法模型

ImProver的核心是一个大型语言模型代理,它使用以下关键技术:

  1. Chain-of-States (CoS) 提示:通过在证明中添加注释,显示中间状态,帮助模型理解证明步骤。
  2. 输出格式化:引入不同的输出格式,以生成更结构化的证明。
  3. 采样方法:使用不同的采样方法,包括最佳n和迭代改进,以生成最优证明。
  4. 检索:使用基于MMR的检索增强生成,选择相关的示例和文档,以生成更准确的证明。

实验效果

  • 性能提升:在多个数据集上,ImProver在证明优化任务上显著优于基线模型GPT-4o。
  • 重要数据
    • 长度优化:ImProver的平均改进分数为20.96%,非空改进分数为55.29%,准确率为100%。
    • 可读性优化:ImProver的平均改进分数为9.34%,非空改进分数为30.53%,准确率为100%。
  • 结论:ImProver能够在保持正确性的同时,显著提高证明的长度和可读性。

结论

ImProver通过结合CoS、检索增强生成和其他特性,在证明优化方面显著优于基础语言模型,能够生成更短、更易读、更模块化的证明。

推荐阅读指数

★★★★★

推荐理由:这篇文章提出了一个创新的自动证明优化方法,对于从事人工智能、机器学习和自动定理证明研究的研究人员和工程师来说,这是一篇非常有价值的文章。


后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞,关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习,计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2197858.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年诺贝尔物理学奖授予AI先驱 Hopfield 和Hinton,奖金1100万瑞典克朗,他们是ChatGPT的忠实用户

2024年诺贝尔物理学奖得主:AI领域的杰出科学家 获奖者 2024年诺贝尔物理学奖的获奖者是两位在人工智能(AI)尤其是机器学习技术方面做出杰出贡献的科学家:约翰霍普菲尔德和杰弗里欣顿。 瑞典皇家科学院在周二宣布,这两…

Shamiko模块:隐藏root

开启Zygisk 在安装Shamiko模块之前,需要使用面具开启Zygisk,在面具的设置里可以开启,开启后重启手机Zygisk生效。 开启后的样子 开启面具随机报名 在面具的设置里,找到“隐藏Magisk应用”,点击这个选项&#xff0…

ESP8266使用AT指令完成MQTT功能

ESP8266使用AT指令完成MQTT功能 在esp8266设备中烧录安信可的AT固件之后,进行AT指令完成信息发布,并最终实现在Homeassistant中发布传感器并设置传感器状态。 一、基础指令 以下是完整的步骤和对应的AT指令: 1. 配置ESP8266为Station模式 …

在线培训知识库管理系统:企业的明智之选

在当今这个快速变化的时代,企业之间的竞争日益激烈,知识更新速度之快前所未有。为了保持竞争力,企业不仅需要不断引入新技术、新方法,还需要确保员工能够及时掌握这些新知,将其转化为生产力。在此背景下,在…

codetop标签双指针题目大全解析(四),双指针刷穿地心!!!!!

复习复习复习!! 1.长度最小的子数组2.移动零3.盛水最多的容器4.旋转链表5.最接近的三数之和6.删除有序数组中的重复项7.返回倒数第k个节点的值8.四数之和9.验证回文串 1.长度最小的子数组 考滑动窗口的 要注意是大于等于不是等于 看错题目一顿调 class …

CNAI趋势下,打造一体化AI赋能平台

在数字化转型的浪潮中,人工智能(AI)已成为推动企业创新和转型的核心力量。云原生技术以其灵活性和可扩展性,为AI的应用和发展提供了坚实的基础。本文将探讨云原生人工智能(CNAI)如何为企业带来颠覆性的变革…

cnn突破八(两层卷积核bpnet网络扩展)

cnn突破七中x【?】怎么求?我们举个例子: 接着cnn突破七: hicnn【】来自temphicnn【】2*2最大池化: temphicnn[0]x[i0,j0,5*5方阵]*w1cnn[0-24], hicnn是5*5的,temphicnn是10*10的&#xff0…

YOLOv8改进 - 注意力篇 - 引入SimAM注意力机制

一、本文介绍 作为入门性篇章,这里介绍了SimAM注意力在YOLOv8中的使用。包含SimAM原理分析,SimAM的代码、SimAM的使用方法、以及添加以后的yaml文件及运行记录。 二、SimAM原理分析 SimAM官方论文地址:SimAM文章 SimAM官方代码地址&#…

【土地那些事儿】一文读懂“集体所有土地”

今天咱们来聊一个既熟悉又神秘的概念——集体所有土地。在中国广袤的大地上,除了国有土地外,还有一种特殊的土地所有权形式,它关乎亿万农民的切身利益,那就是集体所有土地。来,让我们一起揭开它的面纱吧! …

根据指数做波段年化利率分析

根据指数做波段年化利率分析 股票投资,是众多投资方式中的一种。然而,每个人有不同的炒股方式,对股票不同的操作也会获得不同的收益/损失。作为“金融消费者”,如何做好自己在股票中的消费行为,是一门巨大的学问。这里…

D31【python 接口自动化学习】- python基础之输入输出与文件操作

day31 文件的打开 学习日期:20241008 学习目标:输入输出与文件操作﹣-43 常见常新:文件的打开 学习笔记: 文件的概念 使用open()函数打开文件 文件路径处理 文件打开模式 总结 文件操作包括:打开&#…

C++:string (用法篇)

文章目录 前言一、string 是什么?二、C语法补充1. auto2. 范围for 三、string类对象的常见构造1. Construct string object2. String destructor3. operator 四、string迭代器相关1. begin与end1)begin2)end3)使用 2. rbegin 与 r…

第33次CCF计算机软件能力认证-第4题十滴水

题干: 十滴水是一个非常经典的小游戏。 小 C C C 正在玩一个一维版本的十滴水游戏。 我们通过一个例子描述游戏的基本规则。 游戏在一个 1 c 1c 1c 的网格上进行,格子用整数 x ( 1 ≤ x ≤ c ) x(1≤x≤c) x(1≤x≤c) 编号,编号从左往…

Metal之旅——数据

顶点数据 顶点数据(Vertex Data)是指一系列顶点的集合,这些顶点用于图形渲染管线的输入。每个顶点通常包含位置、颜色、纹理坐标等属性信息 mesh网络 Mesh网络是指metal中通过将不同数量形状的三角形拼在一起覆盖在要绘制图形表面的网络 顶…

007集—— 自动获取图形的外边界(外轮廓)(CAD—C#二次开发入门)

本文只适用于闭合多段线组成的图像,其他情况(圆、弧、椭圆、未封闭line)暂不支持。 效果如下图所示: 原始图: 代码运行后图: 附代码: public class 外轮廓{Database db = HostApplicationServices.WorkingDatabase;[CommandMethod("xx")]public void Demo(…

基于SSM车位租赁系统【附源码】

基于SSM车位租赁系统 效果如下: 注册页面 首页展示 车位租赁订单展示 车位列表页面 公告信息管理页面 公告类型管理界面 研究背景 随着经济的持续增长和城市化进程的加速,土地资源变得日益紧缺,停车难问题已成为许多城市面临的共同挑战。随…

【Redis】List类型的常用命令大全

这里的list列表相当于一个双端队列,也可以认为是双向链表,也可以认为是数组,后续的很多命令都使用到下标。 list的特点: list中的每个元素也都是String类型里面的元素可以重复列表中的元素是有序的,如果里面元素顺序进…

epoll究竟是同步的还是异步的?

简单说一句话,你需要分层看这个事: epoll 这个系统调用,是同步的,也就是必须等待操作系统返回值。 而底层用了 epoll 的封装后的框架,可以是异步的,只要你暴露给外部的接口,无需等待你的返回值…

DDD简介

概述 传统的数据驱动开发模式,View、Service、Dao这种三层分层模式,会很自然的写出过程式代码,这种开发方式中的对象只是数据载体,而没有行为,是一种贫血对象模型。以数据为中心,以数据库ER图为设计驱动&a…

什么是变阻器?

变阻器是一种电子元件,主要用于调整电路中的电阻值,从而实现对电流、电压等电学参数的控制。它在电路中起到非常重要的作用,广泛应用于各种电子设备和实验装置中。 变阻器的主要作用是改变电路中的电阻值。在电路中,电阻值的大小…