计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-04

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-04
- 目录
- 1. Alopex: A Computational Framework for Enabling On-Device Function Calls with LLMs
- - - 摘要：
    - 研究背景：
    - 算法模型：
    - 核心创新点：
    - 实验效果：
    - 后续潜在的研究方向：
    - 推荐阅读指数：★★★★☆
- 2. LLM-PySC2: Starcraft II learning environment for Large Language Models
- - - 摘要：
    - 研究背景：
    - 算法模型：
    - 核心创新点：
    - 实验效果：
    - 后续潜在的研究方向：
    - 推荐阅读指数：★★★★☆
- 3. Enhancing Cluster Resilience: LLM-agent Based Autonomous Intelligent
- - - 摘要：
    - 研究背景：
    - 算法模型：
    - 核心创新点：
    - 实验效果：
    - 后续潜在的研究方向：
    - 推荐阅读指数：★★★★☆
- 4. From Word Vectors to Multimodal Embeddings: Techniques, Applications, and Future Directions For Large Language Models
- - - 摘要：
    - 研究背景：
    - 算法模型：
    - 核心创新点：
    - 实验效果：
    - 后续潜在的研究方向：
    - 推荐阅读指数：★★★★☆
- 5. Bottom-Up and Top-Down Analysis of Values, Agendas, and Observations in Corpora and LLMs
- - - 摘要：
    - 研究背景：
    - 算法模型：
    - 核心创新点：
    - 实验效果：
    - 后续潜在的研究方向：
    - 推荐阅读指数：★★★★☆
- 后记

1. Alopex: A Computational Framework for Enabling On-Device Function Calls with LLMs

Authors: Yide Ran, Zhaozhuo Xu, Yuhang Yao, Zijian Hu, Shanshan Han, Han Jin,
Alay Dilipbhai Shah, Jipeng Zhang, Dimitris Stripelis, Tong Zhang, Salman Avestimehr, Chaoyang He

https://arxiv.org/abs/2411.05209
在这里插入图片描述

Alopex：一个用于在大型语言模型上启用设备内函数调用的计算框架

摘要：

随着大型语言模型（LLMs）的快速发展，它们越来越多地被集成到移动设备中，以提供个性化辅助。这使得LLMs能够调用外部API函数来增强其性能。然而，数据稀缺、无效的问题格式化和灾难性遗忘等挑战阻碍了设备内LLM代理的发展。为了解决这些问题，我们提出了Alopex，一个框架，它使用Fox LLM启用精确的设备内函数调用。Alopex引入了一种基于逻辑的方法来生成高质量的训练数据，并采用了一种新颖的“描述-问题-输出”格式进行微调，减少了函数信息泄露的风险。此外，使用数据混合策略来减轻灾难性遗忘，将函数调用数据与教科书数据集结合，以增强在各种任务中的性能。实验结果表明，Alopex提高了函数调用的准确性，并显著减少了灾难性遗忘，为将函数调用功能集成到LLMs中提供了一种健壮的解决方案，无需人工干预。

研究背景：

大型语言模型（LLMs）在软件应用中的集成变得越来越普遍，特别是在移动设备上提供个性化辅助方面。LLMs通过调用外部API函数来增强性能，但面临数据稀缺、问题格式化和灾难性遗忘等挑战。这些挑战限制了设备内LLM代理的发展，尤其是在数据生成、问题格式化和微调策略方面。

算法模型：

Alopex框架包含三个主要组件：函数调用示例生成、LLM微调的格式化函数调用示例和克服LLM微调中灾难性遗忘的策略。该框架使用基于规则的逻辑方法生成问题和输出，通过映射表生成输出值。此外，Alopex采用了“描述-问题-输出”数据格式进行LLM微调，并引入了数据混合方法，通过将函数调用数据集与教科书数据集结合来减轻灾难性遗忘。
在这里插入图片描述

核心创新点：

基于逻辑的高质量训练数据生成方法。
“描述-问题-输出”数据格式，用于LLM微调，减少了函数信息泄露的风险。
数据混合策略，结合函数调用数据和教科书数据集，以减轻灾难性遗忘。

实验效果：

实验结果表明，Alopex在函数调用准确性方面优于现有的微调LLMs，并且显著减少了灾难性遗忘现象。例如，在MMLU数据集上，经过Alopex微调的LLMs在函数调用任务上表现良好，同时在其他LLM评估基准上也表现出更好的性能。
在这里插入图片描述

后续潜在的研究方向：

未来的研究可以探索更高效的数据生成方法，以减少训练数据的需求。此外，可以研究更先进的微调策略，以进一步提高LLMs在函数调用任务上的性能。还可以探索如何将Alopex框架应用于其他类型的设备和应用场景。

推荐阅读指数：★★★★☆

2. LLM-PySC2: Starcraft II learning environment for Large Language Models

Authors: Zongyuan Li, Yanan Ni, Runnan Qi, Lumin Jiang, Chang Lu, Xiaojie Xu,
Xiangbei Liu, Pengfei Li, Yunzheng Guo, Zhe Ma, Xian Guo, Kuihua Huang, Xuebo Zhang
https://arxiv.org/abs/2411.05348

LLM-PYSC2: 面向大型语言模型的星际争霸II学习环境
在这里插入图片描述

摘要：

本文介绍了一个新的环境LLM-PySC2（大型语言模型星际争霸II学习环境），这是一个基于DeepMind的星际争霸II学习环境的平台，旨在开发基于大型语言模型（LLMs）的决策方法。这个环境是第一个提供完整的星际争霸II动作空间、多模态观察接口和结构化游戏知识数据库的环境，这些环境与各种LLMs无缝连接，促进了基于LLM的决策研究。为了进一步支持多智能体研究，我们开发了一个LLM协作框架，支持多智能体并发查询和多智能体通信。在我们的实验中，LLM-PySC2环境被适配为与星际争霸多智能体挑战（SMAC）任务组兼容，并提供了八个新的侧重于宏观决策能力的场景。我们在实验中评估了九个主流的LLMs，结果表明，足够的参数对于LLMs进行决策是必要的，但提高推理能力并不直接导致更好的决策结果。我们的发现进一步表明，使大型模型能够在部署环境中通过参数训练或无需训练的学习技术自主学习的重要性。最终，我们期望LLM-PySC2环境能够促进LLM学习方法的研究，帮助基于LLM的方法更好地适应任务场景。