基于自然语言处理自动分配和高效执行制造任务可提高制造代理的灵活性和适应性

概述

论文地址：https://arxiv.org/abs/2406.01893
本研究提出了一种将大规模语言模型（LLMs）集成到多代理系统（MAS）中的新框架，以解决传统制造业在适应动态环境和快速响应生产变化方面所面临的困难。具体来说，GPT-3.5 和 GPT-4 等 LLM 可使代理以自然语言进行交流，并提高其解释人类指令和做出决策的能力。这一框架使代理能够在制造过程中有效地沟通、理解和执行任务，从而增强了 MAS 的适应性和协调性。作为一个实际案例，我们介绍了一个案例研究，展示了代理如何准确地分发 G 代码并执行制造流程。研究结果强调了持续集成 LLM 和开发复杂的代理间通信协议对于更灵活的制造系统的重要性。

介绍

制造业面临着定制产品需求不断增长和生产流程日益复杂的局面。在这种转型背景下，制造商需要对不断变化的产品规格做出快速反应，并应对意想不到的运营变化。在这种情况下，制造商不仅要保持高质量的产品和成本效益，还要灵活应对动态变化的环境。

使用多代理系统（MAS）是提高制造系统适应性和快速反应能力的一种重要方法；MAS 包括多个自主代理，用于决策、通信和协调。目前已开发出许多适用于制造系统的多代理系统架构，可实现分散决策并加强各代理之间的协调。

然而，MAS 框架仍然面临挑战。例如，代理对新格式和规格的适应能力有限，可能导致停机时间增加。此外，处理文本数据的能力也有局限性。文本数据比数字数据更具表现力，包含大量知识，而这些知识目前在制造业中尚未得到充分利用。利用自然语言处理 (NLP) 功能将非结构化文本数据正规化，可以减少停机时间并优化流程。

大规模语言模型（LLMs）的出现为应对这些挑战提供了新的解决方案–LLMs 能够解释、生成自然语言指令并对其采取行动，从而实现复杂的决策过程和自适应响应。这使得对流程和系统经验有限的生产操作人员和系统用户能够快速管理和优化。

本文的主要贡献如下：

1. 利用 LLM 简化用户指导生产任务的分配和执行

2. 确保 LLM 代理适应不断变化的规格，并以适当的资源执行制造流程。

3. 使用自然语言处理技能，理解用户和其他代理针对具体情况发出的指令。

框架

代理初始化

本节介绍初始化代理的过程，代理是多代理系统（MAS）的组成部分。代理通过定义角色、功能和通信协议来组成系统，以便有效合作，实现系统目标。系统中的所有代理都会收到以下初始提示：

你们是多代理合作系统的一部分。如果有人要求你提供你能提供的服务，你应该协助。必要时，你可以向其他代理求证。与同伴沟通，实现目标。如果不知道答案，请不要猜测。只使用提供的功能。不过，您可以递归调用这些函数"。

这些指示确保每个代理机构在其能力范围内开展工作，进行有效沟通，并为管理局的目标做出贡献。

整合代理功能和 LLM

通过集成 LLM，代理获得了解读复杂指令和规格的能力，并能灵活应对制造操作。该框架解码用户的制造指令，并使用 OpenAI API 函数调用来执行特定的制造操作（如铣削、钻孔）。聊天功能（算法 2）可促进代理之间的互动，并根据制造流程的要求执行功能调用。

业务工作流程

图 2 所示的工作流程说明了如何将用户指令转化为可执行操作。这种方法将用户的高级指令转化为机器可执行的操作，提高了对不断变化的条件的响应速度。

图 1 和图 2 分别说明了 MAS 框架和使用 LLM 的操作工作流程。

图 1：支持 LLM 的多代理制造系统框架

案例研究

建立案例研究

本案例研究对所提出的框架进行了评估，并展示了如何将 LLM 集成到制造流程中。模拟制造环境包括三台专用于铣削、钻孔和螺纹加工的机器。为了评估系统的适应性，我们构建了两个不同的流程，一个是两阶段流程，另一个是四阶段流程。

在两个阶段的过程中，原型产品 "产品-1 "需要进行轮廓加工和钻孔操作。

四阶段工艺还通过执行额外的扣压和穿线操作，测试系统应对扩展工作流程的能力。

每个产品都有一个具有 LLM 的产品代理 (PA)，负责监督与该产品相关的高层决策。每台机器也有一个负责特定任务的资源代理（RA）。例如，"产品-1 "的指令是

进行轮廓加工，塑造外部轮廓，然后进行钻孔加工，打出精确的孔。所有操作完成后，进入末端缓冲区"。

图 3 显示了案例研究的设置。此外，图 4 还详细显示了 G 代码产品规格。
在这里插入图片描述
图 3：案例研究设置

案例研究模拟和结果分析

模拟按以下步骤进行（见图 5）：

1. 用户根据算法 1 初始化 "产品-1 "代理和所有 RA。

2. 系统遵循第 III-C 节所述的运行工作流程。

3. "产品-1 "代理首先通知 "铣削-1 "代理需要进行轮廓加工，并只提供轮廓加工的 G 代码部分。

4. 当 "Milling1 "代理完成任务后，它会通知 "Product-1 "代理，告知它已准备好进行下一步操作。

5. 这一过程将继续进行，例如，将钻井作业分配给 "Drilling1 "代理。
在这里插入图片描述
图 5：两阶段流程的代理通信结果
模拟结果证实

交流和理解：对两阶段和四阶段过程的模拟证实，代理之间利用自然语言处理进行的交流是有效的，任务也得到了理解和执行。

准确性和性能：根据表 1 中的数据，GPT-4 两阶段流程的成功率为 100%，四阶段流程的成功率为 86%。据观察，随着任务复杂程度的增加，成功率也随之降低（见表 2）。

表 1：使用 GPT-4 进行个案研究的成功率
在这里插入图片描述
表 2：使用 GPT-4 进行的详细误差分析误差类型 2 个步骤 4 个步骤

案例研究的启示：本案例研究证实，集成了 LLM 的 MAS 能够提高生产任务分配和执行的效率，适应产品规格，并促进代理之间的沟通。

挑战和限制

性能

在制造业中使用 LLM 的主要挑战是实现生产高质量产品所需的性能：虽然 LLM 能有效处理自然语言，但它可能缺乏准确性。这会导致机器故障和产品质量低下。该框架可通过应用具有特定领域数据的微调 LLM 来提高性能。

扩展性

随着数据量和任务复杂性的增加，LLM 可能难以保持准确性。在需要大量历史数据或详细提示的情况下，这一问题尤为突出。这对使用 LLM 的 MAS 的可扩展性提出了挑战。在实际工业应用中，需要一个集成的 MAS 知识库来为 LLM 提供准确的运行时数据，并提高其可扩展性。

可靠性

可靠性对于将这种方法集成到实际生产场景中非常重要：LLM 生成的错误响应和错误决策会引发安全问题。此外，LLM 做出的推断需要在实际制造场景中进行验证。为解决这一问题，必须实施强大的验证机制，并集成实时观察和监控功能。这可确保 LLM 的输出和推断保持一致，并允许根据制造标准和安全协议立即进行调整。