概述
论文地址:https://arxiv.org/abs/2406.01893
本研究提出了一种将大规模语言模型(LLMs)集成到多代理系统(MAS)中的新框架,以解决传统制造业在适应动态环境和快速响应生产变化方面所面临的困难。具体来说,GPT-3.5 和 GPT-4 等 LLM 可使代理以自然语言进行交流,并提高其解释人类指令和做出决策的能力。这一框架使代理能够在制造过程中有效地沟通、理解和执行任务,从而增强了 MAS 的适应性和协调性。作为一个实际案例,我们介绍了一个案例研究,展示了代理如何准确地分发 G 代码并执行制造流程。研究结果强调了持续集成 LLM 和开发复杂的代理间通信协议对于更灵活的制造系统的重要性。
介绍
制造业面临着定制产品需求不断增长和生产流程日益复杂的局面。在这种转型背景下,制造商需要对不断变化的产品规格做出快速反应,并应对意想不到的运营变化。在这种情况下,制造商不仅要保持高质量的产品和成本效益,还要灵活应对动态变化的环境。
使用多代理系统(MAS)是提高制造系统适应性和快速反应能力的一种重要方法;MAS 包括多个自主代理,用于决策、通信和协调。目前已开发出许多适用于制造系统的多代理系统架构,可实现分散决策并加强各代理之间的协调。
然而,MAS 框架仍然面临挑战。例如,代理对新格式和规格的适应能力有限,可能导致停机时间增加。此外,处理文本数据的能力也有局限性。文本数据比数字数据更具表现力,包含大量知识,而这些知识目前在制造业中尚未得到充分利用。利用自然语言处理 (NLP) 功能将非结构化文本数据正规化,可以减少停机时间并优化流程。
大规模语言模型(LLMs)的出现为应对这些挑战提供了新的解决方案–LLMs 能够解释、生成自然语言指令并对其采取行动,从而实现复杂的决策过程和自适应响应。这使得对流程和系统经验有限的生产操作人员和系统用户能够快速管理和优化。
本文的主要贡献如下:
1. 利用 LLM 简化用户指导生产任务的分配和执行
2. 确保 LLM 代理适应不断变化的规格,并以适当的资源执行制造流程。
3. 使用自然语言处理技能,理解用户和其他代理针对具体情况发出的指令。
相关研究
多代理系统(MAS)研究
多代理系统(MAS)存在于各种为提高制造系统灵活性而开发的架构中。例如,ADMARMS 框架促进了基于设计的可重构性。Wang 等人还将 MAS 与大数据分析和强化学习相结合,实现了制造系统的自组织。其他研究还开发了动态资源和任务分配框架。这些架构旨在加强代理之间的交流,提高制造系统的灵活性。
利用大规模语言模型(LLM)研究 MAS
LLM 的出现使人们对利用 LLM 技术开发自主代理的兴趣与日俱增;配备 LLM 的代理已被应用于多种应用中,通过多代理讨论来提高其解决问题的能力。例如,Park 等人介绍了一种在虚拟城镇中使用 25 个生成式代理研究社会理解的模拟。此外,Wu 等人还介绍了一个名为 AutoGen 的开源框架,该框架可实现代理之间可定制的互动。这些研究有助于提高制造业的适应性、合作性和自然语言处理能力。
制造业法律硕士应用研究
LLM 技术的进步也促进了对其在制造中的应用的研究:Makatura 等人研究了 LLM 在设计和制造中的作用,展示了 LLM 在各种 CAD/CAM 任务中的潜力和局限性。Jignasu 等人还评估了 LLM 在 3D 打印中用于 G 代码调试、修改和几何变换的能力。这些研究证明了 LLM 解释、调试和操作 G 代码的能力;Fakih 等人评估了 LLM 在工业控制系统中的编程能力,并提出了一个名为 LLM4PLC 的框架。
在这些研究的基础上,本文提出了一个集成了 MAS 和 LLM 的框架,用于在制造过程中自主分配任务、适应不断变化的规格以及根据具体情况解释指令。该框架增强了制造过程中的 CAD/CAM 工作流程,并根据 CAD 规格的变化自动调整 CAM 流程,从而实现无缝制造操作。
框架
代理初始化
本节介绍初始化代理的过程,代理是多代理系统(MAS)的组成部分。代理通过定义角色、功能和通信协议来组成系统,以便有效合作,实现系统目标。系统中的所有代理都会收到以下初始提示:
你们是多代理合作系统的一部分。如果有人要求你提供你能提供的服务,你应该协助。必要时,你可以向其他代理求证。与同伴沟通,实现目标。如果不知道答案,请不要猜测。只使用提供的功能。不过,您可以递归调用这些函数"。
这些指示确保每个代理机构在其能力范围内开展工作,进行有效沟通,并为管理局的目标做出贡献。
整合代理功能和 LLM
通过集成 LLM,代理获得了解读复杂指令和规格的能力,并能灵活应对制造操作。该框架解码用户的制造指令,并使用 OpenAI API 函数调用来执行特定的制造操作(如铣削、钻孔)。聊天功能(算法 2)可促进代理之间的互动,并根据制造流程的要求执行功能调用。
业务工作流程
图 2 所示的工作流程说明了如何将用户指令转化为可执行操作。这种方法将用户的高级指令转化为机器可执行的操作,提高了对不断变化的条件的响应速度。
图 1 和图 2 分别说明了 MAS 框架和使用 LLM 的操作工作流程。
图 1:支持 LLM 的多代理制造系统框架
案例研究
建立案例研究
本案例研究对所提出的框架进行了评估,并展示了如何将 LLM 集成到制造流程中。模拟制造环境包括三台专用于铣削、钻孔和螺纹加工的机器。为了评估系统的适应性,我们构建了两个不同的流程,一个是两阶段流程,另一个是四阶段流程。
在两个阶段的过程中,原型产品 "产品-1 "需要进行轮廓加工和钻孔操作。
四阶段工艺还通过执行额外的扣压和穿线操作,测试系统应对扩展工作流程的能力。
每个产品都有一个具有 LLM 的产品代理 (PA),负责监督与该产品相关的高层决策。每台机器也有一个负责特定任务的资源代理(RA)。例如,"产品-1 "的指令是
进行轮廓加工,塑造外部轮廓,然后进行钻孔加工,打出精确的孔。所有操作完成后,进入末端缓冲区"。
图 3 显示了案例研究的设置。此外,图 4 还详细显示了 G 代码产品规格。
图 3:案例研究设置
案例研究模拟和结果分析
模拟按以下步骤进行(见图 5):
1. 用户根据算法 1 初始化 "产品-1 "代理和所有 RA。
2. 系统遵循第 III-C 节所述的运行工作流程。
3. "产品-1 "代理首先通知 "铣削-1 "代理需要进行轮廓加工,并只提供轮廓加工的 G 代码部分。
4. 当 "Milling1 "代理完成任务后,它会通知 "Product-1 "代理,告知它已准备好进行下一步操作。
5. 这一过程将继续进行,例如,将钻井作业分配给 "Drilling1 "代理。
图 5:两阶段流程的代理通信结果
模拟结果证实
交流和理解:对两阶段和四阶段过程的模拟证实,代理之间利用自然语言处理进行的交流是有效的,任务也得到了理解和执行。
准确性和性能:根据表 1 中的数据,GPT-4 两阶段流程的成功率为 100%,四阶段流程的成功率为 86%。据观察,随着任务复杂程度的增加,成功率也随之降低(见表 2)。
表 1:使用 GPT-4 进行个案研究的成功率
表 2:使用 GPT-4 进行的详细误差分析 误差类型 2 个步骤 4 个步骤
案例研究的启示:本案例研究证实,集成了 LLM 的 MAS 能够提高生产任务分配和执行的效率,适应产品规格,并促进代理之间的沟通。
挑战和限制
性能
在制造业中使用 LLM 的主要挑战是实现生产高质量产品所需的性能:虽然 LLM 能有效处理自然语言,但它可能缺乏准确性。这会导致机器故障和产品质量低下。该框架可通过应用具有特定领域数据的微调 LLM 来提高性能。
扩展性
随着数据量和任务复杂性的增加,LLM 可能难以保持准确性。在需要大量历史数据或详细提示的情况下,这一问题尤为突出。这对使用 LLM 的 MAS 的可扩展性提出了挑战。在实际工业应用中,需要一个集成的 MAS 知识库来为 LLM 提供准确的运行时数据,并提高其可扩展性。
可靠性
可靠性对于将这种方法集成到实际生产场景中非常重要:LLM 生成的错误响应和错误决策会引发安全问题。此外,LLM 做出的推断需要在实际制造场景中进行验证。为解决这一问题,必须实施强大的验证机制,并集成实时观察和监控功能。这可确保 LLM 的输出和推断保持一致,并允许根据制造标准和安全协议立即进行调整。
结论和未来的挑战
本研究探讨了通过将 LLM 集成到 MAS 中来改进制造流程的方法。本研究的成果如下:
1. 结果表明,LLM 提高了任务分配的效率,增强了运行适应性。
2. 代理可适应不断变化的产品规格(如 G 代码),并确保生产流程得到正确执行。
3. 有能力通过先进的自然语言处理技术促进代理之间的交流与合作。
然而,在任务执行的性能、可扩展性和可靠性方面也存在挑战。为应对这些挑战,需要加强验证和监测能力。此外,还需要制定战略来应对用户指令的多样性。
未来的研究将侧重于开发基于 LLM 的通信协议,以提高代理从历史数据中学习和快速应对行业变化的能力。此外,他们还将继续努力提高 LLM 的准确性和可扩展性。虽然这项研究的重点是常见的制造过程(如钻孔、铣削),但未来的工作将致力于评估该框架在更大数据集上的有效性,并能够应对制造任务的多样性。