GMS——利用 ChatGPT 和扩散模型进行制造业革命

news2024/11/16 22:41:23

概述

论文地址:https://arxiv.org/abs/2405.00958
研究介绍了生成式制造系统(GMS),并表明这些系统能有效管理和协调自主制造资产,提高它们对不同生产目标和人类偏好的响应能力和灵活性。

与传统的显式建模不同,GMS 使用生成式人工智能(包括扩散模型和 ChatGPT)来隐式学习未来愿景,通过训练和采样从模型优化转向决策。生成式人工智能的集成使 GMS 能够通过人机交互做出复杂的决策,让制造资产能够生成多个高质量的全局决策,并根据人的反馈进行迭代改进。

实证结果表明,全球监测系统大大提高了系统的弹性和对不确定性的反应能力,将决策时间从几秒缩短到几毫秒。研究强调了所生成解决方案的创造性和多样性,并揭示了以人为本的决策可通过顺畅、持续的人机交互得到促进。

介绍

制造系统面临着多种形式、紧迫性和影响的持续不确定性。首先,大规模个性化的出现以及法规和标准的变化增加了生产要求的复杂性,要求系统巧妙地驾驭不断变化的需求和义务。其次,自然灾害、流行病、金融危机和地缘政治冲突导致的生产中断会造成资源短缺和消费行为的改变。在重大生产中断之后,20%-30% 的企业和业务被迫关闭。最后,在可持续发展、社会和环境目标的推动下,新的生产计划要求重新评估生产目标和重新思考现有系统。

未来的制造系统需要具有灵活性,能够快速适应不确定因素,并在新举措和新限制之间取得平衡。 20 世纪 60 年代,随着柔性制造系统的诞生,柔性首次被引入制造系统。尽管人们努力提高硬件和软件的灵活性,但随着资产和规划范围的不断扩大,集中控制带来的 NP 困难阻碍了系统的响应能力。

机器人、车辆和移动机械手等制造资产自主性的提高为应对这一挑战提供了机会,并有可能通过将决策权下放给每个资产来提高响应速度。奥迪等制造商正在从固定线生产转向使用自主资产的分体式工作站,而适合特定制造任务的资产(如小帮手、欧姆龙 MoMa、KMR IIWA)已在汽车和航空航天业显示出成效。这些资产通过战略任务分配和路线安排,实现了可调整的布局和时间表,预计可提高劳动利用率和产量达 30%。 新的制造系统,如基于代理的制造系统、矩阵生产系统和无政府制造系统,通过分散或分布式控制实现资产自主化。

然而,随着开放式接口和通用标准使更多资产变得更加复杂和灵活,这些控制方法也面临着挑战。单个资产往往缺乏对整个系统及其限制因素的全面认识,因此难以协调单个计划,阻碍了最佳解决方案的实现。

更重要的是,最佳解决方案有赖于有效平衡不同的目标和利益相关者的偏好,而这些目标和偏好可能无法完全明确地模拟出来。为了最大限度地发挥资产自主性的优势,需要一种革命性的方法来确保以人为本的决策,同时有效地管理各种资产,兼顾不同的生产目标和处理不确定性。

生成模型通过独特的生成能力、概率建模和互动决策,为应对这些挑战提供了变革性的机会。在本研究中,我们提出了一种 GMS,它代表了从当前显性模型到未来隐性知识的根本性转变。受梦工厂愿景的启发,我们的方法探索了各种决策和不确定性的组合,并从未来经验中生成了许多潜在的未来。通过利用生成模型(包括扩散模型和 ChatGPT),GMS 巧妙地捕捉到了决策背后的模式和分布,即使在超出最初探索范围的情况下,也能促进创造性决策。

生成式制造系统(GMS)

作者建议在未来的制造系统中,将固定机器、自主资产和多样化的人力协同整合在一起。考虑到资产的自主性和流动性越来越强,作者建议自主资产和人类可以在不同的工作站之间动态移动并进行自我组织,从而改善制造操作并简化货物流 GMS 的设计目的是在人类的监督下,根据不确定性和生产目标娴熟地调整其配置和计划。在人的监督下,GMS 可以根据不确定性和生产目标巧妙地调整配置和计划。

图 1:全球监测系统示意图

图 1 显示了 GMS 的示意图,描述了资产接收人类查询的过程(左图)、训练有素的 GMS 模型从未来探索中抽取新决策的过程(中图),以及 GMS 根据人类查询提供各种配置和调度选项的过程(右图)。图 2. GMS 利用大型语言模型(如 ChatGPT、XLNet 和 Turning-NLP)将人类查询转化为机器语言。

然后,利用图像生成模型(如扩散模型、BigGAN 和 DALL-E)来生成系统配置(每个工作站的人员和资产位置),以响应人类的询问。此外,还要确定详细的操作时间表和任务分配,在各工作站之间以及人与机器人之间分配任务,并考虑到材料和流程限制。 与依赖现有显式模型寻找最优决策(模型优化)的方法不同,GMS 采用的是训练和抽样方法。

通过对未来场景的广泛探索,GMS 可以隐式学习良好决策的概率分布,并根据人的愿望和生产目标组合这些分布,然后对决策进行采样。从模型优化到训练和采样方法的转变,不仅解决了现有制造系统在计算方面的难题,还带来了以下优势

创造性:在采样时加入噪音,可增加潜在决策的范围。生成模型还可以通过组合所学分布来创建新的决策,这是应对新的人类查询和意外情况的一个重要因素。

复原力:训练和采样使系统在面对不确定性时反应更灵敏,采样决策比优化收敛更有效率,并能为不同场景提供多种解决方案。

以人为本:全球监测系统中的隐性知识与人类的探究、知识和专长无缝整合,使人类能够从生成模型中获得微妙的见解。这种协同作用使人类与自主资产之间的合作更加一体化和有效,使人类能够利用全球监测系统的能力来加强决策,并获得主人翁感和工作满足感。

生成模型

本节将介绍两个用于 GMS 中动态资产管理的生成模型:1)使用 ChatGPT 从人类查询中提取系统需求;2)使用扩散模型为这些需求生成配置。

ChatGPT

通过使用 Python 中的 OpenAI ChatGPT API 和 gpt-3.5-turbo 模型,我们创建了一个命名实体识别任务,以便从人类查询中生成关键需求。例如,如果查询的内容是 “我需要一条每小时至少生产 240 个零件且使用不超过 9 台机器的生产线”,响应将返回类 c = ‘(240, None, 9)’。无 "作为一个占位符,表示没有明确说明的人类技能。

扩散模型

扩散模型通过从训练数据中学习配置的基本模式、特征和分布来生成新样本。扩散模型与其他机器学习模型的不同之处在于,它们是通过逐步完善噪声注入数据来生成新样本的。这一过程包括两个过程,如图 2 所示。

前向过程:添加噪声𝜖 𝑡,直到每一步都销毁数据 𝑥 0。

后向过程:逐步去除估计噪声,并对新的𝑥0 进行采样。

图 2:扩散模型的前向和后向过程 在前向过程中,高斯噪声 𝜖 ∼ 𝑁 ( 0 , 𝐼 ) 在每一步 𝑡∈ 𝑇 被引入输入数据 𝑥0,权重由前向过程的方差 𝜖𝑡 决定。后向过程使用学习模型𝜃来估计噪声𝜖𝑡,作为𝑧𝑡、当前步骤𝑡和类别标签𝑐的函数。

学习模型

学习模型𝜃采用 U-Net 结构,以实现高效的噪声估计;U-Net 用于促进池化和反卷积路径之间的信息流。对残差卷积块进行了调整,以加强矩阵形式数据的分层特征提取和模式识别。跳转连接的引入无缝整合了 U-Net 不同层次的学习特征和上下文信息,保留了整个网络的空间特征。

图 3:使用残差卷积块进行噪声估计的 U-Net 架构。

每个区块有两个连续的卷积层,采用批量归一化、GELU 激活和残差连接,将输入添加到输出张量中,确保网络学习残差映射。

做梦过程

这项研究引入了一个 “做梦过程”,利用元启发式方法来探索潜在的决策。该过程随机生成未来的需求、人力和资产能力情景,并做出相应的配置和调度决策。它集成了遗传算法启发的选择、交叉和变异操作,以加快数据积累,促进生成多样化的适当配置。造梦过程在预定的迭代次数后终止,而不是模型收敛,从而确保了数据集的平衡。

结果

介绍了 GMS 的实施和模拟结果。本研究在一个工业部件加工使用案例中实施并模拟了 GMS。系统假设了九种资产类型和操作/运行设置,分布在七个工位,以促进灵活合作。人类技能水平随机设定为高/中/低(120/60/0 个零件/小时)。

图 4:根据目标容量进行配置的抽样过程

造梦过程将操作员的技能随机分为 25 代,每代包括 40 种潜在配置;使用 Cplex 获得配置和最佳时间表的映射。模拟运行了 120 个运行单元,并在 15 个小时内生成了 120,000 个数据用于训练。扩散过程和训练模型使用 Python 和 PyTorch 实现。根据优化调整结果,将过程方差设为 φ0=10-4和 φ𝑇=0.02,总步数设为 T = 400,引导强度设为 w = 2。

通过采样过程对扩散模型进行训练,以生成符合指定目标容量的合理配置。随着步骤数量的减少,抽样配置变得更加合理,并产生清晰的布局。合理的生成依赖于对关键特征和模式的隐性知识的娴熟积累。例如,容量为零的配置在矩阵的后半部分主要以浅色显示,这表明某类资产的使用率很低。随着产能的增加,资产类型(深色)也随之增加,从而提高了并行生产和运营效率。

表 1:决策时间与其他算法的比较

在整个指定容量范围内,扩散模型的决策时间在 9 毫秒到 16 毫秒之间。与其他算法相比,这种一致的效率代表了数量上的改进,其他算法在达到目标容量之前通常超过 10 秒,有时甚至超过 300 秒。扩散模型的一致效率表明,训练-抽样方法的算法效率有所提高,大大增强了全球监测系统对不确定性的响应能力和应变能力。

表 2:有指导和无指导时的模型性能

为全面评估生成样本的质量,随机抽取了 1000 个配置,并根据以下三个指标进行评估

精度:与所需容量一致的精度 (Accu) 和均方误差 (MSE)

多样性:训练数据中存在的生成配置的重叠率 (DR)

保真度:Frechet Inception Distance (FID),用于衡量生成样本与训练数据分布相比的可感知质量和保真度。

有指导和无指导的扩散模型性能如下所示。对于所需的要求,有指导的模型产生的决策具有更高的准确性、更低的 MSE 和更高的多样性;由于相应配置的高度相似性,FID 分数在极端容量时要低得多,而在中等容量时要高得多。总体而言,这些高精确度、高保真和高多样性的决策表明,GMS 在处理不确定性和多样化目标时具有很强的应变能力和创造力。

总结

本研究介绍了生成式制造系统(GMS),以利用制造资产的自主性来应对不确定性、人的愿望和新的生产目标。.来自工业应用案例的经验结果凸显了 GMS 的弹性和创造性,在决策时间、多样性和质量方面始终优于现有方法。

全球监测系统可以根据人类的询问和额外目标,巧妙地调整配置和调度,促进以人为本的决策,从而实现协作探索和持续改进。未来的研究可以探索诊断和质量管理等不同场景,以及碳排放和人类福祉等性能指标,并通过嵌入而非固定类别纳入更复杂的人类查询。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2088198.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

嵌入式Linux学习笔记-Linux基础操作

一、Linux 目录结构 二、文件基础操作 Linux 命令一般由三部分组成,命令 选项 参数。 1、pwd:列出当前所在路径 pwd //列出当前所在目录 2、cd:切换路径 cd /home/boot //切换路径为/home/boot cd .. //返回上一级目录…

鸿蒙(API 12 Beta3版)【自定义界面扫码】

基本概念 自定义界面扫码能力提供了相机流控制接口,可根据自身需求自定义扫码界面,适用于对扫码界面有定制化需求的应用开发。 说明 通过自定义页面扫码可以实现应用内的扫码功能,为了应用更好的体验,推荐同时[接入“扫码直达”…

海信电视与《黑神话 :悟空》合作,大屏端流畅游戏体验如何保障?

上线即巅峰 国产3A游戏引发热潮 近期,首款国产3A游戏《黑神话:悟空》自上线以来,便迅速在各大游戏平台占据热销榜首,其销量及在线人数均刷新历史记录。同时,该游戏在各大社交媒体中也拥有超高讨论度,其精湛…

在Ubuntu24.04上安装多主多从的高可用Kubernetes节点

前言 因为镜像拉取失败,所以好多小伙伴说calico网络插件安装失败。之前写过CentOS7上安装多主节点的Kubernets集群,而CentOS7又停止维护了。所以借着在Ubuntu上安装多主的Kubernetes集群的机会,使用国内镜像安装calico网络插件。 视频教程地…

Git实现代码托管

在电脑端下载git:Git - 安装 Git (git-scm.com) 点击继续下载:一直next即可 下载完毕 winR:cmd 输入:git 不报错即可 登录 gitee账号,根据教程完成内容即可创建成功 !!一定要先登录邮箱账号…

深度学习环境安装与验证指南

目录 1. 项目背景 2. 系统与软件版本 2.1 操作系统与硬件 2.2 软件版本 2.3对应版本 3. 环境配置步骤 3.1 安装 Anaconda 3.2 创建虚拟环境 3.3 安装 CUDA 和 cuDNN 3.3.1 安装 CUDA 11.8 3.3.2 安装 cuDNN 8.6 3.3.3 验证 CUDA 和 cuDNN 安装 3.4 安装 TensorFlo…

国产网卡品牌崛起,做好网络信息安全的“守门人”

在信息技术日新月异的时代背景下,信息安全不仅关乎个人隐私保护,更是国家安全与经济发展的基石。LR-LINK联瑞凭借其前瞻性的视野和深厚的研发实力,成功自主研发出全国产化的FPGA(现场可编程门阵列)网闸隔离卡方案&…

企业园区智慧升级:电子墨水屏标签打造环保高科技工作空间

“双碳”目标和“数字中国”建设推动企业绿色转型。企业园区作为城市数字化的重要组成部分,传统纸质显示方式已不适应数字化转型的需求。墨水屏技术凭借低功耗和信息便捷更新的优势,成为园区数智显示的新方案,助力绿色数字化转型,…

网络科学导论,网络同步与控制

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

swf怎么转换成mp4格式?视频格式转换,就看这2个办法

许多用户在处理多媒体文件时经常遇到的问题swf文件的转换问题。swf文件作为Flash动画的标准格式,曾经在网页设计和互动媒体中占据重要地位。然而,随着技术的发展和Flash的逐渐淘汰,越来越多的用户需要将swf文件转换为更通用的视频格式&#x…

视频中间件:与海康ISC平台级联

视频中间件是一款对各种视频流的接入处理并能通过标准H5接口输出的安防视频管理软件。其设备兼容性、并发性能、接口输出等方面表现突出,方便了行业跨平台、跨系统的第三方系统和应用对接。在很多的应用场景中,不仅仅是提供标准H5接口与其业务系统的互联…

详细解说数据库课程设计mysql

数据库课程设计中,MySQL是一个非常重要的工具,它是一种关系型数据库管理系统(RDBMS),广泛应用于各种规模的项目中。下面,我将详细解说在数据库课程设计中如何使用MySQL进行设计。 1. 理解数据库设计的基本…

STM32f103(固件库)

1.工程创建 新建STM32工程 步骤一:创建工程模板文件1.新建一个文件夹 template 2.在文件夹template里面新建六个文件(1)CMSIS: 存放内核驱动程序和启动引导文件(2)FWLIB:存放库函数文件&#…

使用twilio向手机发短信做监控报警

最近遇到个需求,就是夜班HW希望有个监控系统指标,如果异常就向监控人手机打电话的需求。在考察以后,发现目前由于国内防电信诈骗的原因,所以想要使用云通讯功能必须由企业去申请,但作为一个个人的监控项目来说太大了。…

【MySQL 15】使用 C/C++ 连接数据库

文章目录 🌈 一、引入 MySQL 库⭐ 1. 下载库文件⭐ 2. 上传库文件⭐ 3. 引用库文件⭐ 4. 验证是否引入成功 🌈二、MySQL 接口介绍⭐ 1. 初始化⭐2. 连接数据库⭐ 3. 关闭数据库连接⭐ 4. 设置编码格式⭐ 5. 发送 sql 指令🌙 5.1 向数据库表中…

Ant Design vue 多层for循环form表单自定义校验

数据结构如下&#xff1a;三维数组。 注意&#xff1a;<a-form-model>一定得写在for外面&#xff01;&#xff01;&#xff01;&#xff01; <!-- 弹出框 --> <a-modal:title"title":dialog-style"{ top: 20px }":visible"visible&quo…

日历显示项目

日历显示&#xff1a; //头文件#ifndef __HEAD_DALY_H__ #define __HEAD_DALY_H__#include <stdio.h> #include <stdlib.h> #include <string.h> #include <stdbool.h> #include <stdint.h>uint32_t months[12]; extern bool is_leap(uint32_t …

02.标准化编程规范

1. 前言 在日常开发中&#xff0c;随着团队人员的变更&#xff0c;功能迭代&#xff0c;如果没有一套规范约束大家&#xff0c;就会导致项目中的代码充斥着各种代码风格&#xff0c;会导致后期维护起来十分困难&#xff0c;所以有必要去制定一套规范。互联网发展到今天&#x…

九月更新|用这个方法,小白在国内也能轻松使用ChatGPT,GPT新手使用手册(编程代码)

一、 ChatGPT可以做什么&#xff1f; ChatGPT能做的事情非常多&#xff01;它不仅仅是一个对话AI。以下是一些主要功能&#xff1a; 1. 回答问题&#xff1a;无论是学术问题、技术问题&#xff0c;还是生活琐事&#xff0c;ChatGPT都能提供帮助。 2. 写作助手&#xff1a;可以…

html+css 实现 带射灯的浮雕按钮

前言:哈喽,大家好,今天给大家分享html+css 实现 带射灯的浮雕按钮!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎点赞、收藏+关注哦 💕 文章目录 效果原理解析1.此按钮效果主要是运用了==css3属性的box-shadow和…