供应链 | 基于图神经网络和深度强化学习的柔性车间调度方法

news2024/11/27 11:23:41

编者按

本次解读的文章发表于IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS,原文摘要总结如下:本文考虑了众所周知的灵活作业车间调度问题,并通过提出一种新颖的深度强化学习(DRL)方法来端到端地学习高质量的优先级调度规则(PDR) 来解决这些问题。操作选择和机器分配被组合为一个复合决策。此外,基于一种新颖的调度状态异构图表示,提出了一种基于异构图神经网络的体系结构来捕获操作和机器之间的复杂关系。实验表明,所提出的方法优于传统的 PDR,并且计算效率高,即使在训练中未见过的更大规模和不同属性的实例上也是如此。

1 引言

本文重点介绍灵活的作业车间调度问题 (FJSP),它是作业车间调度问题 (JSP) 的众所周知的推广,在云制造中具有广泛的应用。与 JSP 不同,FJSP 允许在一组可选机器中的任何机器上处理操作。

关键研究问题:
1)如何制定调度过程以结合机器分配;
2)如何设计表示方案和神经架构以从原始调度状态中提取有用信息。
针对研究问题 1):本文提出了一种用于基于 PDR 的 FJSP 调度的马尔可夫决策过程(MDP)公式,其中一个动作是选择一个合格的操作-机器 (O-M) 对,这样就可以同时做出操作选择和机器分配决策。
针对研究问题 2),通过扩展具有机器节点的 FJSP 的析取图,本文提出了一种新颖的异构图结构来表示 MDP 状态,从而可以捕获操作和机器之间的复杂关系。

此外,本文提出了一种两阶段图神经网络(GNN)来获得异构图中节点的特征嵌入,在此基础上使用近端策略优化(PPO)设计和训练策略网络。与现有的基于 DRL 的调度方法中使用的 GNN 不同,本文提出的 GNN 专门用于 FJSP 的异构图,它捕获了不仅是操作的状态,还有机器和 O-M 关系的状态。

2 FJSP问题

3 析取图

4 方法概述

在本文中,解决FJSP被认为是一个顺序决策过程,它迭代地采取调度动作,将一个操作分配给每个状态的兼容机器,直到所有操作都被调度。所提出方法的工作流程如图2所示。在每次迭代中,调度状态首先转换为异构图结构。然后,将具有两阶段嵌入过程的异构图神经网络(HGNN)应用于异构图,以提取操作和机器的特征嵌入,决策网络使用这些嵌入来生成动作概率分布,从中采样调度操作。

5 马尔科夫决策过程

6 异构图

7 异构图神经网络

8 策略训练

9 实验结果

为了进行测试,使用贪婪策略和采样策略对策略进行测试,分别命名为DRL-G 和DRL-S。对于每个训练规模,表1报告了从与训练相同的分布中抽取的 100 个测试实例的 OR-Tools 解决方案的平均完工时间和差距。对于基于 PDR 的方法,所提出的方法(在两种策略中)在四种训练规模中始终优于所有基线 PDR。为了进行更详细的比较,将所提出的方法作为参考来计算每个基线 PDR 的差距,箱线图如图5所示。可以观察到,所提出的方法在近 75% 的实例上超过了 MWKR。

本文进一步检验了所提出的大小不可知策略在推广到未见过的大型实例方面的能力。为此,在 20 × 10 实例上训练的策略直接在 30 × 10 和 40 × 10 实例上运行,结果总结在表2中。可以观察到,所提出方法的优势在这些大型实例上仍然保持,表明在小型和中型实例上学习的模式在解决大型实例时仍然有效。

本文在基准实例上评估训练策略在传统研究中经常使用的两个公共基准上的泛化性能。表3总结了结果。

与最近在mk基准上报告结果的方法相比,所提出的方法明显优于它(在 20×5 实例上训练的策略除外),显示了 HGNN 在提取丰富状态信息方面的优势更好的决策。

参考文献

•Song W, Chen X, Li Q, et al. Flexible Job-Shop Scheduling via Graph Neural Network and Deep Reinforcement Learning[J]. IEEE Transactions on Industrial Informatics, 2022, 19(2): 1600-1610.

•F. Ni et al., “A multi-graph attributed reinforcement learning based optimization algorithm for large-scale hybrid flow shop scheduling problem,” in Proc. 27th ACM SIGKDD Conf. Knowl. Discov. Data Mining, 2021, pp. 3441–3451.

作者信息

•Wen Song, Institute of Marine Science and Technology, Shandong University, Qingdao, China.

•Xinyang Chen, School of Control Science and Engineering, Shandong University, Jinan, China.

•Qiqiang Li, School of Control Science and Engineering, Shandong University, Jinan, China.

•Zhiguang Cao, Singapore Institute of Manufacturing Technology, Singapore.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667565.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot实现过滤器Filter的三种方式

# 实现Filter接口方式① 使用Filter接口方式② 使用Component注解方式③ Java Config 配置类 # 实现Filter接口 过滤器 Filter 由 Servlet 提供,基于函数回调实现链式对网络请求与响应的拦截与修改。由于基于 Servlet ,其可以对web服务器管理的几乎所有…

重复消费和堆积

接受消息会重复这一现状,然后通过一些方法来消除重复消息对业务的影响 利用幂等性解决重复消息问题 幂等(其任意多次执行所产生的影响均与一次执行的影响相同。) 一个幂等的方法,使用同样的参数,对它进行多次调用和一…

flutter七牛云上传sdk插件qiniu_flutter_sdk使用

flutter七牛云上传sdk插件qiniu_flutter_sdk使用 最近在拆分代码,将上传组件设置成插件,下面记录下实现过程。 一、创建flutter_plugin上传插件 这里Android Studio使用创建plugin 填写一下信息 Project nameProject locationDescriptionProject typ…

单片机入门所需的基础数电和模电知识

要学习单片机并入门相关领域,推荐掌握以下数电和模电的基础知识: 数电知识: 布尔代数和逻辑门:了解布尔代数的基本概念和逻辑门的工作原理,包括与门、或门、非门、与非门、或非门、异或门等。 时序逻辑和时钟信号&a…

AIOps介绍

AIOps介绍 AIOps是指人工智能运维(Artificial Intelligence for IT Operations)的缩写。它是将人工智能(AI)和机器学习(ML)技术应用于IT运维领域的一种方法。 传统的IT运维通常需要人工监测和管理大量的系…

脑机接口科普0022——黑门02:伦理道德问题

本文禁止转载!!!! 脑机接口这个技术,是属于黑科技技术中的一种。 现在已经有很多专家,以及机构,提出脑机接口的存在的一些问题。法律是一块的问题,伦理道德是另一块的问题。 虽然…

苹果iPhone14卡死怎么办?解决办法分享!

正常使用的iPhone14虽然很少会出现卡死的情况,但iPhone就是一台微型电脑,像电脑一样“死机”也不是没可能。 有用户称在使用iPhone14时出现突然出现弹出的提示框无法点击取消,锁屏也解决不了死机的问题。同时又因为屏幕其他区域不能操作&…

MySQL免安装配置教程(win10)

一、下载安装包 1.1、下载zip包 打开官网地址下载zip安装包,这里下载的版本是5.7,可自行选择。 对应下载网址:https://downloads.mysql.com/archives/community/ 根据自己电脑进行选择对应安装包 若需要下载msi安装包(图形化界…

Mysql漏洞处理之升级版本到5.7.42过程指导手册

一、背景 某次安全漏扫,发现MySQL大量漏洞,基于Mysql之用于内网,且版本确实有点旧,考虑升级,综合漏洞分析,只能升级到最新版5.7.42和8.0.33,现场环境:Mysql 5.7.28、5.7.20和mysql&…

高等职业学院校园IP网络广播应用-河北资源环境职业技术学院校园IP广播

职业院校大学校园IP网络广播在河北资源环境职业技术学院产教融合基地的应用 北京海特伟业科技任洪卓发布于2023年6月20日 一、高等职业院校校园IP网络广播系统-广播中心 河北资源环境职业技术学院产教融合基地-高等职业院校校园IP网络广播系统是基于TCP/IP协议校园局域网构建…

通过GPIO子系统编写LED驱动,应用程序控制LED灯亮灭

1、在内核设备树中添加设备信息: LED1的设备树编写需要参考内核的帮助文档: linux-5.10.61/Documentation/devicetree/bindings/gpio 在根节点内部添加led灯设备树节点 :~/linux-5.10.61/arch/arm/boot/dts $ vi stm32mp157a-fsmp1a.dts myled.c #in…

渗透测试思路总结

一、说明 《Metasploit 渗透测试魔鬼训练营》等书已经对渗透测试的步骤流程划分得比较合理透彻了,但感觉在多次通读该类书藉之后仍总感觉不得要领----要对一台给定的主机进行渗透还是不懂到底该如何着手。想来主要是存在以下两个问题。 第一个是在渗透操作系统时&…

Yolov8优化:引入Soft-NMS,提升密集遮挡场景检测精度

1.Soft-NMS介绍 论文地址:https://arxiv.org/pdf/1704.04503.pdf NMS需要优化的参数: IoU 的阈值是一个可优化的参数,一般范围为0~0.5,可以使用交叉验证来选择最优的参数。 R-CNN会从一张图片中找出n个可能是物体的矩形框,然后为每个矩形框为做类别分类概率: 就…

maven测试依赖的排除

1、概念 当 A 依赖 B,B 依赖 C 而且 C 可以传递到 A 的时候,A 不想要 C,需要在 A 里面把 C 排除掉。而往往这种情况都是为了避免 jar 包之间的冲突。 所以配置依赖的排除其实就是阻止某些 jar 包的传递。因为这样的 jar 包传递过来会和其他 …

parallelStream与CompletableFuture

1 了解parallelStream parallelStream怎么实现的并行处理呢? 其底层是Fork/Join并行计算框架的默认线程池,默认线程池的数量就是处理器的数量,可以使用系统属性:-Djava.util.concurrent.ForkJoinPool.common.parallelism{N} 调整…

【数据库】MySQL 高级(进阶) SQL 语句

文章目录 前提条件一、常用查询1. SELECT(显示查询)2. DISTINCT(不重复查询)3. WHERE(有条件查询)4. AND/OR(且/或)5. IN (显示已知值的字段)6. BETWEEN&…

自驾出游擅自使用对讲机属于违法行为?

周末或节假日大多数人通常都会选择自驾出游,或是叫上自己的好友一起出游,这个时候就可以组成一个车队。为了沟通起来更方便,大家一般都喜欢配个对讲机。 不过据调查显示,大多数人并不认为擅自使用对讲机算违法行为。在多个电商平…

【计算机视觉】OFA:通过一个简单的seq2seq的学习框架来统一架构、任务和模态

文章目录 一、导读二、摘要三、介绍四、OFA4.1 I/O & Architecture4.1.1 I/O4.1.2 Architecture 4.2 Tasks & Modalities4.3 预训练数据集4.4 训练与推理4.5 缩放模型 五、实验结果5.1 跨模态任务的结果5.2 单模态任务的结果5.3 zero-shot学习和任务迁移 六、测试结果七…

测试不为人知的小秘密,你占了几个?

1、线上出现小bug,小本本记下,后面偷偷给开发提个bug。 2、操作服务器时,把数据库玩坏了,系统玩崩了,加班熬夜默默的抢救修复。 3、和开发吵了一架,然后重点照顾了他负责的模块,找了一堆bug&a…

智慧无线灌溉在园林中的应用

智慧无线灌溉技术是解决人们生活用水与园林灌溉之间用水矛盾的有效措施之一,对提升园林灌溉效率和节约水资源有着重要的意义。 智慧无线灌溉系统可以自动感知园林植物周围的环境温度、水分等要素,并对感知到的要素进行详细分析和判断,以确定…