DeepACO:用于组合优化的神经增强蚂蚁系统

news2024/11/13 9:30:40


文章目录

  • Abstract
  • 1 Introduction
  • 2 Related work
    • 2.1 神经组合优化
    • 2.2 蚁群优化
  • 3 蚁群优化初探
  • 4 Methodology
    • 4.1 参数化启发式空间
    • 4.2 局部搜索与局部神经引导扰动交织
    • 4.3 训练启发式学习器
    • 4.4 更好的探索
      • 4.4.1 多头解码器
      • 4.4.2 Top-k熵损失
      • 4.4.3 模仿损失
  • 5 实验
    • 5.1 实验设置
    • 5.2 DeepACO作为一种增强的ACO算法
    • 5.3 DeepACO作为NCO方法
  • 6 Conclusion and limitation

Abstract

提出了 DeepACO,这是一个利用深度强化学习来自动化启发式设计的通用框架。DeepACO 旨在加强现有 ACO 算法的启发式措施,并在未来的 ACO 应用中免除繁琐的手动设计。作为一种神经增强元启发式算法,DeepACO 在使用单个神经模型和一组超参数的 8 个 COP 上始终优于其 ACO 同行。作为一种神经组合优化方法,DeepACO 在规范路由问题上的表现优于或与特定问题的方法相当。

1 Introduction

启发式设计上存在缺陷:
1)需要额外的努力,并且使得ACO灵活性较差;
2)启发式举措的有效性很大程度上依赖于专家知识和人工调优;
3)考虑到可用的专业知识的缺乏,为研究较少的问题设计启发式措施可能特别具有挑战性。

本文提出DeepACO,一种通用的神经增强 ACO 元启发式算法,以及针对上述限制的解决方案。DeepACO 旨在加强现有 ACO 算法的启发式措施,并在未来的 ACO 应用中免除繁琐的手动设计。主要涉及两个学习阶段。第一阶段通过跨 COP 实例训练神经模型来学习从实例到其启发式测量的特定问题映射。通过偏置解决方案构造并引导局部搜索(LS)逃避局部最优,将第一阶段学习的启发式措施纳入 ACO(第二学习阶段)。

此外,我们提出了三种扩展实现,以更好地平衡开发和探索:一种具有多头解码器,一种采用额外的 top-k 熵损失进行训练,另一种采用额外的模仿损失进行训练。它们通常可应用于基于热图的 NCO 方法。

2 Related work

2.1 神经组合优化

端到端方法:直接使用神经网络将问题的输入映射到输出,实现端到端的优化。神经网络可以学习问题的表示和解码策略,从而直接生成最优解或近似最优解。端到端方法的优点是简单直接,但可能受限于问题的复杂性和规模。

混合方法:将传统的优化算法与神经网络结合起来,形成混合模型。例如,可以使用神经网络来学习问题的特征表示,然后将这些特征输入到传统的优化算法中进行进一步的优化。这种混合方法结合了传统优化算法的高效性和神经网络的表示学习能力,可以在一定程度上克服端到端方法的限制。

2.2 蚁群优化

ACO 可以利用一组名为超启发式 [69] 的技术,这些技术在概念上与 DeepACO 相关。但超启发式大多涉及专家设计的启发式选择(启发式选择超启发式)[27]或针对特定问题和手动定义的组件来演化启发式(启发式生成超启发式)[14]。相比之下,DeepACO 更加通用,几乎不需要 COP 的先验知识。

3 蚁群优化初探

选择节点 j j j作为下一个目的地的概率:


基于等式(1)构建完整的解决方案需要n步图遍历。生成 s 的概率可以分解为:


构建解决方案后,可选择应用局部搜索 (LS) 来细化解决方案。

4 Methodology

DeepACO示意图如图1所示,其中与ACO进行了比较。它不需要专家知识,而是学习一套更强的启发式举措来指导ACO的进化。

4.1 参数化启发式空间

我们引入了一个启发式学习器,它由具有可训练参数 θ 的图神经网络 (GNN) 定义,以参数化启发式空间。

启发式学习器将输入COP实例 ρ \rho ρ(具体的组合优化实例)映射到启发式测量 η θ \eta_\theta ηθ

4.2 局部搜索与局部神经引导扰动交织

我们在算法1中提出了LS交错与神经引导扰动(简称NLS)。NLS将旨在降低目标值的LS与偏向学习最优值的神经引导扰动交织在一起。

在每次迭代中,第一阶段利用LS反复细化解决方案,直到(可能)达到局部最优。第二阶段利用LS稍微扰动局部最优解,以获得更高的累积启发式测量。

<

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2125249.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DWS=管理员用户创建

管理员用户简介 管理员也称作系统管理员&#xff0c;是指具有SYSADMIN属性的帐户。 非三权分立模式下&#xff0c;拥有系统的最高权限&#xff0c;能够执行所有的操作。系统管理员具有与对象所有者相同的权限。管理员用户创建 su - omm source /opt/huawei/Bigdata/mppdb/.mpp…

【数据结构-二维前缀最小值】力扣3148. 矩阵中的最大得分

给你一个由 正整数 组成、大小为 m x n 的矩阵 grid。你可以从矩阵中的任一单元格移动到另一个位于正下方或正右侧的任意单元格&#xff08;不必相邻&#xff09;。从值为 c1 的单元格移动到值为 c2 的单元格的得分为 c2 - c1 。 你可以从 任一 单元格开始&#xff0c;并且必须…

2024年汉字小达人校内选拔的常见问题和解答

广受上海市小学生们关注的2024年第十一届汉字小达人的时间已经确定了&#xff0c;参赛的孩子们已经开始紧锣密鼓的准备中。 如昨天分析的2024年汉字小达人的赛程&#xff0c;即日起到10月20日是学校自行选拔的时间节点。9月25-30日是区级自由报名集中参赛的日子。两个日子有一…

中秋佳节,如何挑选实用有意义的礼物?精选中秋节最佳送礼清单!

当秋风送爽&#xff0c;丹桂飘香&#xff0c;我们即将迎来一年一度的中秋佳节。在这个充满温情与团圆的节日里&#xff0c;赠送礼物成为了表达我们对家人、朋友以及同事的关怀与祝福的重要方式。然而&#xff0c;面对琳琅满目的商品&#xff0c;如何挑选出既实用又有意义的礼物…

《现代食品》是什么级别的期刊?是正规期刊吗?能评职称吗?

​问题解答 问&#xff1a;《现代食品》是不是核心期刊&#xff1f; 答&#xff1a;不是&#xff0c;是知网收录的正规学术期刊。 问&#xff1a;《现代食品》级别&#xff1f; 答&#xff1a;省级。主管单位&#xff1a; 中粮工程科技有限公司 主办单位…

韩国汽车工业的绿色革命:古瑞瓦特光伏逆变器助力能源转型与可持续发展

韩国汽车工业的绿色革命&#xff1a;古瑞瓦特光伏逆变器助力能源转型与可持续发展 汉江奇迹 带来韩国的工业化和现代化 能源的可持续供给 逐步成为韩国工业发展的关键议题为此&#xff0c;韩国颁布了「国家能源基本计划」 推动再生能源发展 预计到2030年新能源电力占总电力的20…

CCS10导入CCS3.3工程

选择工程 下一步 下一步 下一步 下一步 去掉XDAIS 下一步 下一步编译

QT 对话框 仿文本编辑器

对话框通常是一个顶层窗口&#xff0c;出现在程序最上层&#xff0c;用于实现短期任务或者简洁的用户交互 一、消息对话框&#xff08;QMessageBox&#xff09; 1、QMessageBox类成员函数实现 1&#xff09;实例化 QMessageBox类 对象 2&#xff09;设置对象属性 3&#x…

【Linux】解锁Shell脚本编写秘籍,编程高手之路等你开启

目录 1. 打印命令行提示符2. 获取用户输入的命令行字符串3. 对命令行字符串进行解析(分割&#xff09;4. 处理内建命令4.1. 内建命令</h3>4.2. 外部命令4.3. cd4.5. export4.6. echo 5. 执行命令5.1. 创建子进程进行程序替换 6. 重定向</h2>7. 总代码 1. 打印命令行…

[000-01-002].第03节:Git基础命令

我的博客大纲 我的GIT学习大纲 1、Git的常用命令 2、Git操作步骤&#xff1a; 2.1.操作Git第一步&#xff1a;设置全局的用户签名 1.设置用户名&#xff1a; 格式&#xff1a;git config --global user.name 用户名命令&#xff1a;git config --global user.name root 2.设置…

【开源免费】基于SpringBoot+Vue.JS在线旅游网站(JAVA毕业设计)

本文项目编号 T 025 &#xff0c;文末自助获取源码 \color{red}{T025&#xff0c;文末自助获取源码} T025&#xff0c;文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析 六、核心代码6.1 查…

【网络安全】漏洞挖掘:文件上传实现Webshell

未经许可,不得转载。 文章目录 正文正文 提交文件功能点,显示只能上传png、jpg、pdf文件 上传一个正常的图片,请求响应如下: 可以看到,该文件被上传到redacted.com,这为后面实现Webshell提供了前提。 接着,我上传webshell.php文件,文件内容为payload,拦截请求包,将…

逆变器的防孤岛测试性能评估

逆变器是太阳能发电系统中的关键设备&#xff0c;它将太阳能电池板产生的直流电转换为交流电&#xff0c;供电网或负载使用。在并网运行的太阳能发电系统中&#xff0c;如果电网出现故障&#xff0c;导致与电网断开连接&#xff0c;但逆变器仍然继续向电网供电&#xff0c;这种…

VBA CSV数据拆分

1. Range.TextToColumns函数 Option ExplicitSub txt2Col()ActiveSheet.Range("A2").CopyActiveSheet.PasteSelection.TextToColumns DataType:xlDelimited, _ConsecutiveDelimiter:True, Comma:True End Sub 2. 效果 执行前 cccccc 执行后效果​ cccc 3. 参照 更…

视频编辑SDK解决方案,代码逻辑结构清晰,接入便捷

美摄科技作为视频编辑技术领域的佼佼者&#xff0c;凭借其深厚的多媒体处理积累和创新精神&#xff0c;推出了革命性的移动端视频编辑SDK解决方案&#xff0c;彻底颠覆了传统视频编辑的方式&#xff0c;让每一份灵感都能轻松转化为引人入胜的视觉盛宴。 一站式视频创作与编辑平…

The First项目报告:BlackCardCoin让数字资产多元化

现有的区块链技术存在吞吐量瓶颈、互操作性有限和次优共识机制等问题&#xff0c;导致效率低下&#xff0c;阻碍了真正全球化金融体系的建立。因此&#xff0c;迫切需要一种创新的区块链&#xff0c;能够容纳现代金融的复杂性&#xff0c;包括即时结算、强大的安全措施&#xf…

用STM32做一个USB-TTL工具吧

某宝1分钱白嫖一个STM32C6T6的板子&#xff0c;然后手里的CH340挂了。那么自己做一个吧。 串口没有使用DMA空闲中断等等机制,有兴趣的加上了call我炒一下。 惯例CUBEMAX配置 1.usb-fs 2.usb-cdc 3.串口开一个中断&#xff0c;使用LL库 贴代码了 usart.c /* USER CODE BEGIN…

电源层 BGA 孔图案对高速信号质量的影响

电源层中的大量间隙孔会对高速信号的行为产生巨大影响。信号完整性对于设计人员来说是一个日益严重的问题&#xff0c;因为新设计需要具有越来越多引脚数的组件&#xff0c;而这些组件必须使用过孔进行连接以访问印刷电路板 (PCB) 的内层。孔和焊盘堆叠的正确设计可以产生高产量…

①MongoDB基本知识①

MongDB属于非关系型数据库一派&#xff0c;没有固定的数据格式存储&#xff0c;是一个具备高性能、高拓展的文档型数据库&#xff0c;数据以BSON(JSON的二进制)的格式存储。 特点: 基于对象模型&#xff0c;关系简单。没有外键的约束&#xff0c;也没有强连接表的关系&#x…

OpengGL教程(三)---使用VAO和VBO方式绘制三角形

本章参考官方教程&#xff1a;learnopengl-cn VertexShader.glsl #version 330 core layout(location 0) in vec3 position; layout(location 1) in vec3 color; uniform mat4 projection; // 投影矩阵 out vec4 ourColor; void main() {gl_Position projection * vec4(p…