无监督神经组合优化的扩散模型框架

news2024/9/20 19:52:30


文章目录

  • Abstract
  • 1. Introduction
  • 2. Problem Description
    • 2.1 无监督神经组合优化
  • 3. Neural Probabilistic Optimization Objective for Approximate Likelihood Models
    • 3.1 具有联合变分上界的训练扩散模型

Abstract

  • 从离散集合的不可处理分布中进行采样,而不依赖相应的训练数据,是多个领域的核心问题,包括组合优化。
  • 目前,流行的基于深度学习的方法主要依赖于能够提供精确样本概率的生成模型。本文提出了一种方法,打破了这种限制,并为使用诸如扩散模型等高度表达力的潜变量模型开辟了可能性。
  • 我们的方法从概念上基于一种上界反向Kullback-Leibler散度的损失函数,从而避免了对精确样本概率的需求。

1. Introduction

从已知但不可处理的高维目标分布(如Boltzmann分布)中进行采样,在许多科学领域具有重要意义,例如分子构型预测(Noé和Wu, 2018)、物理学中的晶格模型(Wu等,2019)以及蒙特卡洛积分(Müller等,2019)。最近,Hibat-Allah等人(2021)和Sanokowski等人(2023)的研究表明,组合优化(CO)可以简洁地表示为一种分布学习问题,其中生成的样本对应于组合优化问题的解。在所有这些领域中,分布相关的能量函数是已知的,但获取无偏样本则是一个巨大的挑战。像CO或物理学中的晶格模型等问题的特点是离散目标分布。在这些应用中,目标分布的近似主要基于范畴分布的乘积或自回归模型。尽管乘积分布在计算上是方便的,但它们缺乏表达力,因为它们无法表示统计上的相互依赖关系。自回归模型依赖于顺序生成样本的各个组成部分。对于这些领域中经常遇到的高维分布,这种生成过程变得极其昂贵。此外,样本的组成部分之间通常没有自然的顺序。因此,自回归方法在这些问题中显得不太自然。直观上,自回归模型的问题在于一旦做出次优决策,就没有机会进行修正。从计算复杂性角度看,也可以证明自回归模型的表达力不如基于能量的模型或潜变量模型(Lin等,2021)。

利用潜变量的近似概率模型(如变分自编码器(VAE)(Kingma和Welling,2014)和扩散模型(Sohl-Dickstein等,2015;Ho等,2020;Song等,2021))通过数据样本进行训练,并基于证据下界(ELBO)的损失函数。这些模型的优点是它们在离散设置中更具表达力且更为适用。然而,对于这些模型,通常无法计算精确的样本概率。这一问题阻碍了它们在无需数据的目标分布近似问题中的应用,因为这些问题通常依赖于精确的样本概率。最近的研究提出了在无需数据的情况下应用扩散模型的方法,但这些研究仅限于连续设置(Berner等,2022;Richter等,2023;Vargas等,2023;2024)。据我们所知,离散设置尚未得到探索。

在本文中,我们在第3节中提出了一种方法,允许潜变量模型(如扩散模型)应用于离散分布的无需数据的近似问题。我们在该领域的典型问题上展示了我们的方法,展示了其在组合优化中的应用,并取得了最先进的性能。为了实现这一点,我们提出的无监督组合优化扩散方法(DiffUCO)使用了反向Kullback-Leibler散度的上界作为损失函数。我们展示了,随着训练中使用的扩散步骤的增加,模型的性能稳定提升。此外,我们发现,在推断过程中,使用比训练时更多的扩散步骤可以进一步提高解的质量(见第6.2节)。在第4.1节中,我们提出了一种更高效的常用采样策略“条件期望”(Conditional Expectation)的版本。我们展示了这一方法与扩散模型结合后,可以高效地生成高质量的组合优化问题解。该框架提供了一种高效且通用的方法,使得潜变量模型(如扩散模型)能够应用于无需数据的离散分布近似这一普遍挑战中。

2. Problem Description

根据Lucas(2014)的研究,我们将组合优化(CO)问题表示为相应的能量函数 H : { 0 , 1 } N → R H:\{0,1\}^N \rightarrow \R H:{ 0,1}NR。该函数为给定解 X ∈ { 0 , 1 } N X∈\{0,1\}^N X{ 0,1}N分配一个标量值,称为能量。X的维度表示为N,称为问题规模。与 H 相关的Boltzmann分布定义为:

其中参数T称为温度,β=1/T称为逆温度。

NPO的常见方法是最小化相对于模型参数 θ 的反向Kullback-Leibler散度(KL散度):

将该目标乘以T可得变分自由能 F θ ( X , T ) F_\theta(X,T) Fθ(X,T)的一个与之成比例的表达式:


要最小化这一目标,必须对生成模型的样本概率 q θ ( X ) q_\theta(X) qθ(X)进行精确评估。这可以通过REINFORCE(Williams, 1992)梯度估计器来实现:

为了最小化这一目标,必须能够选择一个能够有效评估样本概率 q θ ( X ) q_\theta(X) qθ(X)的生成模型。因此,使用潜在变量模型(如VAE或扩散模型)来优化这一目标是不可能的,因为这些模型无法对 q θ ( X ) q_ θ (X) qθ(X) 进行精确评估。

在第3节中,我们提出了一种基于反向KL散度上界的目标函数来缓解这一问题。原则上,也可以使用其他散度来近似目标分布。例如,反向和正向KL散度是Rényi散度的特例(van Erven和Harremoes,2014),它们都需要精确评估 q θ ( X ) q_\theta(X) qθ(X)。通过引入散度上界,我们避免了对 q θ ( X ) q_\theta(X) qθ(X)的评估。选择何种散度取决于具体应用,因为Rényi散度要么偏向覆盖概率质量,要么偏向模式选择(Minka等人,2005)。本文我们重点讨论反向KL散度,但我们的框架同样适用于其他Rényi散度。

2.1 无监督神经组合优化

在组合优化(CO)中,任务是找到一个解 X ∈ { 0 , 1 } N X∈\{0,1\}^N X{ 0,1}N,使得目标函数 O : { 0 , 1 } N → R O:\{0,1\}^N \rightarrow\R O:{ 0,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2149891.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OpenAI o1解决了Quiet-STaR的挑战吗?(下)

随着OpenAI o1近期的发布,业界讨论o1关联论文最多之一可能是早前这篇斯坦福大学和Notbad AI Inc的研究人员开发的Quiet-STaR,即让AI学会先安静的“思考”再“说话” ,回想自己一年前对于这一领域的思考和探索,当初也将这篇论文进行…

初学者蒙语学习,使用什么翻译软件学习更快?

为了加快蒙古语的学习,初学者应该从基础语法和词汇入手,利用语言学习应用进行系统学习,并通过音频和视频材料提高听力。语言交换和参加课程可以提供实践机会,而使用闪卡和文化沉浸有助于记忆词汇和理解语言背景。定期复习和设定学…

聊天组件 Vue3-beautiful-chat 插槽

前言 Vue3-beautiful-chat 组件有四个插槽可以定制 一、user-avatar(头像) 首先是头像插槽,我们可以直接在 <beautiful-chat></beautiful-chat> 中间使用; 作用: 我们可以在用户头像上添加自定义样式,比如添加节日边框、可以使用首字母作为头像。。。 …

小阿轩yx-通过state模块定义主机状态

小阿轩yx-通过state模块定义主机状态 前言 前面学习了远程执行模块&#xff0c;这些模块的执行类似语段 shell 脚本&#xff0c;每次执行都会触发一次相同的功能&#xff0c;在大量的 minion 上运行远程命令当然是重要的&#xff0c;但是对于 minion 的环境控制&#xff0c;使…

Python 二级考试

易错点 定义学生关系模式如下&#xff1a;Student &#xff08;S#&#xff0c; Sn&#xff0c; Ssex&#xff0c;class&#xff0c;monitorS#&#xff09;&#xff08;其属性分别为学号、学生名、性别、班级和班长学号&#xff09; 在关系模式中&#xff0c;如果Y -> X&…

超详细!百分百安装成功pytorch,建议收藏

文章目录 一、Anaconda安装1.1下载anaconda1.2配置Anaconda环境1.3验证anaconda是否安装成功 二、查看电脑显卡三、更新显卡驱动3.1下载驱动3.2、查看显卡驱动版本 四、cuda安装4.1CUDA下载4.2CUDA环境配置4.3验证CUDA是否安装成功 五、安装pytorch4.1下载pytorch5.2验证pytorc…

计算机专业的就业方向

计算机专业的就业方向 亲爱的新生们&#xff0c;欢迎你们踏上计算机科学的旅程&#xff01;作为一名计算机专业的学生&#xff0c;你们即将进入一个充满无限可能的领域。今天&#xff0c;我将为大家介绍计算机专业的一些主要就业方向&#xff0c;帮助你们了解未来的职业选择。…

备忘录应用哪些值得推荐?优秀的桌面备忘录下载

在我们的日常生活和工作中&#xff0c;备忘录是一款常用的记录软件&#xff0c;它为我们提供了极大的便利&#xff0c;让我们可以随时记录下重要的信息、灵感和待办事项。然而&#xff0c;如今网上的备忘录软件琳琅满目&#xff0c;究竟哪一款才是真正优秀的呢&#xff1f; 在…

分步指南:如何使用 ChatGPT 撰写文献综述

撰写文献综述对于研究人员和学生来说,往往是一项既耗时又复杂的任务。这一过程不仅要求对所选主题的现有研究进行全面的了解和掌握,还需要学术严谨性。然而,随着像 ChatGPT 这样的高级语言模型的广泛应用,撰写文献综述的过程变得更加高效和简化。通过合理利用 ChatGPT,研究…

分享三款简单好用的文档翻译软件

在平时的工作学习中免不了会碰上需要翻译文件的时候&#xff0c;给大家分享三款简单好用的翻译软件&#xff0c;可以直接翻译整篇的文档&#xff0c;翻译速度快&#xff0c;准确率高&#xff0c;可以大大提高效率。 1.谷歌翻译 这个翻译软件支持在线翻译&#xff0c;也可以翻…

华为 HCIP-Datacom H12-821 题库 (25)

&#x1f423;博客最下方微信公众号回复题库,领取题库和教学资源 &#x1f424;诚挚欢迎IT交流有兴趣的公众号回复交流群 &#x1f998;公众号会持续更新网络小知识&#x1f63c; 1.以下哪些事件会导致 IS-IS 产生一个新的 LSP? A、邻接 Up 或Down B、引入的 IP 路由发送变…

康佳集团的多元化战略:创新还是负担?

2023年&#xff0c;康佳集团豪赌“一轴两轮三驱动”战略&#xff0c;企图以消费电子和半导体为马&#xff0c;来驱动业绩的快车&#xff0c;但2024年的半年报如同一盆冷水&#xff0c;让所有期望化为泡影。 财报显示&#xff0c;康佳上半年营业总收入只有54.13亿元&#xff0c…

传输大咖44 | 云计算企业大数据迁移如何更安全高效?

在云计算时代&#xff0c;数据已成为企业最宝贵的资产之一。对于依赖云服务的企业和组织来说&#xff0c;大数据迁移是实现业务扩展和优化的关键步骤。然而&#xff0c;这一过程并非没有挑战。传统的文件传输方式在安全性、稳定性和速度上往往无法满足云计算企业的需求。本文将…

ORCA-3D避障代码和原理解析

二维ORCA原理参考&#xff1a; https://zhuanlan.zhihu.com/p/669426124 ORCA原理图解代码解释 1. 找到避障速度增量 u 碰撞处理分为三种情况&#xff1a; &#xff08;1&#xff09;没有发生碰撞&#xff0c;且相对速度落在小圆里 &#xff08;2&#xff09;没有发生碰撞&a…

CANopen从站为什么总不上传PDO报文?

在CANopen网络中无法获取从站的TPDO数据&#xff1f;本文将为您解析可能的原因及解决方案。通过检查TPDO的通信参数和传输类型&#xff0c;确保主站与从站的数据同步&#xff0c;快速定位问题所在。 如果你的CANopen网络中已经确保接线和波特率都没有问题&#xff0c;但无论主站…

在线教程丨1 步生成 SOTA 级别图像,Hyper-SD 一键启动教程上线!

近年来&#xff0c;扩散模型在文生图任务中得到了广泛的应用&#xff0c;但其在实现高质量图像生成的过程中&#xff0c;通常需要多步推理进行去噪&#xff0c;这显然大大增加了计算资源成本。 针对于此&#xff0c;研究人员引入蒸馏算法&#xff0c;推出了扩撒感知蒸馏算法来…

图结构的稀疏变换器:EXPHORMER框架

人工智能咨询培训老师叶梓 转载标明出处 尽管图变换器在理论上具有强大的表达能力&#xff0c;但是它们在扩展到大型图时面临着巨大的挑战。这一挑战主要源于其全局注意力机制的二次方时间复杂度&#xff0c;这不仅限制了其在大型图数据集上的应用&#xff0c;也使得其在内存和…

超实用的分数查询系统,老师不可错过!

在学校与家庭的互动中&#xff0c;成绩往往像一颗不定时炸弹。我们都知道&#xff0c;每次考试成绩公布后&#xff0c;就像一场风暴即将席卷平静的港湾。 有这样一个案例&#xff0c;一位老师辛苦地批改完试卷&#xff0c;将成绩以传统的表格形式发在班级群里。这一下可捅了马蜂…

【mysql技术内幕】

MySQL之技术内幕 1.MVCC模式2. 实现mvcc模式的基础点3.MySQL锁的类型4. 谈谈分库分表5. 分表后的id咋么保证唯一性呢&#xff1f;6. 分表后非sharding key的查询咋么处理的&#xff1f; 1.MVCC模式 MVCC, 是multi-version concurrency control的缩写&#xff0c;即多版本并发控…

【时时三省】(C语言基础)指针笔试题1

山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 笔试题1: 创建了一个a数组 它有五个元素 五个元素分别是1 2 3 4 5 &a取出来的是一维数组的地址 然后产生的结果强制类型转换了成int &a+1就是从1跳到了5 如下图 再把这个地…