图 ML 中的去噪扩散生成模型

news2024/12/23 15:30:37

Denoising Diffusion Generative Models in Graph ML | by Michael Galkin | Towards Data Science (medium.com)

一、说明

        AI DDPM 代表【"Adaptive Importance Density Power Mixture Model" 】即“自适应重要性密度幂混合模型”,是一种用于密度估计的机器学习算法。它是深度密度分解 (DDD深度密度分解,也称为 D3,是一种机器学习技术,用于将聚合能源消耗数据分解为设备级消耗数据。) 算法的变体,使用生成模型和判别模型的组合进行训练。

        AI DDPM 算法旨在学习给定数据集的概率分布,可用于生成真实的合成数据、异常值检测和异常检测等各种任务。它使用具有不同幂的自适应高斯分布的混合来对输入数据的基础分布进行建模。

        总体而言,AI DDPM是一种功能强大的算法,可在金融、医疗保健、计算机视觉等领域广泛应用。

二、背景知识

去噪扩散概率模型(DDPM)的突破发生在大约2020年间。从那时起,我们观察到生成任务的巨大改进:GLIDE,DALL-E 2,Imagen,图像的稳定扩散,语言建模中的扩散-LM,视频序列的扩散,甚至强化学习的扩散。

扩散可能是 2022 年 GraphML 的最大趋势——尤其是当应用于药物发现、分子和构象生成以及一般的量子化学时。通常,它们与等变GNN的最新进展配对。

分子生成。通过 稳定扩散 2 生成

有机化学模型套件分子模型套件有机化学分子结构模型高中科学设备- Buy 分子模型化学,化学分子,高中科学设备Product on Alibaba.com

三、图上的扩散 

        让我们以Hoogeboom等人的等变扩散论文为例,使用尽可能少的方程来概括扩散模型的😅基础知识

        向前和向后扩散过程。正向过程 q(z|x,h) 逐渐将噪声添加到图中,直到它变成高斯噪声的阶段。逆向过程 p(x,h|z) 从高斯噪声开始,逐渐对图进行去噪,直到它成为有效图的阶段。资料来源:Hoogeboom,Satorras,Vignac和Welling。

  • 输入:具有 N 个节点和 E 边的图形 (N,E
  • 节点特征通常由两部分组成:z=[x,h],其中 x ∈ R³ 是 3D 坐标,h ∈ R^d 是原子类型等分类特征
  • (可选)边缘特征为粘结类型
  • 输出:包含节点、边和相应特征的图形 (N,E
  • 正向扩散过程 q(z_t | x,h):在每个时间步 t 处,向特征注入噪声,使得在最后步骤 T 中它们变成白噪声
  • 反向扩散过程 p(z_{t-1} | z_t):在每个时间步长 t-1 中,要求模型预测噪声并从输入中“减去”它,以便在最后一步 t=0 我们有一个新的有效生成图
  • 去噪神经网络学习预测注入的噪声
  • 已知去噪扩散等同于基于分数的匹配 [Song and Ermon (2019) 和 Song 等人 (2021)],其中神经网络学习预测分数∇_x对数p_t(x)扩散数据。基于分数的视角描述了使用随机微分方程 (SDE) 和维纳过程的正向/反向过程

埃米尔·胡格布姆、维克多·加西亚·萨托拉斯、克莱门特·维尼亚克、马克斯·威灵。用于 3D 分子生成的等变扩散。ICML 2022。GitHub

        这项工作引入了用于分子生成的等变扩散模型(EDM),该模型必须在原子坐标x上保持E(3)等方差(如旋转平移反射),并且节点特征h(例如原子类型)保持不变。重要的是,原子具有不同的特征模态:原子电荷是序数整数,原子类型是一热分类特征,原子坐标是连续特征,因此作者设计了特定于特征的噪声过程和损失函数,并缩放输入特征以实现训练稳定性。

        EDM 采用等变 E(n) GNN 作为神经网络,根据输入特征和时间步长预测噪声。在推理时,我们首先对所需数量的原子 M 进行采样,然后我们可以根据所需的属性 c 来调节 EDM,并要求 EDM 生成分子(由特征 x 和 h 定义)为 x、h ~ p(x,h | c, M)。

        在实验上,EDM在实现负对数似然、分子稳定性和唯一性方面大大优于基于流程和VAE的归一化方法。消融表明,等变GNN编码器至关重要,因为用标准MPNN替换它会导致性能显著下降。

 基于扩散的生成可视化。来源: 推特

四、图生成的扩散

克莱门特·维尼亚克、伊戈尔·克拉夫丘克、安托万·西劳丁、王博汉、沃尔坎·塞夫弗、帕斯卡·弗洛萨德。DiGress:用于图形生成的离散去噪扩散。GitHub

        Clemént Vignac,Igor Krawczuk和EPFL团队的DiGress是无条件图生成模型(尽管有可能合并基于分数的函数来调节图形级特征,如能量MAE)。DiGress 是一种离散扩散模型,也就是说,它对离散节点类型(如原子类型 C、N、O)和边缘类型(如单/双/三键)进行操作,其中向图添加噪声对应于与过渡矩阵(从一种类型到另一种类型)的乘法作为边际概率从训练集中挖掘出来。去噪神经网络是一个改进的图形转换器。DiGress 适用于许多图形族 - 平面、SBM 和分子,代码可用,并查看 LoGaG 阅读组演示中的视频!

离去扩散过程。资料来源:维尼亚克、克拉夫丘克等。

五、地理差异和扭转扩散:分子构象生成

        具有具有其原子的3D坐标的分子,构象生成是生成另一组有效的3D坐标的任务,分子可以与之存在。最近,我们已经看到了GeoDiff和扭转扩散,它们将扩散框架应用于这项任务。

徐敏凯, 于大洋, 宋洋, 施哲, 斯特凡诺·埃尔蒙, 唐健.GeoDiff:用于分子构象生成的几何扩散模型。ICLR 2022。GitHub

      GeoDiff是SE(3)等变扩散模型,用于生成给定分子的构象。扩散应用于 3D 坐标,该坐标逐渐转换为高斯噪声(正向过程)。反向过程将随机样本降噪为一组有效的原子坐标。GeoDiff在欧几里得空间中定义了一个等变扩散框架(假设可以添加哪种噪声),并应用等变GNN作为去噪模型。去噪GNN,一个图场网络,是相当标准的EGNN的扩展。 GeoDiff首次展示了扩散模型与归一化流动和基于VAE的模型💪相比要好得多

地理差异。资料来源:徐等

靖博文、加布里埃尔·科索、杰弗里·张、里贾纳·巴齐莱、汤米·贾科拉。用于分子构象生成的扭转扩散。神经IPS 2022。GitHub

        虽然GeoDiff扩散了欧几里得空间中原子的3D坐标,但扭转扩散提出了一种巧妙的方式来扰动分子可自由旋转键中的扭转角。由于这种可旋转键的数量总是比原子的数量少得多(在GEOM-DRUGS中,平均每个分子有44个原子与8个扭转角),因此生成可能会快得多。棘手的部分是扭转角不形成欧几里得空间,而是形成超环(甜甜圈🍩),因此在坐标中添加一些高斯噪声是行不通的——相反,作者设计了一个新颖的摄动核作为包裹的正态分布(来自真实空间,但由 2pi 调制)。扭转扩散将基于分数的视角应用于训练和生成,其中分数模型必须是 SE(3) 不变和符号等变的。评分模型是张量场网络的变体。

        从实验上讲,扭转扩散确实工作得更快——与GeoDiff的5步相比,它只需要20-5000步,目前是同象一代🚀的SOTA。

扭转扩散。资料来源:景科索等

六、DiffDock:分子对接的扩散

加布里埃尔·科索、汉内斯·斯塔克、靖博文、里贾纳·巴齐莱、托米·雅科拉。DiffDock:分子对接的扩散步骤、扭曲和转折。GitHub

      DiffDock是基于分数的分子对接生成模型,例如,给定配体和蛋白质,预测配体如何与靶蛋白结合。DiffDock在产物空间中的平移T(3),旋转SO(3)和扭转角SO(2)^m上运行扩散过程:(1)配体的位置(通常称为结合口袋),口袋事先是未知的,因此它是盲对接的,(2)定义配体的旋转方向,以及(3)定义构象的扭转角(参见上面的扭转扩散以供参考)。

        DiffDock 训练 2 个模型:用于预测实际坐标的评分模型和用于估计生成预测的可能性的置信度模型。这两个模型都是点云上的SE(3)等变网络,但更大的得分模型(就参数计数而言)适用于α-碳(从现在著名的ESM2蛋白LM初始化)的蛋白质残基,而置信模型使用细粒度原子表示。初始配体结构由RDKit生成。DiffDock 极大地提高了预测质量,您甚至可以在 HuggingFace 空间的在线演示中上传自己的蛋白质 (PDB) 和配体 (SMILES) 进行测试!

DiffDock直觉。资料来源:Corso, Stärk, Jing, et al.

七、DiffSBDD:用于生成新型配体的扩散

阿恩·施诺因、杜元琪、查尔斯·哈里斯、阿里安·贾马斯布、伊利亚·伊加绍夫、杜伟涛、汤姆·布伦德尔、彼得罗·廖、卡拉·戈麦斯、马克斯·韦林、迈克尔·布朗斯坦、布鲁诺·科雷亚。基于结构的药物设计与等变扩散模型。GitHub

      DiffSBDD是用于产生以蛋白质口袋为条件的新型配体的扩散模型。DiffSBDD可以通过2种方法实现:(1)当口袋固定时产生口袋条件配体;(2)近似口袋配体对联合分布的修复样生成。在这两种方法中,DiffSBDD都依赖于调谐等变量扩散模型(EDM,ICML 2022)和等变EGNN作为去噪模型。实际上,配体和蛋白质表示为具有分类特征和3D坐标的点云(蛋白质可以是α-碳残基或全原子,残基的单热编码 - ESM2将来可以在这里使用),因此在3D坐标上进行扩散以确保等方差。

DiffSBDD。资料来源:施诺因、杜等。

八、DiffLinker:用于生成分子接头的扩散

伊利亚·伊加索夫、汉内斯·斯塔克、克莱门特·维尼亚克、维克多·加西亚·萨托拉斯、帕斯卡尔·弗洛萨德、马克斯·韦林、迈克尔·布朗斯坦、布鲁诺·科雷亚。分子接头设计的等变三维条件扩散模型。GitHub

      DiffLinker是用于生成以3D片段为条件的分子接头的扩散模型。虽然以前的模型是自回归的(因此不是排列等变的),并且只能链接 2 个片段,但 DiffLinker 生成整个结构并且可以链接 2+ 个片段。在DiffLinker中,每个点云都以上下文(所有其他已知的片段和/或蛋白质口袋)为条件,上下文通常是固定的。扩散框架类似于 EDM,但现在以 3D 数据而不是标量为条件。去噪模型是相同的等变EGNN。有趣的是,DiffLinker有一个额外的模块来预测链接器的大小(分子数量),因此您不必事先指定它。

DiffLinker。资料来源:伊加绍夫等。

九、了解更多信息

  • SMCDiff,用于生成以所需基序为条件的蛋白质支架(也带有EGNN)。
  • 一般来说,在图和分子生成中,我们希望支持一些离散性,因此非常欢迎对离散扩散的任何改进,例如,Richemond,Dieleman和Doucet提出了一种新的单纯形扩散,用于Cox-Ingersoll-Ross SDE(罕见发现!
  • 在最近的DiffusER中还研究了离散扩散的文本生成。
  • 拥抱脸维护🧨扩散器库 开始关于扩散模型的公开课程 — 查看它们以获取实用的实现技巧
  • 查看 CVPR 2022 关于扩散模型的教程录音 卡斯滕·克雷斯、高锐琪和阿拉什·瓦达特

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/852223.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

检测代理IP匿名程度的实用方法

在当今数字化的世界中,使用代理IP已成为保护个人隐私和增强网络安全的常见做法。然而,不同代理IP的匿名程度各异,有些可能具有较高的匿名性,而另一些则可能暴露了用户的真实身份和位置。 因此,了解如何检测代理IP的匿…

动态内存空间管理

欢迎来到我的 世界 ^ _ ^希望作者的文章对你有所帮助,有不足的地方还请指正,大家一起学习交流 ! 文章目录 前言:动态内存是什么一、动态内存介绍:动态内存有关函数介绍1.malloc和free2.calloc函数3.realloc函数 二、一些常见的动态…

虹科案例 | 台积电为保证光罩运输质量选择MSR冲击振动记录仪!内含台积电工程师专访

晶圆运输需要注意什么? 晶圆运输是半导体制造过程中极为关键和敏感的一环。在晶圆运输过程中,需要注意以下几点: 1、静电防护 晶圆非常容易受到静电的干扰,因此在运输过程中需要遵守严格的静电防护措施。使用适当的静电防护包装…

数据库|同城双中心 DR Auto-Sync 主中心意外故障恢复

一、前言 最近,我一直在各个地方进行 TiDB 的 Poc 测试。在这些测试中,客户特别关注同城双中心或者两地三中心的架构体系,经常会找我了解 TiDB 灾备架构的实现方案和底层逻辑。基于客户对 RPO 0 的要求,我一般会向他们介绍 DR Au…

Flume原理剖析

一、介绍 Flume是一个高可用、高可靠,分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制&…

软件安全测试包含哪些内容和方法?安全测试报告的必要性

软件安全测试是一种通过模拟真实攻击的方式,对软件系统进行全面的安全性评估和测试,以发现潜在的安全漏洞和弱点,是确保软件系统安全性的重要措施。在进行软件安全测试时,我们需要了解测试的内容和方法,以及为什么进行…

《高性能MySQL》——查询性能优化(笔记)

文章目录 六、查询性能优化6.1 查询为什么会慢6.2 慢查询基础:优化数据访问6.2.1 是否向数据库请求了不需要的数据查询不需要的记录多表关联时返回全部列总是取出全部列重复查询相同的数据 6.2.2 MySQL 是否在扫描额外的记录响应时间扫描的行数与返回的行数扫描的行…

项目经理和PMO如何穿越低谷,激活自己与团队——WOOP给你答案

2023年,已经还剩下不到5个月了。因为今年整体大环境不好,很多人会因为遇到各种问题,让自己掉入低谷,也有可能让自己带的团队毫无生气。我期待这篇文章能够给你带来向上的力量,在困境中看到希望与可能性。 相信有很多人…

如何在轻量级RTSP服务支持H.264扩展SEI发送接收自定义数据?

为什么开发轻量级RTSP服务? 开发轻量级RTSP服务的目的是为了解决在某些场景下用户或开发者需要单独部署RTSP或RTMP服务的问题。这种服务的优势主要有以下几点: 便利性:通过轻量级RTSP服务,用户无需配置单独的服务器,…

无涯教程-Perl - formline函数

描述 格式功能和相关的运算符使用此功能。它根据PICTURE的内容将LIST格式化为输出累加器变量$^ A。写入完成后,该值将写出到文件句柄中。 语法 以下是此函数的简单语法- formline PICTURE, LIST返回值 该函数总是返回1。 Perl 中的 formline函数 - 无涯教程网无涯教程网提…

中小企业在数字化转型上所面对的问题都有哪些?_光点科技

随着科技的飞速发展,数字化转型已经成为企业持续发展的必由之路。尤其是中小企业,数字化转型不仅可以提高效率,降低成本,还可以拓展市场,增强竞争力。然而,数字化转型并非一帆风顺,中小企业在这…

arcgis更改图层字段名脚本

话不多说,上脚本源码,复制黏贴即可 #-*- coding:utf-8 -*- __author__ lumen import arcpy #输入图层 InputFeature arcpy.GetParameterAsText(0) #原始字段 oldField arcpy.GetParameterAsText(1) # 获取原始字段类型 oldFieldType desc arcpy.…

电机基础知识::(1、电磁力;2力与运动)

永磁同步电机基础知识(一)_哔哩哔哩_bilibili

led台灯哪些牌子性价比高?推荐几款性价比高的护眼台灯

作为学龄期儿童的家长,最担心的就是孩子长时间学习影响视力健康。无论是上网课、写作业、玩桌游还是陪伴孩子读绘本,都需要一个足够明亮的照明环境,因此选购一款为孩子视力发展保驾护航的台灯非常重要。为大家推荐几款性价比高的护眼台灯。 …

influxDB

文章目录 版本2.0 数据结构Organization 组织Bucket 存储桶Measurementtagfieldtimestamp retention policy (RP) 保留策略Point 一条数据Series 一组数据 写入gzip压缩 查询FluxInfluxQL 官网 https://docs.influxdata.com/v1.8 中文翻译文档 https://influxdb-v1-docs-cn.cno…

iPhone手机怎么恢复出厂设置(详解)

如果您的iPhone遇到了手机卡顿、软件崩溃、内存不足或者忘记手机解锁密码等问题,恢复出厂设置似乎是万能的解决方法。 什么是恢复出厂设置?简单来说,就是让手机重新变成一张白纸,将手机所有数据都进行格式化,只保留原…

TIA博途选型工具Selection Tool的基本使用方法介绍

TIA博途选型工具Selection Tool的基本使用方法介绍 如下图所示,下载选型工具后,解压缩,可以看到SelectionTool.exe执行程序, 感兴趣的可从以下链接获取该软件: TIA博途选型工具TIA Selection Tool-2023最新 无需安装,直接双击打开该软件, 如下图所示,进入软件后(默认…

用栈判断是否匹配

1 问题 写代码的时候用到的括号都是成双成对的出现,并且大小也相同。在集成编辑环境中,IDE就会为我们自己动检查括号是否匹配。那么为了避免在报错,如何判断是否有无括号不匹配? 2 方法 利用栈来实现这种功能。当遇见一个左括号&a…

为什么Mendix的OQL比SQL更方便,以及如何实现类似MySQL的workbench?

前言 在当今信息时代,数据的价值变得越来越重要。数据处理是任何软件系统都非常关注的核心功能。无论是电子商务网站、移动应用程序还是企业管理系统,这些系统都需要处理和管理大量的数据。例如,当用户在电子商务网站上搜索特定商品时&#…

【技术】Web实时消息推送方式整理

【技术】Web实时消息推送方式整理 SSE 单向 服务器 --> 客户端 text/event-stream类型的数据流信息 实现 客户端 <script>let source null;let userId 7777if (window.EventSource) {// 建立连接source new EventSource(http://localhost:7777/sse/sub/userId);…