[DDPM] Denoising Diffusion Probabilistic Models

news2025/1/11 3:53:07

        直接看paper云里雾里,一些推荐的讲解:

        The Annotated Diffusion Model

        生成扩散模型漫谈(一):DDPM = 拆楼 + 建楼

        生成扩散模型漫谈(二):DDPM = 自回归式VAE

        生成扩散模型漫谈(三):DDPM = 贝叶斯 + 去噪

1、目的

        已知确定的forward / diffusion过程:训练图像x_{0},逐步加噪声,最终得到高斯噪声图像x_{t}

        求解reverse过程:采样高斯噪声图像x_{t},逐步去噪,最终得到生成的图像

        其中,x_{0} ~ x_{t}的尺寸均一致

                     

        为什么不直接一步到位?类比建楼和拆楼过程。我们想要把建筑原材料建设成高楼大厦是很难的,那么不妨考虑将高楼大厦一步步拆为砖瓦水泥,然后逆向学习拆楼的一小步过程,从而一步步建楼。当然DDPM是建立在严格数学推导的基础之上的。

                                                        

2、建模

        1)分布

                            

                                    

         2)forward

                

                重参数化后,有x_{t} = \sqrt{1 - \beta_{t}}x_{t-1} + \sqrt{\beta_{t}}\epsilon_{t}

                该式的两个重要特性:马尔可夫过程,且系数平方和为1。基于这两点,经推导可得重要结论:

                

                 其中,

                 重参数化后,有:

                                  ......................................................(1)      

       注:要保证经过T步后,\bar{\alpha_{t}}\approx 0,此时x_{T}\approx \epsilon

        3)reverse

                

                 经推导可得重要性质:

                 ............................................(2)

        本文固定了forward和reverse过程中的方差

3、训练过程

        我们的目标是已知输入x_{t},去预测x_{t-1}。网络直接学习这样的映射关系比较困难,可以通过“输入x_{t} -> 预测\epsilon -> 根据公式(2)得到\mu -> 从N(\mu, \sigma)中采样出x_{t-1}”的方式来进行

        1)Training

        已知样本x_{0},随机取1~T中的一个时间t,可以根据公式(1)采样出x_{t},同时采样的\epsilon作为网络训练的标答

        

        2)Sampling

        从高斯噪声x_{T}开始逐步采样至x_{0}

              

        注:训练数据需要线性放缩到[-1, 1]

4、网络结构

        1)U-Net

        2)group normalization

        3)在16 x 16分辨率的特征图上使用self-attention

        4)不同time共享一套网络结构和网络参数。time经过Transformer sinusoidal position embedding输入网络

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/787320.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SQL-每日一题【619.只出现一次的最大数字】

题目 MyNumbers 表: 单一数字 是在 MyNumbers 表中只出现一次的数字。 请你编写一个 SQL 查询来报告最大的 单一数字 。如果不存在 单一数字 ,查询需报告 null 。 查询结果如下例所示。 示例 1: 示例 2: 解题思路 1.题目要求我…

MyBatis---多表查询,动态sql的详细介绍

目录 1.命名规则 1.resultMap(对应类属性名称与数据库字段名称) 2.多表查询(ResultMap) 1.创建articleInfo类 2.创建ArticleMapper.xml配置文件和ArticleMapper接口 ①:不建议使用 (文件之间耦合严重…

十大排序算法详解

目录 1. 冒泡排序 a. 思路 b. code 2. 插入排序 a. 思路 b. code 3. 希尔排序【插入排序plus】 a. 思路 b. code 4. 选择排序 a. 思路 b. code 5. 基数排序 a. 前置知识 b. 思路 c. code 6. 计数排序 a. 思路 b. code 7. 桶排序(计数排序plus &…

怎么在shell中查看python版本以及降低anaconda的python版本

输入命令 python --version 电脑anaconda的python版本为3.11,如何降低版本 ,输入命令 conda install python3.9 当安装完anaconda后,ubuntu系统的shell命令行最前面会出现base字样,此时要退出,就输入命令 conda deacti…

如何开启QQ邮件的SMTP服务以及如何使用Python发送邮件

如何开启QQ邮件的SMTP服务以及如何使用Python发送邮件 😇博主简介:我是一名正在攻读研究生学位的人工智能专业学生,我可以为计算机、人工智能相关本科生和研究生提供排忧解惑的服务。如果您有任何问题或困惑,欢迎随时来交流哦&…

Qt应用开发——Drag and Drop

目录 一、前言 二、相关事件和类 三、实例 拖动文件到编辑框 一、前言 在实际场景中,经常会有导入文件的需求。导入文件一般两种方式,第一种QFileDialog显示一个文件选择窗口,选择后处理和显示。第二种就是使用拖放机制实现。还有在一些制…

.faust加密勒索数据库恢复---惜分飞

有客户的win服务器被勒索病毒加密,里面运行有用友系统的Oracle数据库,加密提示为(camry2020aol.com): 加密的数据文件类似(.DBF.id[0E564ACA-3493].[camry2020aol.com].faust): 通过工具检测发现少量bl…

(2)前端控制器的扩展配置, 视图解析器类型以及MVC执行流程的概述

SpringMVC入门程序的扩展说明 注册前端控制器的细节 在web.xml文件注册SpringMVC的前端控制器DispatcherServlet时使用url-pattern标签中使用/和/*的区别 /可以匹配.html或.js或.css等方式的请求路径,但不匹配*.jsp的请求路径/*可以匹配所有请求(包括.jsp请求), 例如在过滤器…

Kotlin空安全类型之平台类型

前言 众所周知,Kotlin的空安全很方便,能避免绝大部分的空安全问题 一般类型分为: 可空类型如 String? 不可空类型 String其中可空类型的String?可以赋值null或String类型的值,在使用时必须显式的进行空处理 而不可空类型的String,只能赋值String类型,无法向其赋值null,使用时…

JAVA基础-Stream流

引言 Java 8 版本新增的Stream,配合同版本出现的Lambda ,给我们操作集合(Collection)提供了极大的 便利。Stream流是JDK8新增的成员,允许以声明性方式处理数据集合,可以把Stream流看作是遍历数据集 合的一个…

【后端面经-Java】Java基本概念

【后端面经-Java】Java基本概念) 1. 面向对象和面向过程1.1 概念1.2 优缺点对比 2. C和Java的区别2.1 "去其糟粕"——Java同学,你对C的这些东西有什么意见?2.2 改进之处————Java同学,你的这个论文,&…

伦敦金投资仓位控制的方法

留意本栏目过去的文章的朋友都会发现,其实小编认为资金管理很重要,甚至重要性超过技术分析找到入场机会。在资金管理中,关于仓位的控制是一门很大的学问,在伦敦金投资中,仓位的控制关系到我们盈亏的多少,甚…

利用百度地图做个亚洲范围地震可视化特效果

地图叠加等值面效果,绘制掩体模型 地震闪动特效 地震热力图效果

【人工智能】局部搜索算法、爬山法、模拟退火、局部剪枝、遗传算法

文章目录 局部搜索算法内存限制局部搜索算法示例:n-皇后爬山算法随机重启爬山模拟退火算法局部剪枝搜索遗传算法小结局部搜索算法 在某些规模太大的问题状态空间内,A*往往不够用 问题空间太大了无法访问 f 小于最优的所有状态通常,甚至无法储存整个边缘队列解决方案 设计选择…

vue-cli脚手架创建创建的项目打包后无法正常打开报 Failed to load resource: net::ERR_FILE_NOT_FOUND错误

亲爱的小伙伴们,你们最近是否有遇到用使用最新的脚手架打包项目后index.html文件无法正常打开,然后控制台报错的情况呢,不要担心,这个坑今天被我踩到了并且被我解决了,下边就让我来给大家分享一下经验吧! …

树莓派4B通过wiringP库实现串口通信的实验

1.实现串口通信前的准备 树莓派4b实现与其它设备之间的串口通信需要做一些配置&#xff0c;可以点进这篇文章进行查看参考文章 wiringPi库串口相关的API参考文章链接wiringPI库串口API 2.实现单个字符的发送 #include <stdio.h> #include <wiringPi.h> #includ…

MFC第二十一天 CS架构多页面开发与数据交互、CImageList图像列表介绍 、CListCtrl-SetItem设置列表项的方法

文章目录 CImageList图像列表介绍CListCtrl图标的原理CListCtrl列表图标设置CListCtrl-SetItem设置列表项的方法 CS架构多页面开发与数据交互添加用户实现向导多页数据交互pch.hCLientXq.h CAppCPage1.hCPage1.cppCPage2.hCPage2.cppCWorkerDlg .hCWorkerDlg.cpp 多页数据修改C…

javascript实现九九乘法表

乘法表是初学者学习乘法基础的一个重要工具&#xff0c;同时也是程序员实践编程技能的一个常见项目。在本文中&#xff0c;我将介绍如何使用JavaScript实现一个简单的乘法表。 首先&#xff0c;我们需要明确乘法表的基本结构。乘法表通常是一个正方形的表格&#xff0c;包含从…

Ubuntu22.04部署K8s集群

Ubuntu22.04部署K8s集群 一、基础环境准备1.1 VMware Workstation Pro 17.01.2 Ubuntu22.04 二、系统环境配置2.1 设置Master与工作节点的机器名称及配置2.2 解析主机2.3 虚拟内存swap分区关闭2.4 开启IPv4转发2.5 设置时间同步2.6 开启防火墙的端口&#xff08;可选&#xff0…

【Spring Boot Admin】使用(整合Spring Security服务,添加鉴权)

Spring Boot Admin 监控平台 背景&#xff1a;Spring Boot Admin 监控平台不添加鉴权就直接访问的话&#xff0c;是非常不安全的。所以在生产环境中使用时&#xff0c;需要添加鉴权&#xff0c;只有通过鉴权后才能监控客户端服务。本文整合Spring Security进行实现。 pom依赖 …