Paper——Diffusion Model前向过程和反向过程详解

Paper——Diffusion Model前向过程和反向过程详解

news2026/2/8 23:42:51

文章目录

- Diffusion过程解析
- - 前向过程
  - - 公式详解
    - - 每一步增加噪声的求解
      - 从起始状态到最终状态的公式
  - 反向过程
  - 损失函数
- 总结公式

Diffusion过程解析

前向和后向相互独立，前向过程使用马尔科夫链实现，反向过程采用神经网络进行预测。

前向过程

在这里插入图片描述

输入一个原始图片；
每一步添加噪声，噪声服从高斯分布（均值为0，方差为1，记作 $N (0, 1)$ ，服从正态分布）；
最终得到一个只含有噪声的图像；

公式详解

每一步增加噪声的求解

$X_t = \sqrt{a_t} X_{t-1} + \sqrt{1-a_t} \varepsilon_t$

$X_t$ 是当前时刻的图像； $X_{t-1}$ 是前一时刻的图像；
$a_t$ 是噪声权重，随着 $t$ 的增加不断变化（论文中是从0.0001到0.02）；
$\varepsilon_t$ 是指每个时刻添加的独立的高斯噪声。

从起始状态到最终状态的公式

在这里插入图片描述

反向过程

反向过程是通过参数化的U-Net+Attention神经网络实现从噪声图像到原始图像的denoise。

在这里插入图片描述

损失函数

最小化该公式：

$\left\|\bar{z}_t-z_\theta\left(\sqrt{\bar{\alpha}_t} x_0+\sqrt{1-\bar{\alpha}_t} \bar{z}_t, t\right)\right\|$

$\bar{z}_t$ 为 $t$ 时刻的噪声真值；
$z_\theta$ 为噪声预测值；
$\bar{\alpha}_t$ 为噪声参数，和 $t$ 有关；

总结公式

在这里插入图片描述

参考资料：

视频讲解：Diffusion Model：比“GAN"还要牛逼的图像生成模型！公式推导+论文精读，迪哥打你从零详解扩散模型！

代码资料

链接：https://pan.baidu.com/s/1P1WTZtr5UBLu9FVDXCk3nA?pwd=tuh4
提取码：tuh4

文字原理详解：由浅入深了解Diffusion Model
代码：https://github.com/zoubohao/DenoisingDiffusionProbabilityModel-ddpm-

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/339540.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

二叉树的四种遍历方式（二）

二叉树的四种遍历方式（二）

接上文《二叉树的四种遍历方式（一）》（https://blog.csdn.net/helloworldchina/article/details/128895188），在本文讲述一下第四种遍历方式，即按层次遍历二叉树。一讲解 1 先序遍历二叉树， 见…

阅读更多...

【Redis】Redis高可用之Redis Cluster集群模式详解（Redis专栏启动）

【Redis】Redis高可用之Redis Cluster集群模式详解（Redis专栏启动）

📫作者简介：小明java问道之路，2022年度博客之星全国TOP3，专注于后端、中间件、计算机底层、架构设计演进与稳定性建工设优化。文章内容兼具广度深度、大厂技术方案，对待技术喜欢推理加验证，就职于知名金融公…

阅读更多...

nodejs+vue地铁站自动售票系统-火车票售票系统vscode

nodejs+vue地铁站自动售票系统-火车票售票系统vscode

地铁站自动售票系统主要包括个人中心、地铁线路管理、站点管理、购票信息管理、乘坐管理、用户信息管理等多个模块。它使用的是前端技术：nodejsvueelementui 前后端通讯一般都是采取标准的JSON格式来交互。前端技术：nodejsvueelementui,视图层其实质就是…

阅读更多...

MWORKS--系统建模与仿真

MWORKS--系统建模与仿真

MWORKS--系统建模与仿真1 系统定义特征2 系统研究2.1 特点与原则2.2 方法百度百科归纳同元杠归纳3 系统建模与仿真3.1 系统、模型、仿真的关系3.2 系统建模4 建模方法4.1 方法4.2 一般流程4.3 目的5 仿真方法5.1 方法5.2 流程参考1 系统定义系统是由相互作用相互依赖的若干组…

阅读更多...

pip离线安装windows版torch

pip离线安装windows版torch

文章目录前言conda创建虚拟环境安装torchtorch官网在线安装离线手动安装测试是否安装成功后记前言学习的时候遇到几个机器学习相关的项目，由于不同的项目之间用到的依赖库不太一样，于是想利用conda为不同的项目创建不同的环境方便管理和运行&#xff0…

阅读更多...

01- 机器学习经典流程 (中国人寿保费项目) (项目一)

01- 机器学习经典流程 (中国人寿保费项目) (项目一)

删除特征: data data.drop([region, sex], axis1)特征数据调整: data.apply( ) # 体重指数，离散化转换，体重两种情况：标准、肥胖 def convert(df,bmi):df[bmi] fat if df[bmi] > bmi else standardreturn df data data.apply(convert, …

阅读更多...

Hadoop技术浅析

Hadoop技术浅析

一、什么是HadoopHadoop是一个适合大数据存储和计算的分布式框架Hadoop广义狭义之分狭义上Hadoop指Hadoop框架广义上随着大数据技术的发展，Hadoop也发展成了一个生态圈，包含：Sqoop：Sqoop是一款开源的工具，主要用于在Ha…

阅读更多...

洛谷2月普及组(月赛)

洛谷2月普及组(月赛)

🌼小宇（治愈版） - 刘大拿 - 单曲 - 网易云音乐 OI赛制且难度对标蓝桥杯省赛（😥真难，第三题做了几百年，第四题只敢骗骗分） 花了10块钱🙃 买官网的思路，结果…

阅读更多...

linux004之 vi和vim编辑器

linux004之 vi和vim编辑器

vi、vim编辑器简介： 是linux中的文本编辑器，用来在linux系统中查看或编辑文本文件的命令， 相当于windows文本编辑器。 vi和vim的区别， vim是增强版， 功能相比vi是增强了。功能都查不多，用哪个都行&#xff…

阅读更多...

数据库高并发和高可用方案

数据库高并发和高可用方案

依旧主要参考沈剑大佬的多篇博文，以及数位网友的优秀分享，文末是完整参考。 1、高可用方案(HA，High Availability) 缓存是通过双写和双读主备、或者利用缓存的集群数据同步，故障自动转移来实现的数据库的读是通过读写分离(MHA&am…

阅读更多...

06-PS中的四种蒙版

06-PS中的四种蒙版

Photoshop中的蒙版就是遮罩的意思，主要作用就是将其所在的图层，把不同的明暗度转化成相应的透明度。黑色为完全透明，灰色为半透明，白色为完全不透明。添加蒙版有便于灵活修改，不影响图层原貌。PS蒙版有四类&#xff1a…

阅读更多...

【状态估计】基于二进制粒子群优化（BPSO）求解最佳 PMU优化配置研究【IEEE30、39、57、118节点】（Matlab代码实现）

【状态估计】基于二进制粒子群优化（BPSO）求解最佳 PMU优化配置研究【IEEE30、39、57、118节点】（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…

阅读更多...

Mybatis与微服务注册

Mybatis与微服务注册

目录一，Springboot整合MybatisPlus 创建商品微服务子模块二，SpringBoot整合Freeamarker 三、SpringBoot整合微服务 &gateway&nginx 整合微服务之商品服务zmall-product 创建并配置网关gateway服务安装配置SwitchHosts 安装配置Windo…

阅读更多...

【大数据hive】hive 函数使用详解

【大数据hive】hive 函数使用详解

一、前言在任何一种编程语言中，函数可以说是必不可少的，像mysql、oracle中，提供了很多内置函数，或者通过自定义函数的方式进行定制化使用，而hive作为一门数据分析软件，随着版本的不断更新迭代&#xff0c…

阅读更多...

代码随想录第58天（动态规划）：● 392.判断子序列 ● 115.不同的子序列

代码随想录第58天（动态规划）：● 392.判断子序列 ● 115.不同的子序列

一、判断子序列题目描述： 思路和想法： 这道题目还是最长公共子序列的拓展，只是这里进行删除的一定是t字符串，当不相等时，dp[i][j] dp[i][j - 1]；其余基本一致。当最长公共子序列个数等s.size()时&#x…

阅读更多...

Leetcode力扣秋招刷题路-0050

Leetcode力扣秋招刷题路-0050

从0开始的秋招刷题路，记录下所刷每道题的题解，帮助自己回顾总结 50. Pow(x, n) 实现 pow(x, n) ，即计算 x 的整数 n 次幂函数（即，xn ）。示例 1： 输入：x 2.00000, n 10 输出&am…

阅读更多...

N字形变换-力扣6-java

N字形变换-力扣6-java

一、题目描述将一个给定字符串 s 根据给定的行数 numRows ，以从上往下、从左到右进行 Z 字形排列。比如输入字符串为 "PAYPALISHIRING" 行数为 3 时，排列如下：P A H NA P L S I I GY I R之后，你的输出需要从左往右逐行读…

阅读更多...

大神之路-起始篇 | 第11章.计算机科学导论之【数据压缩】学习笔记

大神之路-起始篇 | 第11章.计算机科学导论之【数据压缩】学习笔记

欢迎关注「全栈工程师修炼指南」公众号点击 👇 下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及企业运维、网络安全、应用开发、物联网、人工智能、大数据学习知识“ 花开堪折直须折，莫待无花空折…

阅读更多...

【深度学习】卷积神经网络

【深度学习】卷积神经网络

1 卷积神经网络（CNN）可以做什么？ 检测任务分类与检索超分辨率重构：将图像训练的更清晰医学任务等无人驾驶人脸识别 2 用GPU：图像处理单元比CPU块一百倍以上 3 卷积神经网络与传统神经网络的区别传统神经网络&…

阅读更多...

从证券软件开发到大数据开发，薪资涨幅一倍多，我经历了什么？

从证券软件开发到大数据开发，薪资涨幅一倍多，我经历了什么？

点击上方 "大数据肌肉猿"关注, 星标一起成长点击下方链接，进入高质量学习交流群今日更新| 1052个转型案例分享-大数据交流群分享学习群一位同学的大数据转型经历，他17年毕业后培训了几个月去了杭州一家证券公司做外包，用的是古老的…

阅读更多...

推荐文章

最新文章