扩散模型的源码学习diffusion_model

扩散模型的源码学习diffusion_model

news2026/2/21 12:58:59

1.diffusion_model有几个主要的部分，

（1）Unet，主干网络。

（2）GaussianDiffusion，也就是主要的训练策略。

2.

生成一个测试用的tensor来进行实验。

3.进入到高斯模型的内部，发现他的forward并不是特别复杂，

他会先生成一个随机数t，然后再对img做一定的处理，然后再利用p_loss做一个loss。

可以看到，难点应该就是p_loss和对图片的这个处理上。

4.可以看到，生成了一个t，是随机的0，1不知道在干啥。

5.然后把img输入到了这个normalize这里面，注意这个img是（8，3，128，128）的尺寸的。

他这个normalize_neg_one_to_one,只有一行，就返回了img，我们接下来试一下，这个操作会产生什么样的变化，因为他变化一下就输入到了p_losses里面，可以看到在p_losses之前的操作都是特别简单的，这说明整个需要操作的大部分应该都在p_losses里面。

乘2，减1，就是做了简单的变化。

6.然后就开始输入进p_losses了，这个输入的img是（8，3，128，128）维度的。

然后t是一个8的tensor，有8个随机的0，1数。

7.进入到p_losses里面，

发现，这个loss所需要的东西，一个是x_start,一个是t，也就是随机生成的一个tensor，和一个随机数的列表。

注意这个x_start是（8，3，128，128）这个维度的。

t是8个随机数tensor。

8.然后会利用default这个生成噪声。

也就是说这个default所使用的是提供的这个rand。

9.利用这个生成噪声noise，这个维度是（8，3，128，128）的。

10.x_start也是（8，3，128，128）维度的。

11.然后到了q_sample这里，

12.看一下这个extract 是干什么的，他需要传入三个值，这些都是一些基本的属性，并没有传入x_start本身，所以，他们是和x本身的值无关的，而是一个随着时间变化的东西。

它里面的tensor是这样的。

13.

14.

进行两个extract后就到了Unet里面。

15.正常的做loss，然后到了下面这个reduce这里，看看这个reduce是干啥的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/83376.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

(六) Redis缓存读写策略

(六) Redis缓存读写策略

一引言缓存的引入后极大的提高了服务器的访问速率,但是当持久化数据发生变化时,如何更新缓存成为了研发中不可规避的问题,不同的方案决定缓存的最终的一致性,本文就redis的缓存读写策略,以及其他的缓存读写策略做简要概述二 Cache Aside Pattern（旁路缓存模式&…

阅读更多...

Vue学习：键盘事件

Vue学习：键盘事件

input表单占位符-显示输入先的提示文本-placeholder属性键盘事件keydown——按下不需要松手 keyup：按下松手根据按键编码进行判断 --输出event上有一个属性-keyCode -按键编码--回车13 <div idroot> <input type"text&quo…

阅读更多...

Docker安装和使用

Docker安装和使用

一：docker安装链接: https://pan.baidu.com/s/1A1g7rSOMoV4__Me_zJoB3Q?pwd6bqi 提取码: 6bqi 复制这段内容后打开百度网盘手机App，操作更方便哦 --来自百度网盘超级会员v4的分享。二：docker使用 1.docker和虚拟机的区别： …

阅读更多...

Word文档如何设置成不可编辑的模式？

Word文档如何设置成不可编辑的模式？

把Word文档设置成“不可编辑模式”，也就是“限制编辑”，可以防止意外更改文档内容；对于只想给他人读阅，禁止复制和更改的情况，也能起到一定的保护作用。 Word文档里自带设置限制保护的选项，在菜单中选择【…

阅读更多...

【Uni-App】uniapp使用uview实现弹出键盘输入密码/验证码功能

【Uni-App】uniapp使用uview实现弹出键盘输入密码/验证码功能

目录（一）效果图（二）使用组件说明keyboard属性：keyboard事件：（五）js代码实现（一）效果图 （二）使用组件说明组件使用的是uview组件&…

阅读更多...

MATLB|多微电网及分布式能源交易

MATLB|多微电网及分布式能源交易

目录一、概述二、数学模型三、结果可视化四、Matlab代码实现一、概述在人类、工业和电动汽车的能源需求的推动下，全球能源需求预计将在未来几年稳步增长；更准确地说，预计到 2030 年增长将达到 40%。这种需求是由人类日益依赖能源的…

阅读更多...

Linux配置网络，增添网络会话，Wget下载，yum仓库配置

Linux配置网络，增添网络会话，Wget下载，yum仓库配置

配置网络从RHEL7开始引入了一种新的“一致网络设备命名”的方式为网络接口命名，该方式可以根据固件、设备拓扑、设备类型和位置信息分配固定的名字。网络接口的名称的前两个字符为网络类型符号。如: en——表示以太网(Ethernet)、wl表示无线局域网(wlan)、ww表示无…

阅读更多...

[附源码]Python计算机毕业设计SSM基于的高校在线办公系统（程序+LW)

[附源码]Python计算机毕业设计SSM基于的高校在线办公系统（程序+LW)

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： SSM mybatis Maven Vue 等等组成，B/S模式 M…

阅读更多...

【玩转ChatGPT |OpenAI超级对话模型】手把手带你玩转ChatGPT

【玩转ChatGPT |OpenAI超级对话模型】手把手带你玩转ChatGPT

个人名片： 🐼作者简介：一名大二在校生，喜欢编程🎋 🐻‍❄️个人主页🥇：小新爱学习. 🐼个人WeChat：hmmwx53 🕊️系列专栏：&#x1f5bc…

阅读更多...

【深度学习】PyTorch深度学习实践 - Lecture_10_Basic_CNN

【深度学习】PyTorch深度学习实践 - Lecture_10_Basic_CNN

文章目录一、CNN基础流程图二、CNN的两个阶段三、卷积的基本知识3.1 单信道的卷积3.2 三信道的卷积3.3 N信道卷积3.4 输入N信道-输出M信道卷积3.5 卷积层的常见参数3.5.1 Padding3.5.2 Stride3.5.3 下采样（MaxPooling）四、实现一个简单的CNN4.1 网络结构…

阅读更多...

【案例教程】气象数值预报WRF-DA资料同化系统理论、运行与变分、混合同化新方法技术

【案例教程】气象数值预报WRF-DA资料同化系统理论、运行与变分、混合同化新方法技术

【视频教程】WRF DA资料同化系统理论、运行与与变分、混合同化新方法技术应用https://mp.weixin.qq.com/s?__bizMzAxNzcxMzc5MQ&mid2247518760&idx1&snddbc45296acc595402434b88bc179a27&chksm9be39538ac941c2eabab2492e997827d0e1269de3b229fadee72f1223bbcd…

阅读更多...

机器学习实战教程（三）：决策树实战篇

机器学习实战教程（三）：决策树实战篇

一、前言上篇文章机器学习实战教程（二）：决策树基础篇之让我们从相亲说起机器学习实战教程（二）：决策树基础篇_M_Q_T的博客-CSDN博客机器学习实战教程（二）：决策树基础篇之…

阅读更多...

web前端期末大作业 html+css+javascript汽车销售网站学生网页设计实例企业网站制作

web前端期末大作业 html+css+javascript汽车销售网站学生网页设计实例企业网站制作

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业： 【📚毕设项目精品实战案例 (10…

阅读更多...

JQuery高级（回调函数 clearInterval 插件）

JQuery高级（回调函数 clearInterval 插件）

回调函数： 定义：回调函数被认为是一种高级函数，一种被作为参数传递给另一个函数的高级函数。回调函数的本质是一种模式(一种解决常见问题的模式)，因此回调函数也被称为回调模式。简而言之：一个函数在另一个函数中…

阅读更多...

Vue3+Vite项目按需自动导入配置及常见问题修复

Vue3+Vite项目按需自动导入配置及常见问题修复

文章目录一、Vue API自动导入1.1 配置unplugin-auto-import1.2 可能遇到ts,eslint不识别而导入报错的问题1.3 配置src/component目录下的组件自动引入二、按需引入UI组件库（antd,element-plus）2.1、按需引入element-plus2.2 ant-design-vue 按需引入2.3 …

阅读更多...

Qt多线程调用gdal库接口

Qt多线程调用gdal库接口

作者：朱金灿来源：clever101的专栏为什么大多数人学不会人工智能编程？>>> 效果图和程序说明效果图如下：这个程序是Qt的GUI程序，用于给指定的图像文件创建金字塔。为什么要使用多线程使用多线程的好处主要有两点： 1.多线程在很多时候显得更人性化些。比…

阅读更多...

计算机研究生就业方向之去大厂做售前

计算机研究生就业方向之去大厂做售前

我一直跟学生们说你考计算机的研究生之前一定要想好你想干什么，如果你只是转码，那么你不一定要考研，至少以下几个职位研究生是没有啥优势的： 1，软件测试工程师（培训一下就行） 2，前…

阅读更多...

【Docker】如何用Docker安装Tomcat

【Docker】如何用Docker安装Tomcat

专栏精选文章《Docker是什么？Docker从介绍到Linux安装图文详细教程》《30条Docker常用命令图文举例总结》《Docker如何构建自己的镜像？从镜像构建到推送远程镜像仓库图文教程》《Docker多个容器和宿主机之间如何进行数据同步和数据共享？容器…

阅读更多...

关于linux下的xinetd服务

关于linux下的xinetd服务

我们在网络通信时候用到socket套接字，有的时候我们更希望Linux能使用http协议等于前端有一定的交互，那么xinetd服务无疑是Linux下一种很好的方法。什么是xinetd呢？xinetd是新一代的网络守护进程服务程序，又叫超级Internet服务器,…

阅读更多...

[附源码]Python计算机毕业设计SSM基于的婚恋系统（程序+LW)

[附源码]Python计算机毕业设计SSM基于的婚恋系统（程序+LW)

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： SSM mybatis Maven Vue 等等组成，B/S模式 M…

阅读更多...

推荐文章

最新文章