[VAE] Auto-Encoding Variational Bayes

news2025/7/13 16:41:02

直接看paper看得云里雾里，李沐视频一语道破天机（建议从30min左右开始看GAN到Diffusion的串讲）。VAE的核心思路就是下面：

做生成，其实就是从随机向量（z）到目标图像（x）的过程，那么z就是先验，x就是后验。

一些博客讲的也挺好的：

VAE的原理和代码实现_vae代码_Zero_to_zero1234的博客-CSDN博客

1、目的

perform efficient inference and learning in directed probabilistic models（有向概率模型，也就是我们的DL网络）, in the presence of continuous latent variables（连续隐变量z） with intractable prosterior distributions（输出x'）

2、贡献

重参数（reparameterization） + 极大似然法（maximum likelihood / maximum a posteriori） + 可导变分下界（differentiable variational lower bound，是下界的无偏估计），使得问题可以使用SGD求解

3、方法

1）基本假设

从先验分布 $p_{\theta ^{*}}(z)$ 中采样 $z^{(i)}$ ，从条件概率分布 $p_{\theta ^{*}}(x|z)$ 中采样 $x^{(i)}$ ，且两个分布的概率密度函数对任意 $\theta$ 和z都是可微的。

2）网络结构

encoder是 $q_{\varphi}(z|x)$ ，decoder是 $p_{\theta }(x|z)$

3）优化目标

极大似然法，使得网络参数下收集的数据集的概率最大，即最大化

而该式可以被写为

由于KL散度>=0，因此有

则就是变分下限

则我们需要做的就是对这个变分下限进行优化，从而需要求解相对于变分参数 $\phi$ 和生成参数 $\theta$ 的微分

4）算法流程

5）重参化技巧

但这样的话，先验z缺少可优化参数。因此改写为下面的形式：

其中 $\mu$ 和 $\sigma$ 可以用MLP预测

4、公式推导

可以参考：

快速推导 VAE 变分自编码器，多种写法，和重要细节 Variational Autoencoder - 知乎

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/518837.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

研报精选230512

研报精选230512

目录【行业230512山西证券】有色金属行业周报：基本金属普跌，锂价持续回弹【行业230512湘财证券】新材料行业周报：五一前后各板块震荡下行，节后稀土价格跌后企稳，锂源现止跌迹象【行业230512山西证券】基础化工2022年…

阅读更多...

obj导入unity顶点数量改变

obj导入unity顶点数量改变

obj文件，是个cube，里面有8个顶点12个面。 # 3ds Max Wavefront OBJ Exporter v0.97b - (c)2007 guruware # 创建的文件:11.04.2023 13:05:22# # object Box001 #v -15.0000 -15.0000 15.0000 v -15.0000 -15.0000 -15.0000 v 15.0000 -15.0000 -15.0…

阅读更多...

C高级-day(5)-(分支语句、循环结构、函数....)

C高级-day(5)-(分支语句、循环结构、函数....)

题目一、有m1.txt m2.txt m3.txt m4.txt，分别创建出对应的目录，m1 m2 m3 m4 并把文件移动到对应的目录下 #! /bin/bashtouch m1.txt m2.txt m3.txt m4.txt for i in seq 1 1 4 domkdir m$imv m$i.txt m$i done 题目二、使用break关键字打印九九乘法…

阅读更多...

BERT-pytorch源码分析

BERT-pytorch源码分析

学习bert可以下载一些数据集练练手，目前打算选择官网给出GLUE的数据集。 bert整体代码框架结构如下： 首先从main文件开始解读，打开__main__.py。这里面只有import导入语句和一个train函数。 train函数里面首先是对一些路径参数的填写&a…

阅读更多...

unity用ComputeShader做模型流体喷涂喷绘工具

unity用ComputeShader做模型流体喷涂喷绘工具

最近在研究喷涂喷绘项目，需要做大量纹理图形运算，因此更适合用GPU来处理，在unity中用ComputeShader完成像素运算，SurfaceShader完成纹理渲染。实现思路： 1.用射线碰撞模型，得到碰撞纹理坐标brushX和brus…

阅读更多...

PMP课堂模拟题目及解析（第8期）

PMP课堂模拟题目及解析（第8期）

71. 项目经理负责管理一个处于执行阶段的项目，并希望审查项目范围以进行成本结算，项目经理发现在工作分解结构（WBS ）中遗漏了一项可交付成果。项目经理下一步应该怎么做？ A. 询问干系人是否需要添加这些遗漏的可交付…

阅读更多...

【18】SCI易中期刊推荐——计算机科学（中科院2区）

【18】SCI易中期刊推荐——计算机科学（中科院2区）

💖💖>>>加勒比海带,QQ2479200884<<<💖💖 🍀🍀>>>【YOLO魔法搭配&论文投稿咨询】<<<🍀🍀 ✨✨>>>学习交流 | 温澜潮生 | 合作共赢 | 共同进步<<<✨✨ 📚📚>>>人工智能 | 计算机视觉…

阅读更多...

【LeetCode】209.长度最小的子数组

【LeetCode】209.长度最小的子数组

209. 长度最小的子数组思路一：暴力解法通过两个for循环，从头开始找符合条件的子序列。暴力解法无法通过本题，超出时间限制，所以仅供参考。代码如下： 暴力解法1：下面的代码是通过申请一个新的数组&#x…

阅读更多...

人脸检测和人体检测4：C++实现人脸检测和人体检测(含源码，可实时检测)

人脸检测和人体检测4：C++实现人脸检测和人体检测(含源码，可实时检测)

人脸检测和人体检测4：C实现人脸检测和人体检测(含源码，可实时检测) 目录人脸检测和人体检测4：C实现人脸检测和人体检测(含源码，可实时检测) 1. 前言 2. 人脸检测和人体检测检测模型（YOLOv5） &#xf…

阅读更多...

AI教父Geoffrey Hinton：AGI革命堪比车轮的发明

AI教父Geoffrey Hinton：AGI革命堪比车轮的发明

作者 | Yana Khare 译者 | 平川来源 | AI前线 ID | ai-front AI 教父：Geoffrey Hinton Geoffrey Hinton 通常被认为是“人工智能教父”，他在机器学习广泛流行之前就一直是这个领域的开拓者。Hinton 对人工神经网络和机器学习算法的发展做出了重大的贡…

阅读更多...

单链表OJ题：LeetCode--234.回文链表

单链表OJ题：LeetCode--234.回文链表

朋友们、伙计们，我们又见面了，今天给大家带来的是LeetCode中203题：移除链表元素数据结构 ：数据结构专栏作者 ：stackY、 LeetCode：LeetCode刷题训练营 LeetCode--234.回文链表：https:…

阅读更多...

【利用AI让知识体系化】3万多字让你我快速入门数据结构与算法

【利用AI让知识体系化】3万多字让你我快速入门数据结构与算法

文章目录第一章：介绍数据结构与算法1.1 数据结构的概念1.2 算法的概念1.3 数据结构与算法的关系1.4 为什么需要学习数据结构与算法第二章：时间与空间复杂度2.1 什么是时间复杂度2.2 时间复杂度的算法分析2.3 什么是空间复杂度2.4 空间复杂度的算法分析…

阅读更多...

Lombok工具 : 常用注解介绍 (全)

Lombok工具 : 常用注解介绍 (全)

文章目录介绍引入Maven依赖常用的注解 NoArgsConstructor/AllArgsConstructorRequiredArgsConstructorGetter/SetterToString/EqualsAndHashCodeDataBuilderAccessors 其他注解 SneakyThrowsValueCleanupNotNullSynchronizedLog、Log4j、Slf4j、Log4j2、CommonsLog、XSlf4j等…

阅读更多...

无需繁琐手工操作，如何利用Web自动化测试元素定位做到快速高效的测试？

无需繁琐手工操作，如何利用Web自动化测试元素定位做到快速高效的测试？

1、什么是Web自动化测试元素定位？ 在Web自动化测试中，元素定位是非常重要的环节。因为我们需要找到需要进行操作的页面元素，例如按钮、输入框、下拉菜单等等。元素定位可以帮助我们在自动化测试中对这些元素进行操作，如点击、输入…

阅读更多...

老域名查询工具- 在线域名批量查询工具

老域名查询工具- 在线域名批量查询工具

域名批量查询工具域名批量查询工具是一种帮助用户快速查询多个域名信息的工具，通常能够自动扫描一组域名的WHOIS信息、DNS、IP地址、服务器等各种信息，并提供快速的结果反馈。以下是域名批量查询工具主要的优点： 提高工作效率&#xff1a…

阅读更多...

培训出来包装三年经验拿21K，入职8天就被裁了....

培训出来包装三年经验拿21K，入职8天就被裁了....

最近翻了一些网站的招聘信息，把一线大厂和大型互联网公司看了个遍，发现市场还是挺火热的，虽说铜三铁四，但是软件测试岗位并没有削减多少，建议大家有空还是多关注和多投简历，不要闭门造车，错过好…

阅读更多...

腾讯云面试题-重复的字符串+设计测试用例

腾讯云面试题-重复的字符串+设计测试用例

原题出自：https://leetcode.cn/problems/repeated-substring-pattern/ 题目： 题解： 1、字符串长度为空，则返回false。 2、字符串长度为1，则为true，是由子串构成的。 3、字符串长度为2，判断首…

阅读更多...

c++模板理解（图、文、代码）

c++模板理解（图、文、代码）

嗯，又是发个重点，拿出来单独做笔记本文有参考以下博文： 1、C template \ auto_c template auto_rainbow_lucky0106的博客-CSDN博客 2、C 中的 const & （常引用）参数 - 知乎 3、C template \ auto_c template …

阅读更多...

一文读懂国内首本《牛客2023金融科技校园招聘白皮书》

一文读懂国内首本《牛客2023金融科技校园招聘白皮书》

金融科技人才作为金融数字化转型的关键支撑，但当下金融科技人才培养体系尚未形成，优秀的金融科技人才供不应求，目前存在严重的人才供给问题。据调研数据统计，96.8%的金融机构存在金融科技人才缺口，54.8%的机构认为新…

阅读更多...

PDU配电单元推荐——同为科技（TOWE）自接线工程安全机柜PDU

PDU配电单元推荐——同为科技（TOWE）自接线工程安全机柜PDU

随着信息化、数字化互联网技术在各行各业的迅速发展，符合现代化需求的机房建设尤为重要，其背后蕴藏着广阔的经济效益与市场前景。现代机房具备先进性、实用性、合理性、拓展性、精细化等特点，除了核心的计算机系统要实现安全可靠的平稳运行外…

阅读更多...

推荐文章

最新文章