Variational Auto-Encoder(VAE)缺少数学推导未完结版

news2024/11/25 14:58:51

VAE是Diffusion的基础,在其中将输入的图片数据编码到潜在空间后再解码出来。

略显复杂,博主结合李宏毅视频、网上一些讲解以及自己的理解将其总结如下:

一、什么是VAE

VAE(变量自编码器)最早在以上两篇文章被提出。

VAE与自编码器类似

包括从原始的数据将其编码到潜在空间(隐藏表示空间,维度更低)中的变量z、以及将变量z还原到原来的空间x的解码器,不同的是,它是对分布的均值和标准差进行估计。

二、为什么要VAE

如果每个图像是空间中的一个向量,那么如果能够估计出这个向量的分布,那么就可以根据这个分布来采样出你想要的图片。

使用模型去预测Z的均值和方差

由于模型自己去学习均值和方差,为了防止模型将方差降为0,必须对方差做一个限制,这里的方差是:

所以,当等于0时,方差是1,此时loss最低,所以就不会将方差学习到1

上述推导中,在对Z的积分时,X是常数,所以里面的积分是1,logP(x)只是个系数

而KL散度是衡量两个部分的相似程度,是一个大于等于0的值(当二者分布完全一样时,log1=0, KL=0)

这个lower bound又可以进行拆解:

拆解成一个负的KL散度,这个q(z|x)是从一个网络进行估计出来的,这个网络从X估计z|x的分布的均值和方差

首先要让根据x采样产生的z的分布接近正态分布,然后再让z重新恢复的x越接近x越好(自编码器在做的事),最终这两项就是VAE的损失函数

VAE存在的问题,它只是对数据分布的模仿(线性重组),没法产生新的数据:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2212116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

yakit使用教程(四,信息收集)

本文仅作为学习参考使用,本文作者对任何使用本文进行渗透攻击破坏不负任何责任。 前言:yakit下载安装教程。 一,基础爬虫。 在新建项目或新建临时项目后,点击安全工具,点击基础爬虫。 此工具并不是为了爬取网站上的一…

【零散技术】MAC 安装多版本node

时间是我们最宝贵的财富,珍惜手上的每个时分 不同前端项目运行的node版本不一致,会导致无法运行,就像Odoo也需要依据版本使用对应的python环境。python 可以用 conda随时切换版本,那么Node可以吗?答案是肯定的。 1、安装 n&#x…

k8s-资源管理、实战入门

资源管理 一、资源管理介绍 在kubernetes中,所有的内容都抽象为资源,用户需要通过操作资源来管理kubernetes。 (1)kubernetes的本质上就是一个集群系统,用户可以在集群中部署各种服务,所谓的部署服务&…

SpringBoot高校学科竞赛平台:性能优化与实践

3系统分析 3.1可行性分析 通过对本高校学科竞赛平台实行的目的初步调查和分析,提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本高校学科竞赛平台采用SSM框架,JAVA作为开发语…

详细分析Redisson分布式锁中的renewExpiration()方法

目录 一、Redisson分布式锁的续期 整体分析 具体步骤和逻辑分析 为什么需要递归调用? 定时任务的生命周期? 一、Redisson分布式锁的续期 Redisson是一个基于Redis的Java分布式锁实现。它允许多个进程或线程之间安全地共享资源。为了实现这一点&…

C++ 高级特性:函数重载、内联函数、引用、auto关键字、范围for循环和nullptr空指针

目录: 📑前言📖函数重载📖内联函数📖引用☁️引用的概念☁️引用的特性⭐引用在定义时必须初始化⭐一个变量可以有多个引用(类比于一个人可以有多个外号)⭐ 引用一旦引用一个实体,再不能引用其他实体 ☁️常…

关于WPF(Windows Presentation Foundation)中Grid控件

本文将从Grid控件的基础概念开始,逐步深入探讨其特性、用法、实例代码,以及最佳实践。 1. WPF和布局简介 WPF是一种用于构建Windows桌面应用程序的UI框架,它通过XAML(Extensible Application Markup Language)使开…

java计算机毕设课设—扫雷游戏(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式再最下方(本次10月份活动福利,免费提供下载,自行到对应的方式1下载,csdn的0积分下载) java计算机毕设课设—扫雷游戏(附源码、文章、相关截图、部署视频) 基于Java的扫雷游戏…

电子电气架构 --- 智能网联汽车未来是什么样子?

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证明自己,无利益不试图说服别人,是精神上的节…

C3D网络介绍及代码撰写详解(总结3)

可以从本人以前的文章中可以看出作者以前从事的是嵌入式控制方面相关的工作,是一个机器视觉小白,之所以开始入门机器视觉的学习主要是一个idea,想把机器视觉与控制相融合未来做一点小东西。废话不多说开始正题。(如有侵权立即删稿…

基于微信小程序的在线点歌系统(论文+源码)-kaic

摘 要 随着社会与互联网的发展,人们已经不在停留在温饱的层面上,而是开始了享受生活,而最能突出网络飞速发展的当属娱乐,从最初的网吧上网到现在的我们可以随时随地上网,观看自己喜欢的各式各样的电影电视剧和短视频&a…

数据结构与算法 - 顺序表与链表的区别

文章目录 前言 一、顺序表与链表的定义 1、顺序表 2、链表 二、区别 1、顺序表(动态顺序表): 2、链表(带头双向循环链表): 3、将上述文字用图表形式展示: 4、CPU高速缓存命中率 总结 前言 路漫漫其修远兮,吾将上下而求索…

Nginx实战指南:基础知识、配置详解及最佳实践全攻略

背景 在Java系统实现过程中,我们不可避免地会借助大量开源功能组件。然而,这些组件往往功能丰富且体系庞大,官方文档常常详尽至数百页。而在实际项目中,我们可能仅需使用其中的一小部分功能,这就造成了一个挑战&#…

数组中两个字符串的最小距离(图+文字详解)

链接:数组中两个字符串的最小距离__牛客网 题目:给定一个字符串数组strs,再给定两个字符串str1和str2,返回在strs中str1和str2的最小距离,如果str1或str2为null,或不在strs中,返回-1。 思路: 给定两个下标…

Pycharm 随时调整字体大小(放大或缩小)

实现按住 ctrl 滑动鼠标滚轮实现代码窗口字体大小调整: File 一>Settings 一>Editor一>General里 的Mouse Control把Change font size with CtrlMouse Wheel打上对勾,点击OK即可 使用快捷键 放大字体: Windows/Linux: Ctrl macOS…

IP报文格式、IPv6概述

IPv4报文格式 IPv4报文首部长度至少为20字节(没有可选字段和填充的情况下),下面来逐一介绍首部各个字段的含义 Version版本:表示采用哪一种具体的IP协议,对于IPv4来说该字段就填充4以表示,如果是IPv6就填充6IHL首部长度&#xff…

Android内容观察者(案例:监听数据库+代码+效果图)

目录 1.内容观察者概念 1. 什么是 ContentObserver? 2. 主要方法 3. 使用场景 4. 工作原理 5. 注册和注销 6. 实现步骤 7. 注意事项 2.创建内容观察者 3.注册内容观察者 4.取消注册内容观察者 5.完整的activity代码 6.案例:检测数据库 1)创建一个Android…

HTML(五)列表详解

在HTML中&#xff0c;列表可以分为两种&#xff0c;一种为有序列表。另一种为无序列表 今天就来详细讲解一下这两种列表如何实现&#xff0c;效果如何 1.有序列表 有序列表的标准格式如下&#xff1a; <ol><li>列表项一</li><li>列表项二</li>…

Linux下CMake入门

CMake的基础知识 什么是 CMake CMake 是一个跨平台的构建工具&#xff0c;主要用于管理构建过程。CMake 不直接构建项目&#xff0c;而是生成特定平台上的构建系统&#xff08;如 Unix 下的 Makefile&#xff0c;Windows 下的 Visual Studio 工程&#xff09;&#xff0c;然后…

《OpenCV计算机视觉》—— 人脸检测

文章目录 一、人脸检测流程介绍二、用于人脸检测的关键方法1.加载分类器&#xff08;cv2.CascadeClassifier()&#xff09;2.检测图像中的人脸&#xff08;cv2.CascadeClassifier.detectMultiscale()&#xff09; 三、代码实现 一、人脸检测流程介绍 下面是一张含有多个人脸的…