【论文】Auto-Encoding Variational Bayes

news2024/11/22 16:46:46

1.预备概念

1.1 后验分布

最大后验(Maximum a Posteriori,MAP)概率估计详解
【参考文章】https://blog.csdn.net/fq_wallow/article/details/104383057

1.2 重参数 Reparameterization

目的是:
转为公式表达从而实现微分
知乎上的解读
csdn上的解读

证明了变分下界的重新参数化产生了一个下界估计量

通过使用所提出的下界估计将近似推理模型(也称为识别模型)拟合到难处理的后验数据集,对于后验推理可以特别有效

1.3 蒙特卡洛法

【参考文章】https://blog.csdn.net/uujjjj/article/details/125596713

1.4变分贝叶斯初探

【参考文章】https://www.jianshu.com/p/86c5d1e1ef93

1.5 概率论中PDF、PMF和CDF的区别与联系

【参考文章】https://blog.csdn.net/Anne033/article/details/114327608

1.6 贝叶斯

1.7 Auto-Encoding

1.8 KL散度

(1)熵
(2)交叉熵 : 用基于P的编码去编码来自Q的样本,所需要的比特个数
(3)kl

2. Auto-Encoding Variational Bayes

【参考】变分贝叶斯初探
贝叶斯公式中如下:
请添加图片描述
但是这样对先验和似然的理解不够直观,来看一道《概率论》里面的题目:

对以往数据分析表明,当机器状态良好时,产品的合格率为98%,而当机器发生故障时,产品的合格率为55%。某天早上机器开动时,其状态良好的概率为95%。试求某日早上第一件产品是合格,平时机器状态为良好的概率?(答案是97%)

公式很简单,就不给出来了。在这道题中:
(1)先验:产品的合格率为98%
(2)似然:某天早上机器开动时,其状态良好的概率为95%
(3)要求的就是后验
后验其实就是通过修正先验获得更好的结果,但是实际上似然和先验并不是明确可以知晓的,因此是通过拟合后验分布从而来得到。

2.1 变量

将变量分成两类:可观察变量和不可观察变量
在这里插入图片描述

2.2 The variational bound变分下界

Q(z)即为拟合得到的分布
在这里插入图片描述
图片来自变分贝叶斯初探

使用KL散度来度量两个分布的距离(损失函数)
KL散度:
在这里插入图片描述
在当前这个式子中
请添加图片描述
想要使拟合的分布尽可能趋近于后验分布,此时就希望后验分布和拟合分布的kl散度尽可能小,因此我们要最小化含参项
请添加图片描述

因为kl散度一定是大于等于0的,logP(X)也应该是大于0的,其实L就是logP(x)的下界,因此就单拎出来作为变分下界
论文中的公式如下(theta:隐变量的参数,φ:拟合分布的参数):
在这里插入图片描述
想要对这两个参数进行优化从而最小化L。
但是对φ优化会有问题,表现为方差过大。按我的理解是: (和下图一样)φ也是隐变量的潜在变量,z不可见的情况下,只能通过采样Z来“猜测”φ的分布,因为采样所以是不可微的
在这里插入图片描述

2.3 The SGVB estimator and AEVB algorithm

不进行采样而是替换成使用(辅助)噪声变量的可微变换,相当于将这个过程转化成为了映射过程。随机性从原先的φ转移到了随机噪声
在这里插入图片描述
从而可以使用随机梯度下降等优化方法

2.4 VAE

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/87392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

编辑部已成羊村,这几天幸亏有ChatGPT(doge)

梦晨 羿阁 发自 凹非寺量子位 | 公众号 QbitAI坏事了,AI真的来抢饭碗了。还是我的饭碗!这两天你们看的推送,有些标题是AI帮忙取的,有些文章甚至由AI完成了主要工作。我呢?我不过是打打下手,加些过渡句&…

RS485总线详解

RS485总线详解前言一、常见接口划分二、RS485概述(一)简介(二)接口/引脚图三、RS485总线详解(一)RS485总线概述(二)差分传输:(三)原理图&#xff…

基于51单片机的超声波测距系统设计

功能: 超声波测距仪,测量距离,用LCD12864显示信息。 lcd_writestr(0,0," 超声波测距仪 "); lcd_writestr(1,0,"********");…

商场中央空调工程-商场商铺中央空调安装常见问题解答

商场中央空调工程-商场商铺中央空调安装常见问题解答 为了提高装修档次,提高舒适度,为顾客营造一个相对舒适的购物环境,很多门店都会选择安装中央空调。刚接触门店中央空调安装的客户会有很多疑问。例如,商店安装的中央空调和家用…

Android消息机制与源码剖析(Looper,Message,MessageQueue以及Handler)

Android消息机制 文章目录Android消息机制消息传递与处理的流程(配图示)1.【入口】 在 ActivityThread.class 的 main() 方法,为主线程创建 Looper,并开启 loop() 循环2.【创建Looper】通过 Looper.prepareMainLooper() 创建主线程…

MySQL如何快速恢复单表(物理方式)

GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。作者:xryz文章来源:社区投稿 使用方法 1、首先创建一个测试表test1,并插入几条数据&#x…

DataParallel里为什么会显存不均匀以及如何解决

作者:台运鹏 (正在寻找internship...)主页:https://yunpengtai.top鉴于网上此类教程有不少模糊不清,对原理不得其法,代码也难跑通,故而花了几天细究了一下相关原理和实现,欢迎批评指正!关于此部…

商品上下游第六讲-交易中心-商品秒杀

交易中心-商品秒杀设计 文章目录 交易中心-商品秒杀设计1、项目背景2、主要技术3、项目职责4、项目实现4.1、需求分析4.2、核心流程4.3、关键链路技术方案4.4、库存处理方式1、库存超卖问题订单层面的控制4.5、限流,熔断,降级4.6、超职购小程序—接口梳理4.7、缓存的设计4.8、…

mybatis入门(一)

什么是 MyBatis ? MyBatis 是一款优秀的持久层框架,它支持定制化 SQL、存储过程以及高级映射。MyBatis 避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集。MyBatis 可以使用简单的 XML 或注解来配置和映射原生信息,将接口和 Java 的…

如何使用匈牙利算法解决多维度的约束条件问题

🍿*★,*:.☆欢迎您/$:*.★* 🍿 正文 假设 一个项目 有三个 维度的参数 A B C 都要 组合后最小 分别求解 a b c 三个维度的最优组合 如果三个组合方案刚好 重叠 那么说明有一个使得三个方案最优的 解 如果没有 那么若选择某个方案 其他维度的参数 的值 是…

直播倒计时 2 天 | SOFAChannel#31 RPC 框架设计的考和量

SOFARPC 是蚂蚁集团开源的一款基于 Java 实现的 RPC 服务框架,为应用之间提供远程服务调用能力,具有高可伸缩性,高容错性,目前蚂蚁集团所有的业务的相互间的 RPC 调用都是采用 SOFARPC。SOFARPC 为用户提供了负载均衡,…

Android -- 每日一问:回调函数和观察者模式的区别?

知识点 观察者模式 网上很容易查到观察者模式的定义: 观察者模式定义了对象间的一种一对多依赖关系,使得每当一个对象改变状态,则所有依赖于它的对象都会得到通知并被自动更新。 Android中大量的使用了观察者模式。你可能已经用过ListView…

基于51单片机的舞蹈机器人步进机仿真设计

程序运行图: 仿真原理图: 部分程序: #include "reg51.h" #include "intrins.H" //8步式步进电机脉冲序列 //unsigned char steps[8] {0x77,0x33,0xbb,0x99,0xdd,0xcc,0xee,0x66}; unsigned char steps[8] {0x2,0x…

Vue2快速入门

Vue 介绍 Vue 是一套构建用户界面的渐进式前端框架只关注视图层,并且非常容易学习,还可以很方便的与其它库或已有项目整合通过尽可能简单的API来实现响应数据的绑定和组合的视图组件特点易用:在有HTML CSS JavaScript的基础上,快速…

拓扑排序(数据结构之图的应用)

我们先搞清楚一个概念: 什么是出度与入度? 在有向图中,箭头是具有方向的,从一个顶点指向另一个顶点,这样一来,每个顶点被指向的箭头个数,就是它的入度。从这个顶点指出去的箭头个数&#xff0c…

不锈钢风淋室的使用需要注意哪些事项

风淋室的使用需要注意哪些事项 一、风淋室的操作说明: 1) 接通380V,50HZ电源(L1、L2、L3-火线,N-零线,E-接地线),打开工作、照明开关,确认风机与照明工作正常,此时,风/货淋室处于初…

原创 | Attention is all you need 论文解析(附代码)

作者:杨金珊审校:陈之炎本文约4300字,建议阅读8分钟“Attention is all you need”一文在注意力机制的使用方面取得了很大的进步,对Transformer模型做出了重大改进。目前NLP任务中的最著名模型(例如GPT-2或BERT&#x…

【数集项目之 MCDF】(四) 整形器 formatter

根据上一章的arbiter结构图,结合设计文档中MCDF的整体结构图,可以发现formatter整形器模块是arbiter的上级,负责最终的数据输出,与外界数据接收端相连。 第一节 fromatter文档理解 设计文档formatter的部分时序介绍如下 如图所示…

钡铼技术S274数据遥测终端机

钡铼技术S274数据遥测终端机功能特点: 内置 2 路 DC 直流电源输出,无需单独额外增加变送器的电源适配器,节省布线成本;  采用完备的防掉线机制,保证数据终端永远在线,掉线重发数据以及掉线短信通知用户…

第38篇 网络(八)TCP(二)

导语 在上一节里我们使用TCP服务器发送一个字符串,然后在TCP客户端进行接收。在这一节将重新写一个客户端程序和一个服务器程序,这次实现客户端进行文件的发送,服务器进行文件的接收。有了上一节的基础,这一节的内容就很好理解了…