变分边界详解

变分边界详解

news2025/2/22 17:18:35

起因

当时看VAE论文时有这么一段，但是看完直接一头雾水，这都那跟哪，第一个公式咋做的变换就变出那么一堆。网上搜了很多博客都语焉不详，只好自己来写一篇，希望能解答后来人的疑惑。
在这里插入图片描述

公式1

参考文章：证据下界（ELBO）、EM算法、变分推断、变分自编码器（VAE）和混合高斯模型（GMM）
在这里插入图片描述
解释一下，我们之前都是用MLE计算损失， $logp(x|\theta)$ 和 $logp_{\theta}(x)$ 是一样的，数分和统计学写法习惯不同。第一种理解同上，可以结合VAE模型理解他的解释，这个解释比较抽象。
第二种理解是以信息论的角度，信息熵= $E[-logp_{\theta}(x)]$ 。信息熵越小，说明系统越稳定，不确定程度越低。
$L[\theta]=argmin_\theta E[-logp_{\theta}(x)]=argmax_\theta E[logp_{\theta}(x)]$
推导公式1：(引入一个隐变量z，z可以想象成VAE编码器计算出来的均值和方差的随机变量，对应分布q(z))
$logp_\theta(x) = logp_\theta(x,z) - logp_\theta(z|x)= log\frac{p_\theta(x,z)}{q(z)} - log\frac{p_\theta(z|x)}{q(z)}$
方程两边同时求期望：
具体推到过程看大佬的，白板机器学习
在这里插入图片描述

公式2

证明如下：
DK >= 0，所以可证公式2。
DK >= 0证明结果如下，写的不清楚请参考其他博客，证明很多，实在懒得敲了见谅。
在这里插入图片描述

公式3

计算结果如下，写的不清楚请参考其他博客，证明很多，实在懒得敲了见谅。
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2298172.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Next.js 15【实用教程】2025最新版

Next.js 15【实用教程】2025最新版

官网 https://nextjs.org/docs/app/getting-started Next.js 简介 Next.js 由 Vercel 开发和维护，旨在解决单页应用（SPA）和多页应用（MPA）在性能和 SEO 上的不足。核心特性服务端渲染（SSR）--…

阅读更多...

2025-02-13 学习记录--C/C++-PTA 7-17 爬动的蠕虫

2025-02-13 学习记录--C/C++-PTA 7-17 爬动的蠕虫

一、题目描述 ⭐️ 二、代码（C语言）⭐️ #include <stdio.h>int main() {int N, U, D; // N: 井的总高度，U: 每分钟向上爬的高度，D: 每分钟滑下的高度int height 0; // 蠕虫当前的高度int minute 0; // 蠕虫爬行的时间sc…

阅读更多...

Elasticsearch+Logstash+Kibana可视化集群部署

Elasticsearch+Logstash+Kibana可视化集群部署

文章目录 1.组件介绍简述2.集群规划3.Es组件部署4.Logstash组件部署5.Kibana组件部署6.Kibana的基础使用 1.组件介绍简述 Elasticsearch：开源实时分布式搜索和分析引擎，支持大规模数据存储和高吞吐量，提供丰富的搜索功能和可扩展性。 Logsta…

阅读更多...

DeepSeek+Excel 效率翻倍

DeepSeek+Excel 效率翻倍

2025年初，DeepSeek以惊人的效率突破技术壁垒，用极低的成本实现了与行业顶尖AI相媲美的性能，瞬间成为全球科技领域的热门话题。那么AI工具的普及将如何改变我们的工作方式？Excel会被取代吗？ 今天，珠珠带你…

阅读更多...

将Sqlite3数据库挂在内存上处理

将Sqlite3数据库挂在内存上处理

创作灵感：最近把小学生的口算题从2位数改到3位数，100以内四则运算练习（千纬数学）再次更新，选取难题-CSDN博客要不断刷题目，以前100以内的加减乘除也是这样刷出来的，代码如下： impor…

阅读更多...

electron.vite 项目创建以及better-sqlite3数据库使用

electron.vite 项目创建以及better-sqlite3数据库使用

1.安装electron.vite npm create quick-start/electronlatest中文官网：https://cn.electron-vite.org/ 2. 安装项目依赖 npm i3.修改 electron-builder 配置文件 appId: com.electron.app productName: text33 directories:buildResources: build files:- !**/.v…

阅读更多...

C++，STL容器适配器，stack：栈深入解析

C++，STL容器适配器，stack：栈深入解析

文章目录一、容器概览与核心特性核心特性速览二、底层实现原理1. 容器适配器设计2. 默认容器对比三、核心操作详解1. 容器初始化2. 元素操作接口3. 自定义栈实现四、实战应用场景1. 括号匹配校验2. 浏览器历史记录管理五、性能优化策略1. 底层容器选择基准2. 内存预分配技巧六…

阅读更多...

Vue笔记（十）

Vue笔记（十）

一、AI的基本认知二、ChatGPT的基本使用三、AI插件--Copilot入门 1.Copilot是由OpenAI和GitHub合作开发的AI编程辅助插件，基于大量代码训练，能根据上下文自动生成代码建议。 2.安装与配置：在常用代码编辑器（如Visual Studio Cod…

阅读更多...

Ubuntu下载安装Docker-Desktop

Ubuntu下载安装Docker-Desktop

下载 Ubuntu | Docker Docs 预备工作 Ubuntu增加docker apt库-CSDN博客安装 sudo apt-get updatesudo apt install gnome-terminal# sudo apt install -y docker-composesudo apt-get install ./docker-desktop-amd64.deb 测试 sudo docker run hello-worldHello from D…

阅读更多...

DeepSeek 突然来袭，AI 大模型变革的危机与转机藏在哪？

DeepSeek 突然来袭，AI 大模型变革的危机与转机藏在哪？

随着人工智能技术的飞速发展，大模型领域不断涌现出具有创新性的成果。DeepSeek 的横空出世，为 AI 大模型领域带来了新的变革浪潮。本文将深入探讨 DeepSeek 出现后 AI 大模型面临的危机与转机。冲冲冲！！！ 目录一、…

阅读更多...

C#运动控制——轴IO映射

C#运动控制——轴IO映射

1、IO映射的作用该功能允许用户对专用 IO 信号的硬件输入接口进行任意配置，比如轴的急停信号，通过映射以后，可以将所有轴的急停信号映射到某一个IO输入口上，这样，我们只要让一个IO信号有效就可以触发所有轴的急停。进…

阅读更多...

ArrayList、LinkedList、HashMap、HashTable、HashSet、TreeSet

ArrayList、LinkedList、HashMap、HashTable、HashSet、TreeSet

集合族谱在这些集合中，仅有vector和hashtable是线程安全的，其内部方法基本都有synchronized修饰。 ArrayList 底层采用Object数组实现，实现了RandomAccess接口因此支持随机访问。插入删除操作效率慢。 ArrayList需要一份连续的内存空间。 A…

阅读更多...

DeepSeek 指导手册（入门到精通）

DeepSeek 指导手册（入门到精通）

第⼀章：准备篇（三分钟上手）1.1 三分钟创建你的 AI 伙伴1.2 认识你的 AI 控制台第二章：基础对话篇（像交朋友⼀样学交流）2.1 有效提问的五个黄金法则2.2 新手必学魔法指令第三章：效率飞跃篇&…

阅读更多...

2024 CyberHost 语音+图像-视频

2024 CyberHost 语音+图像-视频

项目：CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention 音频驱动的身体动画面临两个主要挑战：（1）关键人体部位，如面部和手部，在视频帧中所占比例较小&#x…

阅读更多...

Rasa学习笔记

Rasa学习笔记

一、CALM 三个关键要素： 业务逻辑：Flow，描述了AI助手可以处理的业务流程对话理解：旨在解释最终用户与助手沟通的内容。此过程涉及生成反映用户意图的命令，与业务逻辑和正在进行的对话的上下文保持一致。自动对话修复…

阅读更多...

Android 系统面试问题

Android 系统面试问题

一.android gki和非gki的区别 Android GKI（Generic Kernel Image）和非GKI内核的主要区别在于内核设计和模块化程度，具体如下： 1. 内核设计 GKI：采用通用内核设计，与设备硬件分离，核心功能统一…

阅读更多...

bitcoinjs学习1—P2PKH

bitcoinjs学习1—P2PKH

1. 概述在本学习笔记中，我们将深入探讨如何使用 bitcoinjs-lib 库构建和签名一个 P2PKH（Pay-to-PubKey-Hash） 比特币交易。P2PKH 是比特币网络中最常见和最基本的交易类型之一，理解其工作原理是掌握比特币交易构建的关键。想要详…

阅读更多...

【论文笔记】Are Self-Attentions Effective for Time Series Forecasting? (NeurIPS 2024)

【论文笔记】Are Self-Attentions Effective for Time Series Forecasting? (NeurIPS 2024)

官方代码https://github.com/dongbeank/CATS Abstract 时间序列预测在多领域极为关键，Transformer 虽推进了该领域发展，但有效性尚存争议，有研究表明简单线性模型有时表现更优。本文聚焦于自注意力机制在时间序列预测中的作用，提…

阅读更多...

瑞芯微开发板/主板Android调试串口配置为普通串口方法深圳触觉智能科技分享

瑞芯微开发板/主板Android调试串口配置为普通串口方法深圳触觉智能科技分享

本文介绍瑞芯微开发板/主板Android调试串口配置为普通串口方法，不同板型找到对应文件修改，修改的方法相通。触觉智能RK3562开发板演示，搭载4核A53处理器，主频高达2.0GHz；内置独立1Tops算力NPU，可应用于物联…

阅读更多...

Redis 数据类型 Hash 哈希

Redis 数据类型 Hash 哈希

在 Redis 中，哈希类型是指值本⾝⼜是⼀个键值对结构，形如 key "key"，value { { field1, value1 }, ..., {fieldN, valueN } }，Redis String 和 Hash 类型⼆者的关系可以⽤下图来表⽰。 Hash 数据类型的特点键值对集合…

阅读更多...

推荐文章

最新文章