【深度学习】概率图模型(二)有向图模型详解(条件独立性、局部马尔可夫性及其证明)

news2024/11/25 14:48:11


在这里插入图片描述

  概率图模型(Probabilistic Graphical Model,PGM)是一种用图结构来表示和推断多元随机变量之间条件独立性的概率模型。图模型提供了一种直观且有效的方式来描述高维空间中的概率分布,通过图结构表示随机变量之间的关系,使得模型的参数量得以减少。

  【深度学习】概率图模型(一)概率图模型理论简介

一、有向图模型

  有向图模型(Directed Graphical Models)是概率图模型的一类,其中最为知名的代表是贝叶斯网络。这种模型在处理多变量概率关系方面表现出色,提供了一种直观、清晰的方法来描述随机变量之间的因果关系。

  下面将对贝叶斯网络的定义、条件独立性、局部马尔可夫性质等方面进行深入探讨。

1. 贝叶斯网络的定义

在这里插入图片描述

  1. 有向非循环图 G G G G G G是一个图,其中每个边都有一个方向,而且没有形成循环,每个节点都表示一个随机变量。这种有向图表示了变量之间的因果关系,其中箭头的方向指示了因果关系的方向。

  2. X X X 是一个 K K K 维随机向量:表示随机变量的集合,其中 K K K 是变量的数量。每个节点对应 X X X 中的一个随机变量。

  3. X π k X_{\pi_k} Xπk:表示变量 X k X_k Xk 的所有父节点变量的集合,这是一个关键概念,它表示了图中节点 X k X_k Xk 直接影响的变量。

  4. P ( X k ∣ X π k ) P(X_k | X_{\pi_k}) P(XkXπk):表示每个随机变量的局部条件概率分布,即给定其父节点的条件下,该变量的概率分布,表达了节点之间的因果关系。

  5. 联合概率分布的分解:如果随机向量 X X X 的联合概率分布可以分解为每个随机变量 X k X_k Xk 的局部条件概率的连乘形式(即式子 p ( x ) = ∏ k = 1 K p ( x k ∣ x π k ) p(\mathbf{x}) = \prod_{k=1}^{K} p(x_k | \mathbf{x}_{\pi_k}) p(x)=k=1Kp(xkxπk),那么图 (G) 和随机向量 (X) 构成了一个贝叶斯网络。

  • 重点:有向非循环图的结构和条件概率的定义。

2. 条件独立性及其证明

  贝叶斯网络中的条件独立性关系直接反映了有向边的因果关系。

  • 直接连接的节点通常是非条件独立的,表示了它们之间的直接因果关系。
  • 反之,不直接连接的节点在给定父节点信息下可能是条件独立的。

  下面将详细讨论不同连接关系下的条件独立性关系。

在这里插入图片描述

⊥ \perp 符号说明:markdown没找到与教材相同符号,这里暂使用 ⊥ \perp 替代

  1. 间接因果关系 X 3 → X 2 → X 1 X_3 \rightarrow X_2 \rightarrow X_1 X3X2X1

    • X 2 X_2 X2 已知时, X 1 X_1 X1 X 3 X_3 X3 是条件独立的,即 X 1 ⊥ X 3 ∣ X 2 X_1 \perp X_3 | X_2 X1X3X2
    • 表示给定中间节点 X 2 X_2 X2 的信息, X 1 X_1 X1 X 3 X_3 X3 不再有直接的因果关系。
  2. 间接果因关系 X 1 → X 2 → X 3 X_1 \rightarrow X_2 \rightarrow X_3 X1X2X3

    • X 2 X_2 X2 已知时, X 1 X_1 X1 X 3 X_3 X3 是条件独立的,即 X 1 ⊥ X 3 ∣ X 2 X_1 \perp X_3 | X_2 X1X3X2
    • 类似于上述情况,给定中间节点 X 2 X_2 X2 的信息, X 1 X_1 X1 X 3 X_3 X3 不再有直接的因果关系。
  3. 共因关系 X 1 ← X 2 → X 3 X_1 \leftarrow X_2 \rightarrow X_3 X1X2X3

    • X 2 X_2 X2 未知时, X 1 X_1 X1 X 3 X_3 X3 是不独立的。
    • X 2 X_2 X2 已知时, X 1 X_1 X1 X 3 X_3 X3 是条件独立的,即 X 1 ⊥ X 3 ∣ X 2 X_1 \perp X_3 | X_2 X1X3X2
    • 表示给定中间节点 X 2 X_2 X2 的信息, X 1 X_1 X1 X 3 X_3 X3 之间的关系变得更加独立。
  4. 共果关系 X 1 → X 2 ← X 3 X_1 \rightarrow X_2 \leftarrow X_3 X1X2X3

    • X 2 X_2 X2未知时, X 1 X_1 X1 X 3 X_3 X3 是独立的。
    • X 2 X_2 X2 已知时, X 1 X_1 X1 X 3 X_3 X3不再 是独立的,即 X 1 ⊥̸ X 3 ∣ X 2 X_1 \not\perp X_3 | X_2 X1X3X2
    • 表示给定中间节点 X 2 X_2 X2 的信息, X 1 X_1 X1 X 3 X_3 X3 之间的关系不再是独立的。

声明:下述证明过程为个人所见,不具备权威性……

a. 间接因果关系 X 3 → X 2 → X 1 X_3 \rightarrow X_2 \rightarrow X_1 X3X2X1

在间接因果关系中,考虑 X 1 X_1 X1 X 3 X_3 X3 在给定 X 2 X_2 X2 的条件下是否独立,根据概率链规则:

P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 , X 2 , X 3 ) P ( X 2 ) P(X_1, X_3 | X_2) = \frac{P(X_1, X_2, X_3)}{P(X_2)} P(X1,X3X2)=P(X2)P(X1,X2,X3)

由图中的有向边表示因果关系,我们可以写出联合概率的分解:

P ( X 1 , X 2 , X 3 ) = P ( X 3 ) ⋅ P ( X 2 ∣ X 3 ) ⋅ P ( X 1 ∣ X 2 ) P(X_1, X_2, X_3) = P(X_3) \cdot P(X_2 | X_3) \cdot P(X_1 | X_2) P(X1,X2,X3)=P(X3)P(X2X3)P(X1X2)

将其代入条件概率的计算式中:

P ( X 1 , X 3 ∣ X 2 ) = P ( X 3 ) ⋅ P ( X 2 ∣ X 3 ) P ( X 2 ) ⋅ P ( X 1 ∣ X 2 ) P(X_1, X_3 | X_2) = \frac{P(X_3) \cdot P(X_2 | X_3) }{P(X_2)}\cdot P(X_1 | X_2) P(X1,X3X2)=P(X2)P(X3)P(X2X3)P(X1X2)
因为(条件概率~贝叶斯公式) P ( X 2 , X 3 ) = P ( X 3 ) ⋅ P ( X 2 ∣ X 3 ) = P ( X 2 ) ⋅ P ( X 3 ∣ X 2 ) P(X_2,X_3)=P(X_3) \cdot P(X_2 | X_3) =P(X_2) \cdot P(X_3 | X_2) P(X2,X3)=P(X3)P(X2X3)=P(X2)P(X3X2)

所以 P ( X 1 , X 3 ∣ X 2 ) = P ( X 3 ∣ X 2 ) ⋅ P ( X 1 ∣ X 2 ) P(X_1, X_3 | X_2) = P(X_3 | X_2) \cdot P(X_1 | X_2) P(X1,X3X2)=P(X3X2)P(X1X2)

得证,在 X 3 → X 2 → X 1 X_3 \rightarrow X_2 \rightarrow X_1 X3X2X1的关系下, X 1 X_1 X1 X 3 X_3 X3 在给定 X 2 X_2 X2的条件下是独立的。

b. 间接果因关系 X 1 → X 2 → X 3 X_1 \rightarrow X_2 \rightarrow X_3 X1X2X3

  • 概率链规则:

P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 , X 2 , X 3 ) P ( X 2 ) P(X_1, X_3 | X_2) = \frac{P(X_1, X_2, X_3)}{P(X_2)} P(X1,X3X2)=P(X2)P(X1,X2,X3)

  • 联合概率的分解:

P ( X 1 , X 2 , X 3 ) = P ( X 1 ) ⋅ P ( X 2 ∣ X 1 ) ⋅ P ( X 3 ∣ X 2 ) P(X_1, X_2, X_3) = P(X_1) \cdot P(X_2 | X_1) \cdot P(X_3 | X_2) P(X1,X2,X3)=P(X1)P(X2X1)P(X3X2)

  • 代入条件概率的计算式,得到:
    P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 ) ⋅ P ( X 2 ∣ X 1 ) P ( X 2 ) ⋅ P ( X 3 ∣ X 2 ) P(X_1, X_3 | X_2) = \frac{P(X_1) \cdot P(X_2 | X_1) }{P(X_2)}\cdot P(X_3 | X_2) P(X1,X3X2)=P(X2)P(X1)P(X2X1)P(X3X2)

P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 ∣ X 2 ) ⋅ P ( X 3 ∣ X 2 ) P(X_1, X_3 | X_2) = P(X_1 | X_2) \cdot P(X_3 | X_2) P(X1,X3X2)=P(X1X2)P(X3X2)

  • 得证,在 X 1 → X 2 → X 3 X_1 \rightarrow X_2 \rightarrow X_3 X1X2X3 的关系下, X 1 X_1 X1 X 3 X_3 X3 在给定 X 2 X_2 X2 的条件下是独立的。

c. 共因关系 X 1 ← X 2 → X 3 X_1 \leftarrow X_2 \rightarrow X_3 X1X2X3

  • 联合概率的分解:

P ( X 1 , X 2 , X 3 ) = P ( X 2 ) ⋅ P ( X 1 ∣ X 2 ) ⋅ P ( X 3 ∣ X 2 ) P(X_1, X_2, X_3) = P(X_2) \cdot P(X_1 | X_2)\cdot P(X_3 | X_2) P(X1,X2,X3)=P(X2)P(X1X2)P(X3X2)

  • 将其代入条件概率的计算式中:

P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 ∣ X 2 ) ⋅ P ( X 2 ) ⋅ P ( X 3 ∣ X 2 ) P ( X 2 ) P(X_1, X_3 | X_2) = \frac{P(X_1 | X_2) \cdot P(X_2) \cdot P(X_3 | X_2)}{P(X_2)} P(X1,X3X2)=P(X2)P(X1X2)P(X2)P(X3X2)

P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 ∣ X 2 ) ⋅ P ( X 3 ∣ X 2 ) P(X_1, X_3 | X_2) = P(X_1 | X_2) \cdot P(X_3 | X_2) P(X1,X3X2)=P(X1X2)P(X3X2)

  • 这表明在 X 1 ← X 2 → X 3 X_1 \leftarrow X_2 \rightarrow X_3 X1X2X3 的关系下, X 1 X_1 X1 X 3 X_3 X3 在给定 X 2 X_2 X2 的条件下是独立的。

d. 共果关系 X 1 → X 2 ← X 3 X_1 \rightarrow X_2 \leftarrow X_3 X1X2X3

  • 联合概率的分解:

P ( X 1 , X 2 , X 3 ) = P ( X 1 ) ⋅ P ( X 3 ) ⋅ P ( X 2 ∣ X 1 , X 3 ) P(X_1, X_2, X_3) = P(X_1) \cdot P(X_3) \cdot P(X_2 | X_1, X_3) P(X1,X2,X3)=P(X1)P(X3)P(X2X1,X3)

  • 将其代入条件概率的计算式中:

P ( X 1 , X 3 ∣ X 2 ) = P ( X 1 ) ⋅ P ( X 3 ) ⋅ P ( X 2 ∣ X 1 , X 3 ) P ( X 2 ) P(X_1, X_3 | X_2) = \frac{P(X_1) \cdot P(X_3) \cdot P(X_2 | X_1, X_3)} {P(X_2)} P(X1,X3X2)=P(X2)P(X1)P(X3)P(X2X1,X3)

  • 这里的联合概率不能简化为 P ( X 1 ∣ X 2 ) ⋅ P ( X 3 ∣ X 2 ) P(X_1 | X_2) \cdot P(X_3 | X_2) P(X1X2)P(X3X2),这表明在 X 1 → X 2 ← X 3 X_1 \rightarrow X_2 \leftarrow X_3 X1X2X3 的关系下, X 1 X_1 X1 X 3 X_3 X3 在给定 X 2 X_2 X2的条件下不是独立的。

3. 局部马尔可夫性质

a. 理论

  局部马尔可夫性质是贝叶斯网络中的重要性质,它描述了在给定父节点的条件下,每个随机变量都与其非后代节点条件独立
在这里插入图片描述

局部马尔可夫性质: 对于贝叶斯网络中的每个节点 X k X_k Xk,它在给定其父节点 X π k X_{\pi_k} Xπk 的条件下,条件独立于与 X k X_k Xk 不相关的其他节点 Z Z Z,即

P ( X k ∣ X π k , Z ) = P ( X k ∣ X π k ) . P(X_k | X_{\pi_k}, Z) = P(X_k | X_{\pi_k}). P(XkXπk,Z)=P(XkXπk).

这表示,给定节点 X k X_k Xk 的父节点的信息,节点 X k X_k Xk 与其非后代节点 Z Z Z 之间没有直接的概率依赖关系,这个性质使得贝叶斯网络中的条件独立性关系更加清晰和易于推断。

b. 证明

P ( X k , Z ∣ X π k ) = P ( X k , Z , X π k ) P ( X π k ) P(X_k, Z | X_{\pi_k}) = \frac{P(X_k, Z , X_{\pi_k})}{P( X_{\pi_k})} P(Xk,ZXπk)=P(Xπk)P(Xk,Z,Xπk)
P ( X k , Z ∣ X π k ) = P ( X π k ) ⋅ P ( X k ∣ X π k ) ⋅ P ( Z ∣ X π k , X k ) P ( X π k ) P(X_k, Z | X_{\pi_k}) = \frac{P(X_{\pi_k})\cdot P(X_k|X_{\pi_k}) \cdot P(Z|X_{\pi_k},X_k) }{P( X_{\pi_k})} P(Xk,ZXπk)=P(Xπk)P(Xπk)P(XkXπk)P(ZXπk,Xk)
P ( X k , Z ∣ X π k ) = P ( X k ∣ X π k ) ⋅ P ( Z ∣ X π k , X k ) P(X_k, Z | X_{\pi_k}) = P(X_k|X_{\pi_k}) \cdot P(Z|X_{\pi_k},X_k) P(Xk,ZXπk)=P(XkXπk)P(ZXπk,Xk)
P ( X k , Z ∣ X π k ) = P ( X k ∣ X π k ) ⋅ P ( Z ∣ X π k ) P(X_k, Z | X_{\pi_k}) = P(X_k|X_{\pi_k}) \cdot P(Z|X_{\pi_k}) P(Xk,ZXπk)=P(XkXπk)P(ZXπk)

二、常见的有向图模型

持续更新ing~

1. Sigmoid信念网

2. 朴素贝叶斯分类器

3. 隐马尔可夫模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1260363.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动态网页从数据库取信息,然后展示。

把数据库的驱动放在bin目录下。 通过servlet 读取数据库的内容,生成session,然后跨页面传给展示页。 package src;import java.io.IOException; import java.io.PrintWriter; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSe…

Git的原理与使用(一):Git的基本操作(包含:版本回退)

Git原理与使用一 一.Git的初识与安装1.什么是Git2.如何安装Git1.git命令与git help(Git下的"man手册")2.centos下安装Git3.ubantu下安装Git 二.Git的前置操作与前置知识1.创建Git本地仓库2.配置Git3.理解Git的分区1.工作区2.暂存区3.版本库4.分区关系总结 三.添加文件…

Open Feign 源码解析(四) --- 请求对象构造(上)

Open Feign 源码解析四 请求对象的构造(上) 源码前三篇文章写了这个图的过程 源码前三篇文章的内容归纳起来就是讲了这样的问题: 如何把接口转换为具有发送http请求能力的feign client对象以及如何整合到Spring容器中? 如何构造…

【华为OD题库-040】计算最接近的数-java

题目 给定一个数组X和正整数K,请找出使表达式X[i]-x[i1]…-X[ik-1],结果最接近于数组中位数的下标i,如果有多个满足条件,请返回最大的i。 其中,数组中位数:长度为N的数组,按照元素的值大小升序排列后&#…

华纳云:linux中怎么实现apache安装与配置

在 Linux 系统中,安装和配置 Apache HTTP 服务器通常涉及以下步骤。以下以 Ubuntu 为例,其他 Linux 发行版的步骤也大致相同。 步骤 1:安装 Apache 打开终端并运行以下命令: sudo apt update sudo apt install apache2 步骤 …

魏副业而战:视频号副业项目赚钱攻略,每天30分钟,日入500+

我是魏哥,与其躺平,不如魏副业而战! 最近很多团队在操作视频号分成计划项目。 说真的,这个副业项目很不错,魏哥也操作测试一下,每天收益大几百,收益如下: 大家看了,是不…

如何把视频中不需要的人物去掉?

从视频中移除不想要的对象或区域,这项工作以前既繁琐复杂又很消耗时间。但使用“AI智能抠像”工具,只需几个简单的步骤,即可轻松移除视频中任何不想要的人物。 在制作视频的过程中,我们常常会遇到需要将视频中多余的人物去掉的情…

Redis深入理解-三次握手、槽位机制

Redis 节点之间的三次握手原理分析 比如多台 Redis 之间要建立集群,那么连接其中的一台 Redis 客户端,向其他 Redis 发送 meet 命令即可通知其他节点,那么发送 meet 命令给其他节点后,对方也会在内存中创建一个 ClusterNode 结构…

无代码未来:智能、可视化、自动化的融合

无代码是一个相对较新的概念,不同的人群对其界定可能存在一定的差异。 对于IT专业人士和开发人员而言,无代码通常是指使用可视化界面和拖拽操作来构建应用程序的工具和平台。 无代码平台通过提供预先构建的组件和模块,使得开发人员可以通过简…

Shader编程:“热成像”风格的效果是怎么实现的?(内附源码)

未经作者(微信ID:Byte-Flow)允许,禁止转载 文章首发于公众号:字节流动 之前转载过知乎上面的一篇文章: 作者:这是上帝的杰作 链接:https://zhuanlan.zhihu.com/p/344110917 文章详细讲解了 Shader 实现“热成像”效果的思路,但是并没有给出完整的实现代码,后台有读者…

Fluent热辐射壁面设置

对于固体壁面,可分为: 内部面外部面 外部面,若需要考虑外部热辐射的影响,需要将类型改为“mixed”或者“radiation”类型,并设置外部的发射率。 内部面通常为“wall”和“wall-shadow”的配对形式。 对于两侧均是透明…

经验分享:JMeter控制RPS

一、前言 ​ RPS (Request Per Second)一般用来衡量服务端的吞吐量,相比于并发模式,更适合用来摸底服务端的性能。我们可以通过使用 JMeter 的常数吞吐量定时器来限制每个线程的RPS。对于RPS,我们可以把他理解为我们的TPS,我们就…

工博会新闻稿汇总

23届工博会媒体报道汇总 点击文章标题即可进入详情页 9月23日,第23届工博会圆满落幕!本届工博会规模之大、能级之高、新展品之多创下历史之最。高校展区在规模、能级和展品上均也创下新高。工博会系列报道深入探讨了高校科技发展的重要性和多方面影响。…

疯狂小杨哥花3000万举办演唱会

我是卢松松,点点上面的头像,欢迎关注我哦! 确实厉害,95年的,白手起家,1亿元买楼,3000万办演唱会,而且会在线上直播,疯狂小杨哥正常从“网红”向“企业家”的转变。全网没…

HarmonyOS 应用模型开发指南介绍

一、基本概念解析 新版文档中的知识点,介绍更全面,逻辑更清晰,提供了各类基本概念解析,帮助开发者更快学习、掌握系统能力。以下是新版文档部分概念展示。 1、HAP是什么? 开发者通过DevEco Studio把应用程序编译为一…

C++之哈希

unordered系列容器的效率之所以比较高(尤其是查找),是因为它底层使用了哈希结构,即哈希表. 哈希概念 前言: 顺序结构以及平衡树中, 元素关键码与其存储位置之间没有对应的关系, 因此在查找一个元素 时, 必须要经过关键码的多次比较. 顺序查找时间复杂度为O(N), 平衡树中为树的…

内蒙古珠三角服务工作站挂牌 搭建桥梁促进民营经济发展

内蒙古自治区促进民营经济发展珠三角服务工作站挂牌仪式暨蒙粤两地民营企业家交流座谈会在深圳市顺利举行。 为贯彻落实内蒙古自治区党委、政府关于促进民营经济发展的决策部署,11月26日,由自治区发展改革委、工商联共同主办的“内蒙古自治区促进民营经济…

SQL Server详细使用教程(包含启动SQL server服务、建立数据库、建表的详细操作) 非常适合初学者

文章目录 目录 前言 一、启动SQL server服务的三种方法 1.不启动SQL server服务的影响 2.方法一:利用cmd启动SQL server服务 3.方法二:利用SQL Server配置管理器启动SQL server服务 4.方法三:在服务管理器中启动SQL server服务 二、建立数据库…

js的数组去重方法

目录 es6数组中对象去重 1. filter()用法 2. findIndex()用法 3. 去重 其他方法: 方法二:reduce()去重 1. reduce()用法 1.1 找出字符长度最长的数组成员。 1.2 扁平化二维数组 1.3 扁平化多维数组 三、总结方案: 使用Set&#xf…

华为的数字化转型(9)——企业架构4A集成模型

企业架构(Enterprise Architecture,EA)是衔接战略与项目实施的桥梁,引入企业架构方法,可以对数字化转型愿景进行系统性的、分层分级的梳理和解释,以便企业上下在同一张蓝图上统一认识。 企业架构提供了整体…