深入理解机器学习——概率图模型(Probabilistic Graphical Model):马尔可夫随机场(Markov Random Field,MRF)

news2025/1/11 20:08:12

分类目录:《深入理解机器学习》总目录


马尔可夫随机场(Markov Random Field,MRF)是典型的马尔可夫网,这是一种著名的无向图模型,图中每个结点表示一个或一组变量,结点之间的边表示两个变量之间的依赖关系。马尔可夫随机场有一组势函数(Potential Functions),亦称“因子”(Factor),这是定义在变量子集上的非负实函数,主要用于定义概率分布函数。

马尔可夫随机场
上图显示出一个简单的马尔可夫随机场,对于图中结点的一个子集,若其中任意两结点间都有边连接,则称该结点子集为一个“团”(Clique),若在一个团中加入另外任何一个结点都不再形成团,则称该团为“极大团(Maximal Clique);换言之,极大团就是不能被其他团所包含的团,例如,在上图中 { x 1 , x 2 } \{x_1, x_2\} {x1,x2} { x 1 , x 3 } \{x_1, x_3\} {x1,x3} { x 2 , x 4 } \{x_2, x_4\} {x2,x4} { x 2 , x 5 } \{x_2, x_5\} {x2,x5} { x 2 , x 6 } \{x_2, x_6\} {x2,x6} { x 3 , x 5 } \{x_3, x_5\} {x3,x5} { x 5 , x 6 } \{x_5, x_6\} {x5,x6} { x 2 , x 5 , x 6 } \{x_2, x_5, x_6\} {x2,x5,x6}都是团,并且除了 { x 2 , x 5 } \{x_2, x_5\} {x2,x5} { x 2 , x 6 } \{x_2, x_6\} {x2,x6} { x 5 , x 6 } \{x_5, x_6\} {x5,x6}之外都是极大团;但是,因为 x 2 x_2 x2 x 3 x_3 x3之间缺乏连接, { x 1 , x 2 , x 3 } \{x_1, x_2, x_3\} {x1,x2,x3}并不构成团,显然,每个结点至少出现在一个极大团中。

在马尔可夫随机场中,多个变量之间的联合概率分布能基于团分解为多个因子的乘积,每个因子仅与一个团相关,具体来说,对于 n n n个变量 x = { x 1 , x 2 , ⋯   , x n } x=\{x_1, x_2, \cdots, x_n\} x={x1,x2,,xn},所有团构成的集合为 C \mathcal{C} C,与团 Q ∈ C Q\in\mathcal{C} QC对应的变量集合记为 x Q x_Q xQ,则联合概率 P ( x ) P(x) P(x)定义为:
P ( x ) = 1 Z ∏ Q ∈ C ψ Q ( x Q ) P(x)=\frac{1}{Z}\prod_{Q\in\mathcal{C}}\psi_Q(x_Q) P(x)=Z1QCψQ(xQ)

其中 ψ Q \psi_Q ψQ为与团 Q Q Q对应的势函数,用于对团 Q Q Q中的变量关系进行建模, Z = ∑ x ∏ Q ∈ C ψ Q ( x Q ) Z=\sum_x\prod_{Q\in\mathcal{C}}\psi_Q(x_Q) Z=xQCψQ(xQ)为规范化因子,以确保 P ( x ) P(x) P(x)是被正确定义的概率,在实际应用中,精确计算 Z Z Z通常很困难,但许多任务往往并不需获得 Z Z Z的精确值显然,若变量个数较多,则团的数目将会很多(例如,所有相互连接的两个变量都会构成团),这就意味着上式会有很多乘积项,显然会给计算带来负担。注意到若团 Q Q Q不是极大团,则它必被一个极大团 Q ∗ Q^* Q所包含,即 x Q ⊆ x Q ∗ x_Q\subseteq x_Q^* xQxQ。这意味着变量 x Q x_Q xQ之间的关系不仅体现在势函数 ψ Q \psi_Q ψQ中,还体现在 ψ Q ∗ \psi_{Q^*} ψQ中。于是,联合概率 P ( x ) P(x) P(x)可基于极大团来定义。假定所有极大团构成的集合为 C ∗ \mathcal{C^*} C,则有: P ( x ) = 1 Z ∗ ∏ Q ∈ C ∗ ψ Q ( x Q ) P(x)=\frac{1}{Z^*}\prod_{Q\in\mathcal{C^*}}\psi_Q(x_Q) P(x)=Z1QCψQ(xQ)

如上图中 x = { x 1 , x 2 , x 3 , ⋯   , x 6 } x=\{x_1, x_2, x_3, \cdots, x_6\} x={x1,x2,x3,,x6},联合概率分布 P ( x ) P(x) P(x)定义为:
P ( x ) = 1 Z ψ 12 ( x 1 , x 2 ) ψ 13 ( x 1 , x 3 ) ψ 24 ( x 2 , x 4 ) ψ 35 ( x 3 , x 5 ) ψ 256 ( x 2 , x 5 , x 6 ) P(x)=\frac{1}{Z}\psi_{12}(x_1, x_2)\psi_{13}(x_1, x_3)\psi_{24}(x_2, x_4)\psi_{35}(x_3, x_5)\psi_{256}(x_2, x_5, x_6) P(x)=Z1ψ12(x1,x2)ψ13(x1,x3)ψ24(x2,x4)ψ35(x3,x5)ψ256(x2,x5,x6)

其中,势函数 ψ 256 ( x 2 , x 5 , x 6 ) \psi_{256}(x_2, x_5, x_6) ψ256(x2,x5,x6)定义在极大团 { x 2 . x 5 , x 6 } \{x_2. x_5, x_6\} {x2.x5,x6}上,由于它的存在,使我们不再需为团 { x 2 , x 5 } \{x_2, x_5\} {x2,x5} { x 2 , x 6 } \{x_2, x_6\} {x2,x6} { x 5 , x 6 } \{x_5, x_6\} {x5,x6}构建势函数。

在马尔可夫随机场中如何得到“条件独立性”呢?同样借助“分离”的概念,如下图所示,若从结点集 A A A中的结点到 B B B中的结点都必须经过结点集 C C C 中的结点,则称结点集 A A A B B B被结点集 C C C分离, C C C称为“分离集(Separating Set)。对马尔可夫随机场,有全局马尔可夫性(Global Markov Property),即给定两个变量子集的分离集,则这两个变量子集条件独立。如下图,若令 A A A B B B C C C对应的变量集分别为 x A x_A xA x B x_B xB x C x_C xC,则 x A x_A xA x B x_B xB在给定 x C x_C xC的条件下独立,记为: x A ⊥ x B ∣ x C x_A\bot x_B | x_C xAxBxC
分离集
由全局马尔可夫性可得到两个很有用的推论:

  • 局部马尔可夫性(Local Markov Property):给定某变量的邻接变量,则该变量条件独立于其他变量。形式化地说,令 V V V为图的结点集, n ( v ) n(v) n(v)为结点 v v v在图上的邻接结点, n ∗ ( v ) = n ( v ) ∪ { v } n^*(v)=n(v)\cup \{v\} n(v)=n(v){v},则有 x v ⊥ x V \ n ∗ ( v ) ∣ n ( v ) x_v\bot x_{V\backslash n^*(v)} | n(v) xvxV\n(v)n(v)
  • 成对马尔可夫性(Pairwise Markov Property):给定所有其他变量,两个非邻接变量条件独立。形式化地说,令图的结点集和边集分别为 V V V E E E,对图中的两个结点 u u u v v v,若 < u , v > ∉ E <u, v>\notin E <u,v>/E,则 x u ⊥ x v ∣ x V \ < u , v > xu_\bot x_v | x_{V\backslash <u, v>} xuxvxV\<u,v>

分离集

现在我们来考察马尔可夫随机场中的势函数,显然,势函数 ψ Q ( x Q ) \psi_Q(x_Q) ψQ(xQ)的作用是定量刻画变量集 x Q x_Q xQ中变量之间的相关关系,它应该是非负函数,且在所偏好的变量取值上有较大函数值,例如,假定上图的变量均为二值变量,若势函数为:
ψ A C ( x A , x C ) = { 1.5 , if x A = x C 0.1 , otherwise ψ B C ( x B , x C ) = { 0.2 , if x B = x C 1.3 , otherwise \psi_{AC}(x_A, x_C)=\left\{ \begin{aligned} 1.5, & \quad\text{if}\quad x_A = x_C \\ 0.1, & \quad\text{otherwise} \\ \end{aligned} \right.\\ \quad\\ \psi_{BC}(x_B, x_C)=\left\{ \begin{aligned} 0.2, & \quad\text{if}\quad x_B = x_C \\ 1.3, & \quad\text{otherwise} \\ \end{aligned} \right. ψAC(xA,xC)={1.5,0.1,ifxA=xCotherwiseψBC(xB,xC)={0.2,1.3,ifxB=xCotherwise
则说明该模型偏好变量 x A x_A xA x C x_C xC拥有相同的取值, x B x_B xB x C x_C xC拥有不同的取值;换言之,在该模型中 x A x_A xA x C x_C xC正相关, x B x_B xB x C x_C xC负相关。所以,令 x A x_A xA x C x_C xC相同且 x B x_B xB x C x_C xC不同的变量值指派将取得较高的联合概率,为了满足非负性,指数函数常被用于定义势函数,即:
ψ Q ( x Q ) = e − H Q ( x Q ) \psi_Q(x_Q)=e^{-H_Q(x_Q)} ψQ(xQ)=eHQ(xQ)

其中, H Q ( x Q ) H_Q(x_Q) HQ(xQ)是一个定义在变量 x Q x_Q xQ上的实值函数,常见形式为:
H Q ( x Q ) = ∑ u , v ∈ Q , u ≠ v α u v x u x v + ∑ v ∈ Q β v x v H_Q(x_Q)=\sum_{u,v\in Q,u\neq v}\alpha_{uv}x_ux_v+\sum_{v\in Q}\beta_vx_v HQ(xQ)=u,vQ,u=vαuvxuxv+vQβvxv

其中 α u v \alpha_{uv} αuv β v \beta_v βv是参数。上式中的第二项仅考虑单结点,第一项则考虑每一对结点的关系。

参考文献:
[1] 周志华. 机器学习[M]. 清华大学出版社, 2016.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/76454.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Zookeper报错:Will not attempt to authenticate using SASL (unknown error)|防火墙的问题

先放一张debug成功的图吧~ 之前一直报这个错&#xff0c;不知道为什么&#xff0c;非常迷惑&#xff0c;然后试了多方法&#xff0c;就是防火墙的问题。我是Hadoop2.5和centos6&#xff0c;因此没法用systemtcl&#xff0c;就使用serive命令。 方式一&#xff1a;Linux命令来…

Kubernetes单主集群的部署(一)

目录 一、k8s单主架构集群的部署 1.操作系统初始化配置 2.部署 etcd 集群 3.部署docker引擎 4.部署 Master 组件 5.部署 Worker Node 组件 6.部署网络组件&#xff08;使用 flannel&#xff09; 一、k8s单主架构集群的部署 k8s集群master01&#xff1a;192.168.116.1…

纯手写2022年最新JVM调优实战手册,看完让你精通JVM调优

很多程序员不重视 JVM 内存调优&#xff0c;写出来的代码经常出现 OOM 等内存问题。而且&#xff0c;面试求职者中&#xff0c;很多求职者一旦遇到JVM 或者 JVM 调优方面的问题&#xff0c;往往不知如何回答&#xff0c;才能充分展现自己的能力。 jvm OOM问题实战分析 说说问题…

JS 原生面经从初级到高级【近1.5W字】

前言 是时候撸一波 JS 基础啦,撸熟了,银十速拿 offer; 本文不从传统的问答方式梳理,而是从知识维度梳理,以便形成知识网络; 包括函数,数组,对象,数据结构,算法,设计模式和 http. 1. 函数 1.1函数的3种定义方法 1.1.1 函数声明 //ES5 function getSum(){} function (){}//匿名…

【MATLAB教程案例56】VGG16网络的MATLAB编程学习和实现,以步态识别为例进行仿真分析

欢迎订阅《FPGA学习入门100例教程》、《MATLAB学习入门100例教程》 目录 1.软件版本 2.VGG16理论概述

ADI Blackfin DSP处理器-BF533的开发详解12:Memory DMA的使用详解(含源代码)

硬件准备 ADSP-EDU-BF533&#xff1a;BF533开发板 AD-HP530ICE&#xff1a;ADI DSP仿真器 软件准备 Visual DSP软件 硬件链接 接口功能介绍 MDMA 全称是 memoryDMA &#xff0c;是内存到内存搬运数据的 DMA。在 DSP 做算法时&#xff0c;经常会遇到数据重组或者搬移&#…

谁说菜鸟不会数据分析 | 学习笔记(全)

一.前言 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来&#xff0c;总结出所研究对象的内在规律。在实际工作中&#xff0c;数据分析能够帮助管理者进行判断和决策&…

Linux | 进程信号 | 信号的产生 | 进程处理信号过程 | 进程pending,block,handler设置 | 用户态、内核态

文章目录信号的概念Ctrl C信号Linux中的信号信号产生前由终端产生信号由软件条件产生信号硬件异常产生信号core dump信号产生时sigset_tsigprocmask信号产生后用户态和内核态sigaction信号的概念 在日常生活中&#xff0c;我们看到绿灯选择过马路&#xff0c;看到红灯选择等待…

浅谈Java Web经典三层架构和MVC框架模式

从前端到后端整体架构做一个分析&#xff0c;通过这个分析更清楚的了解一下具体的前后端架构。以下三个架构属于三种架构&#xff0c;有共同点&#xff0c;但是并不是从属关系。 01 MVC模型 MVC是一种模型概念&#xff0c;绝大多数架构都是根据他来实现的&#xff0c;但是并不…

使用Docker+Jenkins+Gitee自动化部署Vue+ElementUI项目

参考本文章并打算跟着步骤进行构建部署的朋友们&#xff0c;建议直接先看踩坑总结&#xff0c;看看自己是否存在对应的问题&#xff0c;免得构建完才发现出错了&#xff0c;毕竟构建一次过程还挺长的。也可以自己走一遍后再参考如何解决啦。 1、Docker安装Jenkins 关于如何安…

使用 Monai 和 PyTorch 预处理 3D Volumes以进行肿瘤分割

1.介绍 针对在使用传统图像处理工具时可能遇到的困难&#xff0c;深度学习已成为医疗保健领域的主要解决方案。 因为医学图像比标准图像更难处理&#xff08;高对比度、人体的广泛变化……&#xff09;深度学习用于分类、对象检测&#xff0c;尤其是分割任务。 在分割方面&a…

[附源码]计算机毕业设计健身生活系统论文Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

SQL注入漏洞 | updatexml报错注入

文章目录前言MySQL updatexml报错注入前言 XML XML 被设计用来传输和存储数据&#xff0c;是各种应用程序之间进行数据传输的最常用的工具。 xpath XPath 是一门在 XML 文档中查找信息的语言。XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在…

传统机器学习算法-支持向量机模型详解

原文链接 引言 本篇我们要讲解的模型是大名鼎鼎的支持向量机 SVM&#xff0c;这是曾经在机器学习界有着近乎「垄断」地位的模型&#xff0c;影响力持续了好多年。直至今日&#xff0c;即使深度学习神经网络的影响力逐渐增强&#xff0c;但 SVM 在中小型数据集上依旧有着可以和…

申请澳洲八大,IB成绩多高才有胜算?

鉴于IB文凭项目是全球通用的国际课程&#xff0c;因此几乎所有澳洲大学都可以接受IB文凭直接申请本科&#xff0c;包括澳洲八大。 首先我们要知道&#xff0c;澳洲八大究竟是哪八个顶级大学&#xff1f;澳洲的大学是按星级来分类的&#xff0c;五星级大学就是澳洲八大&#xff…

计算机网络期末复习题含解析(第一章)

目录 单项选择 填空题 判断题 单项选择 题号&#xff1a;25995 1.1.15 互联网服务提供商的英文缩写是&#xff08;&#xff09;。 A、ISA B、ISP C、IXP D、RFC 答案&#xff1a; B ISP&#xff1a;Internet Service Provider 题号&#xff1a;25986 1.1.6 网络体系…

如何熟练掌握JDBC编程?

目录 &#x1f433;今日良言:未来可期,人生值得 &#x1f402;一、JDBC &#x1f43c;1.概念 &#x1f43c;2.背景 &#x1f43c;3.使用 &#x1f42f;二、编写数据库代码 &#x1f43c;1.增/删/改数据 &#x1f43c;2.查数据 &#x1f433;今日良言:未来可期,人生值得…

机器学习笔记之受限玻尔兹曼机(六)对数似然梯度求解

机器学习笔记之受限玻尔兹曼机——对数似然梯度求解引言回顾&#xff1a;含隐变量能量模型的对数似然梯度受限玻尔兹曼机的对数似然梯度模型参数求解主体思路求解过程引言 上一节介绍了含隐变量能量模型的对数似然梯度求解。本节针对受限玻尔兹曼机&#xff0c;对模型参数进行…

c#入门-完全限定名,引用命名空间

完全限定名 包含完整命名空间的类名&#xff0c;称为完全限定名。 namespace 黄野平原.古堡 {class 蜡烛怪 { } }例如 黄野平原.古堡.蜡烛怪 a new 黄野平原.古堡.蜡烛怪();引用命名空间 但是很多的类都会写在命名空间下&#xff0c;如果全都这么写代码太长了。 为了省略掉…

Unity-Photon Pun2个人总结

进入房间前的配置 1、使用设定好的Setting private void Start(){PhotonNetwork.ConnectUsingSettings();} 2、MonoBehaviour改为MonoBehaviourPunCallbacks public class NetworkLauncher : MonoBehaviourPunCallbacks{} 这样我们才可以获得Photon服务端的一些反馈资料 3…