机器学习笔记之高斯网络(一)基本介绍

news2025/1/18 3:17:32

机器学习笔记之高斯网络——基本介绍

  • 引言
    • 回顾:
      • 条件独立性
      • 概率图模型
    • 高斯网络
      • 高斯网络介绍
      • 高斯网络的条件独立性
        • 随机变量之间的边缘独立
        • 随机变量之间的条件独立

引言

本节将介绍高斯网络

回顾:

条件独立性

在概率图模型——背景介绍中介绍了条件独立性,条件独立性的核心思想是:给定某随机变量集合 X A \mathcal X_{\mathcal A} XA的条件下,可能存在随机变量集合 X B , X C \mathcal X_{\mathcal B},\mathcal X_{\mathcal C} XB,XC内部结点之间存在关联,但 X B , X C \mathcal X_{\mathcal B},\mathcal X_{\mathcal C} XB,XC之间不存在关联
X B ⊥ X C ∣ X A \mathcal X_{\mathcal B} \perp \mathcal X_{\mathcal C} \mid \mathcal X_{\mathcal A} XBXCXA
并且 X A , X B , X C \mathcal X_{\mathcal A},\mathcal X_{\mathcal B},\mathcal X_{\mathcal C} XA,XB,XC是三个不相交的特征集合。

概率图模型

在概率图模型——背景介绍中介绍了概率图模型(Probabilisitc Graphical Model,PGM)。从图的表示角度观察,它可以分为有向图无向图两种:

  • 基于有向图的概率图模型又称贝叶斯网络(Bayesian Network),也称信念网络(Belief Network)。
    条件独立性的角度观察,贝叶斯网络的条件独立性表达包含三种经典情况:

    • 同父结构(Common Parent),对应概率图结构表示如下:
      贝叶斯网络——条件独立性——同父结构
      上图结构表现的现象是:给定结点 i 1 i_1 i1的取值,结点 i 2 , i 3 i_2,i_3 i2,i3条件独立
      i 2 ⊥ i 3 ∣ i 1 i_2 \perp i_3 \mid i_1 i2i3i1
    • 顺序结构(Sequence),对应概率图结构表示如下:
      贝叶斯网络——条件独立性——顺序结构
      上图结构表现的现象是:给定结点 i 2 i_2 i2的取值,结点 i 1 , i 3 i_1,i_3 i1,i3相互独立
      i 1 ⊥ i 3 ∣ i 2 i_1 \perp i_3 \mid i_2 i1i3i2
    • V \mathcal V V型结构(V-Structure),对应概率图结构表示如下:
      贝叶斯网络——条件独立性——V型结构
      该结构表现的现象是:给定 i 3 i_3 i3结点的条件下, i 1 , i 2 i_1,i_2 i1,i2必不独立;相反, i 3 i_3 i3取值未知的条件下, i 1 , i 2 i_1,i_2 i1,i2相互独立
      i 3 ∣ i 1 ⊥ i 2 i_3 \mid i_1 \perp i_2 i3i1i2
  • 基于无向图的概率图模型又称马尔可夫网络(Markov Network),也称马尔可夫随机场(Markov Random Field)。
    相比于贝叶斯网络,马尔可夫随机场中描述变量之间的依赖关系 仅包含一种格式:
    马尔可夫随机场——条件独立性
    该结构表现的现象是:给定 i 1 i_1 i1结点的条件下,结点 i 2 , i 3 i_2,i_3 i2,i3相互独立
    i 2 ⊥ i 3 ∣ i 1 i_2 \perp i_3 \mid i_1 i2i3i1

高斯网络

高斯网络介绍

高斯网络(Gaussian Network),又称高斯概率图模型(Gaussian Probabilistic Graphical Model)。它同样也是一种概率图模型
随机变量的类型角度观察,将随机变量分为离散型随机变量核连续型随机变量两种。已经介绍的随机变量是离散型随机变量的有:

  • 高斯混合模型(Gaussian Mixture Model,GMM),其隐变量 Z \mathcal Z Z包含离散的 ∣ K ∣ |\mathcal K| K个取值,每个取值条件下的观测变量服从高斯分布
    P ( X ) = ∑ k = 1 K α k ⋅ N ( μ k , Σ k ) ∑ k = 1 K α k = 1 \mathcal P(\mathcal X) = \sum_{k=1}^{\mathcal K} \alpha_k \cdot \mathcal N(\mu_{k},\Sigma_k) \quad \sum_{k=1}^{\mathcal K} \alpha_k = 1 P(X)=k=1KαkN(μk,Σk)k=1Kαk=1
  • 隐马尔可夫模型(Hidden Markov Model,HMM):隐变量 I \mathcal I I是离散型随机变量,观测变量 O \mathcal O O没有要求
  • 条件随机场(Condition Random Field,CRF):隐变量 I \mathcal I I是离散型随机变量,观测变量 O 1 : T \mathcal O_{1:T} O1:T常以序列形式出现

而高斯网络是随机变量是连续型随机变量 的一种代表模型,其核心思想是:随机变量都是连续型随机变量,并且随机变量服从高斯分布。同上,根据图的表示,高斯网络同样分为有向图无向图两种表达形式:

  • 高斯贝叶斯网络(Gaussian Beyasian Network,GBN)
  • 高斯马尔可夫网络(Gaussian Markov Network,GMN)

高斯网络的条件独立性

假设一个高斯图模型表示如下:
高斯图模型——示例
这只是一个简单的马尔可夫网络,并且每个结点都是一个一维随机变量。这里的随机变量均是连续型随机变量,并且均服从高斯分布
x i ∼ N ( μ i , Σ i ) x_i \sim \mathcal N(\mu_i,\Sigma_i) xiN(μi,Σi)
假设随机变量集合的维数 p p p,整个高斯图模型中所有随机变量对应的概率密度函数 P ( X ) \mathcal P(\mathcal X) P(X)表示为:
X = ( x 1 , x 2 , ⋯   , x p ) T P ( X ) = 1 ( 2 π ) p 2 ∣ Σ ∣ 1 2 exp ⁡ [ − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ] \begin{aligned} \mathcal X & = (x_1,x_2,\cdots,x_p)^T \\ \mathcal P(\mathcal X) & = \frac{1}{(2\pi)^{\frac{p}{2}}|\Sigma|^{\frac{1}{2}}} \exp \left[-\frac{1}{2} (x - \mu)^T \Sigma^{-1}(x - \mu)\right] \end{aligned} XP(X)=(x1,x2,,xp)T=(2π)2pΣ211exp[21(xμ)TΣ1(xμ)]
这明显是一个多元高斯分布一个高斯图模型和一个多元高斯分布存在映射关系。其中 μ \mu μ表示多元高斯分布的期望 Σ \Sigma Σ表示多元高斯分布的协方差矩阵
其中,期望 μ \mu μ表示为:
μ = [ μ i ] p × 1 = ( μ 1 μ 2 ⋮ μ p ) p × 1 \mu = [\mu_i]_{p \times 1} = \begin{pmatrix} \mu_1 \\ \mu_2 \\ \vdots \\ \mu_p \end{pmatrix}_{p \times 1} μ=[μi]p×1=μ1μ2μpp×1
协方差矩阵 Σ \Sigma Σ表示为:
Σ = [ σ i j ] p × p = ( σ 11 , σ 12 , ⋯   , σ 1 p σ 21 , σ 22 , ⋯   , σ 2 p ⋮ σ p 1 , σ p 2 , ⋯   , σ p p ) p × p \Sigma = [\sigma_{ij}]_{p \times p} = \begin{pmatrix} \sigma_{11},\sigma_{12},\cdots,\sigma_{1p} \\ \sigma_{21},\sigma_{22},\cdots,\sigma_{2p} \\ \vdots \\ \sigma_{p1},\sigma_{p2},\cdots,\sigma_{pp} \\ \end{pmatrix}_{p \times p} Σ=[σij]p×p=σ11,σ12,,σ1pσ21,σ22,,σ2pσp1,σp2,,σppp×p
其中 σ i j \sigma_{ij} σij表示随机变量 x i , x j x_i,x_j xi,xj协方差结果
这里没有写成 ( x i − μ i ) ( x j − μ j ) T (x_i - \mu_i)(x_j - \mu_j)^T (xiμi)(xjμj)T因为已经设定的一维随机变量。
σ i j = C o v ( x i , x j ) = E [ ( x i − μ i ) ( x j − μ j ) ] \sigma_{ij} = Cov(x_i,x_j) = \mathbb E\left[(x_i - \mu_i)(x_j - \mu_j)\right] σij=Cov(xi,xj)=E[(xiμi)(xjμj)]

随机变量之间的边缘独立

根据协方差的定义,如果在同一物理量纲(基准)的条件下, C o v ( x i , x j ) = 0 Cov(x_i,x_j) = 0 Cov(xi,xj)=0,那个称随机变量 x i , x j x_i,x_j xi,xj是不相关的。从独立性的角度观察,即 x i , x j x_i,x_j xi,xj相互独立
这个相互独立意味着 x i x_i xi x j x_j xj在不观察其他变量的条件下是‘边缘独立/绝对独立’的,这种独立在现实世界的问题中并不常见。
σ i j = 0 ⇒ x i ⊥ x j σ i j = 0 ⇒ P ( x i , x j ) = P ( x i ) P ( x j ) \begin{aligned} \sigma_{ij} = 0 & \Rightarrow x_i \perp x_j \\ \sigma_{ij} = 0 & \Rightarrow \mathcal P(x_i,x_j) = \mathcal P(x_i)\mathcal P(x_j) \end{aligned} σij=0σij=0xixjP(xi,xj)=P(xi)P(xj)
如果两个随机变量之间的基准存在差异,对应的 σ i j \sigma_{ij} σij也可能存在很大差异。为此可以引入相关系数(Correlation Coefficient):
ρ i j = C o v ( x i , x j ) D ( x i ) D ( x j ) = σ i j σ i i σ j j \begin{aligned} \rho_{ij} & = \frac{Cov(x_i,x_j)}{\sqrt{\mathcal D(x_i)}\sqrt{\mathcal D(x_j)}} \\ & = \frac{\sigma_{ij}}{\sqrt{\sigma_{ii}\sigma_{jj}}} \end{aligned} ρij=D(xi) D(xj) Cov(xi,xj)=σiiσjj σij
如果相关系数 ρ i j = 0 \rho_{ij} = 0 ρij=0 x i , x j x_i,x_j xi,xj不相关。

随机变量之间的条件独立

条件独立性本质上是为了简化运算提出的一种假设,从而在概率图模型中得到映射。
关于高斯网络的条件独立性,引入一个概念精度矩阵(Precision Matrix),也称作 信息矩阵(Information Matrix)。它是协方差矩阵的逆矩阵
第一次遇到‘精度矩阵’是在推断任务之边缘概率分布与条件概率分布,记录一下时间点~
Λ = Σ − 1 = ( λ 11 , λ 12 , ⋯   , λ 1 p λ 21 , λ 22 , ⋯   , λ 2 p ⋮ λ p 1 , λ p 2 , ⋯   , λ p p ) p × p \Lambda = \Sigma^{-1} = \begin{pmatrix} \lambda_{11},\lambda_{12},\cdots,\lambda_{1p} \\ \lambda_{21},\lambda_{22},\cdots,\lambda_{2p} \\ \vdots \\ \lambda_{p1},\lambda_{p2},\cdots,\lambda_{pp} \\ \end{pmatrix}_{p \times p} Λ=Σ1=λ11,λ12,,λ1pλ21,λ22,,λ2pλp1,λp2,,λppp×p
关于精度矩阵 Λ \Lambda Λ条件独立性的关联关系表示如下:
其中 x − i − j x_{-i-j} xij表示随机变量集合 X \mathcal X X中除去 x i , x j x_i,x_j xi,xj之外的其他随机变量。
λ i j = 0 ⇔ x i ⊥ x j ∣ x − i − j \lambda_{ij} = 0 \Leftrightarrow x_i \perp x_j \mid x_{-i-j} λij=0xixjxij
精度矩阵的核心在于:精度矩阵中的元素与条件独立性(概率图的映射)紧密结合在一起

下一节将介绍高斯贝叶斯网络

相关参考:
高斯图模型、精度矩阵、偏相关系数、贝叶斯估计(利用贝叶斯做数据融合)、Wishart分布和逆Wishart分布
协方差——百度百科
概率图模型(四):经典概率图模型
机器学习-高斯网络(1)-总体介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32921.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Dissertation写作常用的研究方法

英文毕业论文的撰写,有很多值得注意的重要因素,而研究方法的选择无疑是最重要的内容之一。留学毕业论文不同于平常的研究性论文,其难度和复杂程度要大得多;同时,导师对于留学毕业论文的要求又非常严格。因此写好一篇优…

[附源码]SSM计算机毕业设计教务系统JAVA

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

跨境电商卖家必知的【圣诞节营销】终极指南(二)

关键词:圣诞节营销、跨境电商卖家 不知不觉又到了年底,而对于跨境电商来说也是非常重要的一段促销时期,上一篇文章我们探讨了一些圣诞节营销的创意方法,今天我们将告诉您完整的圣诞节营销指南。 1. 闪购和 FOMO 限时抢购是您的电…

ImmunoChemistry艾美捷基本细胞毒性试验试剂盒测定方案

ImmunoChemistry艾美捷基本细胞毒性试验试剂盒是一种通过流式细胞仪测定细胞毒性的单管双色试验。该试验使用绿色荧光细胞染色剂CFSE标记靶细胞,使用红色活/死活性染料7-AAD识别细胞毒性试验样品中存在的死细胞。使用流式细胞仪分析结果。 细胞裂解活性是清除细胞内…

D-012 时钟硬件电路设计

时钟硬件电路设计1 简介2 晶振电路中电容的选择3 时钟电路设计要点4 晶振选型5 电路实战1 简介 晶振时数字电路的心脏,数字电路需要一个稳定的工作时钟信号,时钟电路时硬件电路设计中不可或缺的一个重要内容。晶振一般指晶体振荡器。而在封装内部添加 I…

Shell脚本学习指南(四)——管道的神奇魔力

文章目录前言从结构化文本文件中提取数据针对Web的结构型数据文字解谜好帮手单词列表标签列表前言 当你在UNIX里对付文字处理作业时,必须谨记一个UNIX工具使用原则就是:想清楚这个问题该如何划分为更简单的工作,每个部分是不是已有现成的工具…

Servlet上传文件

一、核心方法 1、HttpServletRequest类相关方法 方法描述Part getPart(String name)获取请求中给定name的文件Collection<Part> getParts()获取所有的文件 2、Part类相关方法 方法描述String getSubmittedFileName()获取文件名String getContentType()获取文件类型…

【Hack The Box】Linux练习-- Knife

HTB 学习笔记 【Hack The Box】Linux练习-- Knife &#x1f525;系列专栏&#xff1a;Hack The Box &#x1f389;欢迎关注&#x1f50e;点赞&#x1f44d;收藏⭐️留言&#x1f4dd; &#x1f4c6;首发时间&#xff1a;&#x1f334;2022年11月17日&#x1f334; &#x1f36…

Docker——镜像操作命令

目录 一、镜像操作命令 1.1 镜像操作命令&#xff08;常用图示&#xff09; 1.2 查看docker帮助文档 1.3 案例&#xff1a;从DockerHub拉取Nginx镜像并查看 1.3.1 拉取 1.3.2 查看 1.4 案例&#xff1a;利用docker save将Nginx镜像导出磁盘&#xff0c;然后再通过load加…

一文讲清场景工程方法论及运维组织能力内化

随着业务支撑要求的变化&#xff0c;和技术架构的升级&#xff0c;运维管理建设模式跟之前也有了很大区别&#xff0c;场景上更注重主动工作、防范风险&#xff0c;而体系上更注重赋能组织、平台化、一体化。 因而&#xff0c;我们基于过去几年的大量客户实践&#xff0c;分享…

关于HashMap默认容量的选择

HashMap默认容量思量什么是容量容量与哈希hash的实现指定容量初始化扩容思考总结集合是Java开发日常开发中经常会使用到的&#xff0c;而作为一种典型的K-V结构的数据结构&#xff0c;HashMap对于Java开发者一定不陌生。 在日常开发中&#xff0c;经常会像如下方式创建一个Has…

使用IntelliJ IDEA创建Maven项目并上传项目至gitlab等远程仓库

步骤&#xff1a; 新建Maven项目&#xff0c;添加web.xml文件&#xff0c;只编写一个html页面用于测试&#xff0c;tomcat部署&#xff0c;配置git&#xff0c;上传到gitlab 1. Maven创建Web项目&#xff0c;命名为testci 2. 点击File —> Project Structure —>Facets—…

分享35个ASP源码,总有一款适合您

链接&#xff1a;https://pan.baidu.com/s/1t-Biw9LihpPwrwfJNLoTPw?pwdfxol 提取码&#xff1a;fxol 下面是文件的名字&#xff0c;我放了一些图片&#xff0c;文章里不是所有的图主要是放不下...&#xff0c;大家下载后可以看到。 40400互联网上报名系统 医院会员注册系统…

132-142-Hadoop-Yarn-常用命令生产环境等配置

132-Hadoop-Yarn-常用命令生产环境等配置&#xff1a; Yarn常用命令&#xff1a; 1、启动集群 2、执行一个案例 [roothadoop102 hadoop-3.1.4]# hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.4.jar wordcount /input /ouput013、查看结果 yarn applic…

【云原生 | Kubernetes 实战】02、k8s 核心资源 Pod 介绍

目录 一、Pod是什么&#xff1f; 白话解释&#xff1a; 1.1 Pod如何管理多个容器&#xff1f; 1.1.2 Pod网络 1.1.3 Pod存储 1.2 之前学习过容器&#xff08;如docker&#xff09;&#xff0c;为什么还需要Pod&#xff1f; 1.2.1 代码自动发版更新 1.2.2 收集业务日志 …

【Kubernetes系列】工作负载资源之ReplicaSet

文章目录概述工作原理何时使用示例ReplicaSet的配置Pod 模板Pod 选择算符Replicas操作使用ReplicaSet删除 ReplicaSet 和它的 Pod只删除 ReplicaSet将 Pod 从 ReplicaSet 中隔离扩缩 ReplicaSetReplicaSet 的替代方案Deployment&#xff08;推荐&#xff09;裸 PodJobDaemonSet…

twitter推文采集案例

案例内容:twitter的推文采集。 通过游客身份获取twitter中用户的推文。 用户推文:只能翻22页,1页45条左右。 每个用户最多获取最近900条推文 (登录后),不登录区别也不大。 UserByScreenName 一般只有用户名的时候,需要先通过UserByScreenName接口获取 rest_id 用于后…

frp穿透你的远程桌面

缘起 作为一个程序员&#xff0c;经常会遇到需要使用远程桌面的述求&#xff08;居家办公、加班&#xff0c;你懂的&#xff09;。所以&#xff0c;在网上找一圈远程桌面解决方案之后&#xff0c;最终还是使用frp来穿透远程桌面。&#xff08;推荐使用&#xff09; 前提 需要…

计算机内功修炼:程序的机器级表示(C与汇编)

程序的机器级表示历史观点程序编码1. 机器级代码2. 代码示例数据格式访问信息1. 操作数指示符2. 数据传送指令算术与逻辑操作1. 加载有效地址2. 一元操作和二元操作3. 移位操作例子特殊的算术操作控制1. 条件码2. 访问条件码3. 跳转指令及编码4. 翻译条件分支5. 循环6. 条件传送…

[附源码]计算机毕业设计JAVA龙虎时代健身房管理系统

[附源码]计算机毕业设计JAVA龙虎时代健身房管理系统 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM …