【机器学习西瓜书学习笔记——概率图模型】

news2025/1/6 19:24:38

机器学习西瓜书学习笔记【第十四章】

第十四章 概率图模型

概率图模型分类

  • 第一类使用有向无环图表示变量之间的因果关系,称为有向图模型或贝叶斯网络;

  • 另一类使用无向图表示变量之间的相关关系,称为无向图模型或马尔可夫网,马尔可夫随机场。

14.1 隐马尔可夫模型

贝叶斯网络

在一个贝叶斯网络中:

  • 节点表示一个或一组随机变量
  • 边表示变量之间的依赖关系

一种图模型,表示随机变量之间的概率关系。每个节点都与一个概率分布相关,该分布描述了给定其父节点值时该节点的条件概率分布。

img

马尔科夫链

定义:描述了在一系列离散事件中,从一个状态转移到另一个状态的过程。

马尔可夫性:当前时刻的状态只依赖于前一时刻的状态,与更久的状态无关。

img

隐马尔科夫模型

**隐马尔可夫模型( H M M HMM HMM)**是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。

14.2 马尔可夫随机场( M R F MRF MRF)

定义:具有马尔可夫属性的随机变量的集合,由一个无向图来描述。

核心:处理的是联合概率。

马尔可夫场定理

马尔科夫随机场的理论基石是马尔科夫场定理,它描述了一个随机变量集合中,若任意一个变量的条件概率仅依赖于其相邻节点的取值(局部马尔科夫性),则该集合构成一个马尔科夫随机场。

算法原理

马尔科夫随机场的核心算法主要包括概率推理和参数学习两部分。

概率推理

主要解决给定模型参数下,求解数据观测值对应的潜在变量分布或边缘概率的问题。常见的概率推理方法包括精确推理(如信念传播、变分推理)和近似推理(如MCMC采样、Loopy Belief Propagation)。这些方法利用马尔科夫随机场的局部马尔科夫性和无向图结构,通过消息传递、能量最小化或采样技术来估计模型的后验概率分布。

参数学习

目的是从观测数据中学习马尔科夫随机场的参数,如势函数或因子权重。常用的参数学习算法包括最大似然估计、最大后验概率估计、变分贝叶斯方法等。这些方法通常涉及优化问题的求解,如梯度下降、牛顿法、EM算法等,以最大化模型对观测数据的拟合度。

算法对比

与朴素贝叶斯对比朴素贝叶斯假设特征之间相互独立,而马尔科夫随机场允许建模特征间的依赖关系,因此在处理具有复杂关联的数据时,马尔科夫随机场通常能获得更好的性能。

与深度学习对比:深度学习模型如卷积神经网络(CNN)在图像处理等领域展现出强大能力,但其黑箱特性限制了模型解释性。相比之下,马尔科夫随机场通过显式建模变量间的依赖关系,具有更好的可解释性。然而,深度学习模型在大量标注数据的支持下,可能在某些任务上达到更高的精度。

14.3 条件随机场( C R F CRF CRF)

核心:处理的是条件概率

条件随机场是一种用于序列标注(sequence labeling)的概率模型。它是马尔可夫随机场的一种扩展,可以用无向图来表示输入序列和输出序列之间的条件依赖关系。条件随机场的每个节点对应一个输出标签每条无向边表示两个相邻标签之间的相关性,每个节点的概率分布输入序列和相邻节点的取值共同决定。

优缺点

优点
  • 利用丰富的特征来描述输入序列和输出序列之间的复杂关系,而不受马尔可夫假设的限制

  • 在全局范围内对输出序列进行建模,而不是局部地对每个输出标签进行建模,从而避免了标注偏置问题。

  • 通过无向图来表示输出序列的依赖结构,而不是有向图,从而避免了循环依赖问题

缺点
  • 训练和预测过程都比较耗时(特别是当特征的个数和标签的个数很大时,计算归一化因子和最优序列的代价很高)。

  • 特征选择和权重调整都需要人工干预,没有自动化的方法来确定最优的特征组合和权重分配。

  • 模型参数和特征函数都是固定的,不能随着数据的变化而自适应地更新和调整。

链式条件随机场

在CRF的定义中,我们并没有要求XX和YY有相同的结构。而实现中,我们一般都假设 X X X Y Y Y有相同的结构,即: X = ( X 1 , X 2 , . . . X n ) , Y = ( Y 1 , Y 2 , . . . Y n ) X=(X1,X2,...Xn),Y=(Y1,Y2,...Yn) X=(X1,X2,...Xn),Y=(Y1,Y2,...Yn) X X X Y Y Y有相同的结构的 C R F CRF CRF就构成了线性链条件随机场( l i n e a r − C R F linear-CRF linearCRF)。

img

14.4 学习与推断

对于生成式模型,通常我们都是先对变量的联合概率分布进行建模,接着再求出目标变量的边际分布

从联合概率得到边际分布,使用的是学习与推断

变量消去

变量消去利用条件独立性来消减计算目标概率值所需的计算量,它通过运用乘法与加法的分配率,将对变量的积的求和问题转化为对部分变量交替进行求积与求和的问题,从而将每次的运算控制在局部,达到简化运算的目的。

img

img

信念传播

若将变量求和操作看作是一种消息的传递过程,信念传播可以理解成:一个节点在接收到所有其它节点的消息后才向另一个节点发送消息,同时当前节点的边际概率正比于他所接收的消息的乘积:

学习与推断 - 图3

因此只需要经过下面两个步骤,便可以完成所有的消息传递过程。利用动态规划法的思想记录传递过程中的所有消息,当计算某个结点的边际概率分布时,只需直接取出传到该结点的消息即可,从而避免了计算多个边际分布时的冗余计算问题。

  • 指定一个根节点,从所有的叶节点开始向根节点传递消息,直到根节点收到所有邻接结点的消息**(从叶到根)**;
  • 从根节点开始向叶节点传递消息,直到所有叶节点均收到消息**(从根到叶)**。
  • 学习与推断 - 图4

14.5 近似推断

精确推断方法计算开销大,因此在现实应用中近似推断方法更为常用。

近似推断方法大致可以分为两类:

  • 采样法:通过使用随机化方法完成近似,如 M C M C MCMC MCMC采样;

  • 变分推断:使用确定性近似完成推断。

M C M C MCMC MCMC采样

采样是为了评估一个函数在某个分布上的期望值。

M C M C MCMC MCMC采样方法:先设法构造一条马尔可夫链?使其收敛至平稳分布 恰为待估计参数的后验分布?然后通过这条马尔可夫链来产生符合后验分布的 样本,并基于这些样本来进行估计。

M C M C MCMC MCMC方法的关键就在于通过构造"平稳分布为p的马尔同夫链" 来产生样本:若马尔可夫链运行时间足够长(即收敛到平稳状态),则此时产出 的样本x近似服从于分布p 。

变分推断

变分推断通过使用已知简单分布来逼近需推断的复杂分布,并通过限制近似分布的类型,从而得到

一种局部最优、但具有确定解的近似后验分布。

14.6 话题模型

话题模型是一类生成式有向图模型,主要用来处理离散型的数据集合(如文本集合)。其中隐狄利克雷分配模型 L D A LDA LDA)是话题模型的杰出代表。在话题模型中,有以下几个基本概念:词、文档、话题。

:最基本的离散单元;
文档:由一组词组成,词在文档中不计顺序;
话题:由一组特定的词组成,这组词具有较强的相关关系。
在现实任务中,一般我们可以得出一个文档的词频分布,但不知道该文档对应着哪些话题,LDA话题模型正是为了解决这个问题。具体来说:LDA认为每篇文档包含多个话题,且其中每一个词都对应着一个话题。因此可以假设文档是通过如下方式生成:

img

这样一个文档中的所有词都可以认为是通过话题模型来生成的,当已知一个文档的词频分布后(即一个N维向量,N为词库大小),则可以认为:每一个词频元素都对应着一个话题,而话题对应的词频分布则影响着该词频元素的大小

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2046619.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis -LFU(Least Frequently Used,最少使用频率)缓存淘汰算法

在 Redis 的 LFU(Least Frequently Used,最少使用频率)缓存淘汰算法中,lru 字段被拆分成两部分:高 16 位存储 ldt(Last Decrement Time),低 8 位存储 logc(Logistic Coun…

【图像特效系列】卡通特效的实践 | 包含代码和效果图

目录 一 卡通特效 代码 效果图 图像特效系列主要是对输入的图像进行处理,生成指定特效效果的图片。图像素描特效会将图像的边界都凸显出来;图像怀旧特效是指图像经历岁月的昏暗效果;图像光照特效是指图像存在一个类似于灯光的光晕特效,图像像素值围绕光照中心点呈圆形范…

【就业】中国铁路人才招聘

中国国家铁路集团有限公司,是中国财政部直接出资的大型国有企业,与国资委直接管理的央企不同,它是由财政部代表国务院履行出资人职责 ,由中央管理的国有独资公司。其前身是由国家铁道部政企分离后剥离出来的全民所有制企业&#x…

Docker 基础—— 数据卷

1.数据卷 容器是隔离环境,容器内程序的文件、配置、运行时产生的容器都在容器内部,我们要读写容器内的文件非常不方便,例如: 如果要升级MySQL版本,需要销毁旧容器,那么数据岂不是跟着被销毁了? …

idea安装二进制文本阅读插件

引言 在软件开发过程中,有时需要查看二进制文件的内容以调试或分析问题。虽然有许多专用工具可以处理这类任务,但直接在 IDE 内集成这些功能无疑更加方便高效。本文将介绍如何在 IntelliJ IDEA 2023中安装和配置一个名为 BinEd的插件,以及如…

Python实验-选择结构

实验目的 (1)掌握条件语句中逻辑表达式的正确书写规则 (2)掌握单分支、双分支和多分之条件语句的使用方法 实验内容 1.某校三好学生的评定标准为:语文和数学两科的平均成绩大于90,且每科成绩不低于85分&…

人工智能系统测试生命周期详解之测试分析

前面的文章里我们已经整体介绍过了人工智能测试的生命周期,它需要经历测试需求的分析、测试环境的准备、数据的准备与验证、测试的执行预分析以及上线后的监控这样一个过程。前面的文章已经为大家介绍了人工智能系统测试生命周期的“需求分析”环节、“测试环境准备…

【TCP协议】

一、TCP分层 TCP/IP协议是Internet互联网中最基本的协议,其在一定程度上参考了OSI七层模型,但在TCP/IP协议中,七层被简化成了四层,如下: OSI模型TCP/IP协议第七层应用层 应用层 HTTP/FTP/SMTP/Telnet 第六层显示层第…

UI设计:具备什么特征,就可以被认定为时尚风格

一、时尚风格的特征 时尚风格的UI设计通常具备以下一些特征: 扁平化设计:时尚风格的UI设计通常采用扁平化的设计风格,包括简洁的图标、清晰的排版和简约的色彩搭配。极简主义:时尚风格的UI设计追求极简主义,注重简洁、…

CAN总线-----帧格式

目录 前言 一、CAN总线帧格式分类 1.数据帧(重点) 2.遥控帧 3.错误帧 4.过载帧 5.间隔帧 二、位填充 三、波形实例 前言 本期我们就开始学习CAN总线的帧格式,对应帧格式的话,在前面我们学习I2C协议和SPI协议等协议的时候…

gitlab修改默认访问端口

GitLab 自带了一个 Nginx 服务器实例,用于处理 HTTP 和 HTTPS 请求。这个内置的 Nginx 服务器被配置为与 GitLab 应用程序实例一起工作,并且它负责处理所有前端的网络通信。 通过yum或者apt安装Gitlab时,nginx通常是被自带安装并配置好的。 …

基于C# winform部署图像动漫化AnimeGANv2部署onnx模型

【界面截图】 【效果演示】 【部分实现代码】 using System; using System.Diagnostics; using System.Windows.Forms; using OpenCvSharp;namespace FIRC {public partial class Form1 : Form{Mat src null;public Form1(){InitializeComponent();}private void button1_Cli…

10 Checkbutton 组件

10 Checkbutton 组件 Tkinter 是 Python 的标准 GUI 库,它提供了一系列的控件来创建图形用户界面。Checkbutton 是其中的一个组件,用于创建可以被选中或取消选中的按钮,通常用于实现布尔值的开关功能。 创建 Checkbutton 创建一个基本的 C…

Linux运维篇-误删/bin,/sbin目录怎么修复系统

这里写自定义目录标题 前言实例挂载镜像,重启系统进入救援模式拷贝镜像系统中的/bin和/sbin目录到原系统重启系统 总结 前言 当你看到这篇文章的时候,你的系统可能已经无法登录,或者正在处于登录状态但是不能执行任何常规的命令,…

学习vue 九 nextTick 函数式编程 编译宏 环境变量

nextTick js事件循环机制 所有的同步任务都是在主进程执行的形成一个执行栈,主线程之外,还存在一个"任务队列",异步任务执行队列中先执行宏任务,然后清空当次宏任务中的所有微任务,然后进行下一个tick如此…

android13禁用打开wifi ap 热点

总纲 android13 rom 开发总纲说明 目录 1.前言 2.情况分析 3.代码分析 4.代码修改 5.彩蛋 1.前言 这个文章介绍的是如何禁止用户打开wifi热点,禁止用户安装app后,打开wifi热点。 2.情况分析 android13 应用层打开wifi AP public void setWifiApEnabled(boolean isEn…

XSS小游戏(题目+解析)

xss题目练习地址&#xff1a; xss小游戏 游戏界面 一、Ma Spaghet! 我将题目要求进行翻译: 题目的主要要求就是&#xff1a;弹出一个&#xff08;1337&#xff09;的弹窗 开始解题&#xff1a; Let’s Go! 首先&#xff0c;传个参数看看 发现参数直接显示在了 < h2 >…

.bat文件快速运行vue项目

如何使用bat文件快速运行vue项目&#xff1f; 新建个文件&#xff0c;改名为serve.bat。 在文件中写入以下内容&#xff1a; # cd 项目路径 cd D:\projects\xxx npm run serve pausecd 项目所在的路径 npm run dev/serve &#xff0c;取决于项目的启动方法&#xff0c;打…

三维重建理论

应用领域&#xff1a; 三维重建基础&#xff1a; 相机成像 三维重建算法&#xff1a;

20240817 每日AI必读资讯

知网状告AI搜索&#xff1a;搜到我家论文题目和摘要&#xff0c;你侵权了&#xff01; - 知网指责秘塔AI搜索侵犯合法权益&#xff0c;要求断开链接并商务合作 - 秘塔AI搜索强调学术文献的开放获取对知识公平获取和科学研究至关重要 - 团队决定尊重知网选择&#xff0c;不再…