概率图降低表示需要的参数指的是什么?(贝叶斯网络) 结构化概率模型

news2025/1/16 1:43:50

深度学习中经常要对概率密度建模。对于多维度随机变量来说,这有些困难。概率化结构(既图模型)是处理这个问题的手段之一。这引出了两个问题。为什么建模困难?图模型怎样解决了这个困难?

关于这个问题,花书给出了回答。关于图模型解释主要是围绕展开可以降低参数量展开。很多博客也对此进行了回答,但我对那些回答并不满意。这些博客多是摘取了书中的几句话,也不说清楚参数多在哪里。在我看来,发这样的笔记,不如保存本地不要发布。

结构化数据

很多随机变量之间是有相互关系的,比如图片生成。相邻的两个像素之间关联很大。对于一张3232的黑白图片,我们想要表示概率密度函数,就需要表示3232*2种情况,也就是 32 ∗ 32 ∗ 2 个 32*32*2个 32322参数。也就是每一个情况的概率值,都用一个参数表示。我们知道,所有情况概率和为1,所以知道 32 ∗ 32 ∗ 2 − 1 个 32*32*2-1个 323221参数即可。这时候如果考虑了随机变量之间的关联性是怎样的,便可以减少表示所用的参数,简化问题。

贝叶斯网络如何减少参数?

拿我自己博客的例子:

  • 谈到毕业生的薪水时,我们很感兴趣的两个随机变量是 X 1 X_{1} X1为哪个学校毕业, X 2 X_{2} X2为薪水多少。在这个随机试验里, P ( X 2 = 高薪 ∣ X 1 = 清华大学 ) > P ( X 2 = 高薪 ∣ X 1 = 10422 ) P(X_{2}=高薪|X_{1}=清华大学)>P(X_{2}=高薪|X_{1}=10422) P(X2=高薪X1=清华大学)>P(X2=高薪X1=10422)
  • 对于身高,以父母身高为 X 1 和 X 2 X_{1}和X_{2} X1X2,孩子身高为 X 3 X_{3} X3,成长省份为 X 4 X_{4} X4,苹果手机今年的发布价格为 X 5 X_{5} X5,苹果手机的销量为 X 6 X_{6} X6。在这个随机试验里, P ( X 1 = 1.7 , X 2 = 1.7 , X 3 = 1.7 , X 4 = 湖南 , X 5 = 9 k ) = P ( X 1 = 1.7 , X 2 = 1.7 , X 3 = 1.7 , X 4 = 湖南 ) P(X_{1}=1.7,X_{2}=1.7,X_{3}=1.7,X_{4}=湖南,X_{5}=9k)=P(X_{1}=1.7,X_{2}=1.7,X_{3}=1.7,X_{4}=湖南) P(X1=1.7,X2=1.7,X3=1.7,X4=湖南,X5=9k)=P(X1=1.7,X2=1.7,X3=1.7,X4=湖南)。很明显苹果手机的价格和身高这几个随机变量无关。

随机变量之间存在着复杂的关系。从上面的例子看出,我们研究的部分随机变量存在关联,有些不存在关联。直接求解联合概率分布显然是非常复杂的。当我们知道各个随机变量之间的依赖关系时,便可以通过概率图模型降低求解联合分布的难度。随机变量间是有向、无环关系的时候,这种概率图结构就是贝叶斯网络。(无向时为马尔可夫随机场,另一种概率图)

对一个学生能否拿到的薪水进行建模。假设相关的随机变量有5个 X 1 X_{1} X1~ X 5 X_{5} X5分别是
高考成绩、学校招生人数、就读大学、大学成绩、薪水。
我们关心的是随机变量间的关系,直接用一张图表示出来

请添加图片描述

显然从图中可以看出各个变量的依赖关系。这张图体现了2个要素:有向、无环。距离一个完整的贝叶斯网络只差一部,那便是求出多维随机变量的分布。
要求分别,那先明确各个变量的取值(或者说给图的节点定义):

  • 高考成绩 X 1 X_{1} X1:高分、低分
  • 招生人数 X 2 X_{2} X2:多、中、少
  • 入读大学 X 3 X_{3} X3:清华大学、北京城市学院
  • 大学成绩 X 4 X_{4} X4:高分、普通、低分
  • 薪水 X 5 X_{5} X5:高薪、低薪

问题介绍完了。如果直接建模需要多少参数?

2 ∗ 3 ∗ 2 ∗ 3 ∗ 2 = 72 2*3*2*3*2=72 23232=72
也就是说我们需要表示出:

P ( X 1 = 高分 , X 2 = 多 , X 3 = 清华大学 , X 4 = 高分 , X 5 = 高薪 ) = θ 1 P(X_{1}=高分,X_{2}=多,X_{3}=清华大学,X_{4}=高分,X_{5}=高薪)=\theta_{1} P(X1=高分,X2=,X3=清华大学,X4=高分,X5=高薪)=θ1
P ( X 1 = 低分 , X 2 = 多 , X 3 = 清华大学 , X 4 = 高分 , X 5 = 高薪 ) = θ 2 P(X_{1}=低分,X_{2}=多,X_{3}=清华大学,X_{4}=高分,X_{5}=高薪)=\theta_{2} P(X1=低分,X2=,X3=清华大学,X4=高分,X5=高薪)=θ2
P ( X 1 = 高分 , X 2 = 中 , X 3 = 清华大学 , X 4 = 高分 , X 5 = 高薪 ) = θ 3 P(X_{1}=高分,X_{2}=中,X_{3}=清华大学,X_{4}=高分,X_{5}=高薪)=\theta_{3} P(X1=高分,X2=,X3=清华大学,X4=高分,X5=高薪)=θ3
. . . ... ...
一直遍历所有情况。右边的 θ \theta θ便是这种模型表示下的参数。

如果用了贝叶斯网络,那么概率密度可以表示成如下的形式:

P ( X 1 , X 2 , X 3 , X 4 , X 5 ) = P ( X 1 ) P ( X 2 ) P ( X 3 ∣ X 1 , X 2 ) P ( X 4 ) P ( X 5 ∣ X 3 , X 4 ) P(X_{1},X_{2},X_{3},X_{4},X_{5})=P(X_{1})P(X_{2})P(X_{3}|X_{1},X_{2})P(X_{4})P(X_{5}|X_{3},X_{4}) P(X1,X2,X3,X4,X5)=P(X1)P(X2)P(X3X1,X2)P(X4)P(X5X3,X4)

这意味着:1.我们只需要分别表示出各项,再通过计算,得出联合概率密度。
2.每个单独的一项,又可以用概率合为1的规定。
这两条极大的减少了我们需要表示的情况。

P ( X 1 = 高分 ) = θ 1 P(X_{1}=高分)=\theta_{1} P(X1=高分)=θ1
P ( X 1 = 低分 ) = 1 − θ 1 P(X_{1}=低分)=1-\theta_{1} P(X1=低分)=1θ1

P ( X 2 = 多 ) = θ 2 P(X_{2}=多)=\theta_{2} P(X2=)=θ2
P ( X 2 = 中 ) = θ 3 P(X_{2}=中)=\theta_{3} P(X2=)=θ3
P ( X 3 = 少 ) = 1 − θ 2 − θ 3 P(X_{3}=少)=1-\theta_{2}-\theta_{3} P(X3=)=1θ2θ3

X 1 需要 1 个, X 2 需要 1 个, X 3 需要 4 个 , X 4 需要 3 个 , X 5 需要 6 个。总共是 15 个 X_{1}需要1个,X_{2}需要1个,X_{3}需要4个,X_{4}需要3个,X_{5}需要6个。总共是15个 X1需要1个,X2需要1个,X3需要4,X4需要3,X5需要6个。总共是15
可以看出,这样的做法确实降低了模型的参数量。通过这样的方式,我们依然可以得到所有情况,也就是72种情况各自对应的概率。先计算出各个分项的参数,随后通过乘积的方式计算出那个想要表示的联合概率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/435646.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图片怎么压缩到200K以内,这3个图片压缩方法,简单有效

你没有遇到过上传图片到网站的时候,图片太大不能上传的情况?还有,许多报名照片要求小于200K,可是照片超过这个大小,应该如何压缩呢?下面我给大家带来3个图片压缩的方法,既能快速压缩图片大小&am…

深度学习技巧应用7-K折交叉验证的实践操作

大家好,我是微学AI,今天给大家介绍一下深度学习技巧应用7-K折交叉验证的实践操作。K折交叉验证是一种机器学习中常用的模型验证和选择方式,它可以将数据集分为K个互斥的子集,其中K-1个子集作为训练集,剩下1个子集作为验…

Hive设置元数据支持中文显示

在hive中建外部表时遇见到这样一个问题,就是表字段的中文注释在desc 表结构时看不了,发现原来是Hive的元数据库没有设置支持中文显示 第一步,在元数据库metastore完成初始化后,再次登录MySQL [roothurys24 hurys_table_data]# m…

成功解决:OSError: [E050] Can’t find model ‘en_core_web_sm’.

成功解决OSError: [E050] Can’t find model ‘en_core_web_sm’. 问题描述 在安装spacy包之后,再加载’en_core_web_sm’语言模型时,报出OSError: [E050] Can’t find model ‘en_core_web_sm’. It doesn’t seem to be a Python package or a valid…

【Java】插入排序和希尔排序---图解超详细

目录 插入排序 插入排序的核心图解 希尔排序 希尔排序详细图解 插入排序 插入排序的交换精髓在于 每次随着i的扩大,i走过的路径都是有序的,这和冒泡的思想有异曲同工之处,冒泡是i走一次,数组的最后变成有序的,而插入排序是 插入排序是 i 在前面 j在后面 插入排序的核心图解…

C- 符号

文章目录 符号#ifdef-#endif\接续符转义旋转光标数字倒计时 单引号-双引号逻辑运算符&& ||短路 位运算符异或位运算最好使用定义好的宏左移右移 后置前置复杂表达式 取整0向取整(C中默认取整方式)floor地板取整ceilround 四舍五入 取模取余和取模一样吗? 运算符优先级…

两小时让你全方位的认识文件(一)

想必友友们在生活中经常会使用到各种各样的文件,那么我们是否了解它其中的奥秘呢,今天阿博就带领友友们深入地走入文件🛩️🛩️🛩️ 文章目录 一.为什么使用文件二.什么是文件三.文件的打开和关闭四.文件的顺序读写 一…

网页自动化工具DrissionPage

逛Github时偶然看到的开源项目,DrissionPage是一款新的基于 python 的网页自动化工具。 笔者已测试过,给大家推荐下。 项目地址:https://gitee.com/g1879/DrissionPage 安装测试 安装命令 pip install DrissionPage测试 from Drissio…

unity | 处理string常用的知识(持续更新)

一、转义字符和的用法 1.常规用法 我们现在有一行字,但是我对它的格式之类的有要求 例:天无绝人之路,条条道路通罗马。 我想打成: 天无绝人之路, 条条道路通罗马。 换行前,写法是: string s …

科海思—美国杜笙Tulsimer中国区总代理,制糖脱色树脂A-722

一、产品介绍 具有控制孔径的大孔强碱性Ⅰ型阴特种脱色用离子交换树脂 Tulsimer A-722是一款具有便于颜色和有机物去除的控制孔径的,专门开发的大孔强碱性Ⅰ型阴离子交换树脂。 Tulsimer A-722 (氯型)专门应用于糖浆脱色。 Tulsimer A…

Python学习简记

常用数据类型 整数类型int 二进制以0b开头八进制以0o开头十六进制以0x开头 这里还有一个值得注意的点:python中的整型是“无限长”的,因此它可以表示任何数 浮点数 python中只有float作为浮点数,没有double 主要注意python中对浮点数与Decima…

Spring系统架构与主要概念

Spring系统架构与主要概念 Spring Framework系统架构Core Container 核心容器AOP 层数据层Web层测试层 业务逻辑Spring之前遇到的问题解决方案 Spring核心概念IOC(Inversion of Control)控制反转DI(Dependency Injection)依赖注入…

SRv6实践项目(四):基于YANG的配置下发

在本章节,主要是了解YANG是什么,以及基于YANG下发配置的工作原理: 1.什么是YANG 在介绍之前,为了给大家一个最直观的感受,我们打开yang工具,它被打包成一个容器了,可以轻松的使用,…

完美解决丨1. **`SyntaxError: invalid syntax`**

SyntaxError: invalid syntax 因为没有符合语法要求,导致报错。 解决办法: 语法错误的原因主要是代码的风格,例如: 左括号或者右括号没有配对;左括号或者右括号没有放在语句的正确位置;缺少冒号&#xff1…

Window10下安装DPDK

由于我装的是vs2019,打开Visual Studio Installer,在可选下,选择Windows 10 SDK,点击修改。 右键此电脑属性,查看Windows10版本。 安装WDK,打开网址https://learn.microsoft.com/zh-cn/windows-hardware/…

计算机系统-链接

例行前言: 本篇不是学习课程时的笔记,是重看这本书时的简记。对于学习本课程的同学,未涉及的内容不代表考试不涉及,部分省略的部分是在该课程的讨论课中学习的(PIC,放出了我在讨论课中的PPT作为参考),核心…

Sentinel使用

文章目录 一. 初识Sentinel1. 雪崩问题及解决方案2. 服务保护技术对比3. Sentinel介绍和安装4. 微服务整合Sentinel 二. 限流规则1. 快速入门2. 流控模式3. 流控效果4. 热点参数限流 三. 隔离与降级—调用方保护方案1. FeignClinet整合sentinel2. 线程隔离(舱壁模式…

vue3中的单文件组件<script setup>和setup函数区别 详解

文章目录 简介基本语法变量和方法多的使用注册组件动态组件使用外部文件方法组件通信props与defineProps、emitdefineEmitsdefineExpose 获取 attrs、slots 和useAttrs、useSlots 方法与普通的 < script > 一起使用v-bind() CSS变量注入style的新特性之global对await异步…

行业认可,知道创宇入选安全牛第十版全景图30个细分领域

近日&#xff0c;国内网络安全领域专业媒体安全牛正式发布了第十版《中国网络安全行业全景图》&#xff08;以下简称“全景图”&#xff09;&#xff0c;知道创宇凭借过硬的技术实力及成熟的市场应用获得行业认可&#xff0c;入围10项一级安全分类共计30项二级细分领域&#xf…

ASEMI代理ADI亚德诺AD8130ARZ-REEL7车规级芯片

编辑-Z AD8130ARZ-REEL7芯片参数&#xff1a; 型号&#xff1a;AD8130ARZ-REEL7 −3dB带宽&#xff1a;250MHz 0.1 dB平坦度的带宽&#xff1a;25MHz 斜率&#xff1a;930V/μs 建立时间&#xff1a;20ns 上升和下降时间&#xff1a;1.5ns 输出超速恢复&#xff1a;30n…