机器学习---贝叶斯网络与朴素贝叶斯

news2025/4/15 22:01:47

1. 贝叶斯法则

如何判定一个人是好人还是坏人?

当你无法准确的熟悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的次数来判断

其本质属性的概率如果你看到一个人总是做一些好事,那这个人就越可能是一个好人。

数学语言表达就是:支持某项属性的事件发生得越多,则该属性成立的可能性就越大。

贝叶斯法则来源于英国数学家贝叶斯(Thomas Bayes)在1763年发表的著作论有关机遇问题

的求解

贝叶斯法则最初是一种用于概率论基础理论的归纳推理方法,但随后被一些统计学学者发展为一种

系统的统计推断方法,运用到统计决策、统计推断、统计估算等诸多领域。

贝叶斯公式:定义一:假定某个过程有若干可能的前提条件,则表示人们事先对

前提条件Xi出现的可能性大小的估计,即先验概率。

定义二:假定某个过程得到了结果A,则表示在出现结果A的前提下,对前提条件Xi出现

的可能性大小的估计,即后验概率。

2. 贝叶斯法则算例

        全垄断市场条件下,只有一家企业M提供产品和服务。企业K考虑是否进入该市场。同时,企

业M为阻止K进入该市场采取了相应的投资行为,而K能否进入该市场完全取决于M为阻止其进入所

花费的成本大小。假设K并不知道原垄断者M是属于高阻挠成本类型还是低阻挠成本类型,但能确

定,如果M属于高阻挠成本类型,K进入市场时M进行阻挠的概率是20%;如果M属于低阻挠成本

类型,K进入市场时M进行阻挠的概率是100%。现设K认为M属于高阻挠成本企业的概率为70%

而在K进入市场后,M确实进行了商业阻挠。试以企业K角度,判断企业M为高阻挠成本类型概率。

利用贝叶斯公式建模:

前提条件:设M是高阻挠成本类型为X1,低阻挠成本类型为X2

结果:MK进行阻挠为A;

所求概率即为在已知结果 A的情况下,推断条件为X1的后验概率

已知 为0.2,为1,P(X1)0.7P(X2)0.3

根据贝叶斯公式可计算:

即,根据实际市场的运作情况,企业K可判断企业M为高阻挠成本类型的概率为0.32,换句话说,

企业M更可能属于低阻挠成本类型。

3. 贝叶斯网络

贝叶斯网络又称为信度网络,是基于概率推理的图形化网络。它是贝叶斯法则的扩展,而贝叶斯公

式则是这个概率网络的基础。贝叶斯网络适用于表达和分析不确定性和概率性事件,应用于有条件

地依赖多种控制因素的决策过程,可以从不完全、不精确或不确定的知识或信息中做出推理。

贝叶斯网络由Judea Pearl1988年提出,最初主要用于处理人工智能中的不确定信息。

符号B(D,G)表示一个贝叶斯网络,包括两个部分:

一个有向无环图(Directed Acyclic Graph, DAG)。它由代表变量的节点及连接这些节点的有向

边构成。其中,节点代表随机变量,可以是任何问题的抽象,如:测试值、观测现象、意见征询

等;节点间的有向边代表了节点间的互相关系(由父节点指向其后代节点)。

一个节点与节点之间的条件概率表(Conditional Probability Table, CPT)。如果节点没有任何

父节点,则该节点概率为先验概率。否则,该节点概率为其在父节点条件下的后验概率。

数学定义:贝叶斯网络B(D,P),D表示一个有向无环图,

是条件概率分布的集合,其中是D中节点Xi的父节点集合。在一个贝叶斯网络中,节点集合

,则其联合概率分布P(X)是此贝叶斯网络中所有条件分布的乘积:

这是一个最简单的包含3个节点的贝叶斯网络。其中,是节点A的概率分布(先验概率)

为节点B,C的概率分布(后验概率)。

贝叶斯网络的特性:

贝叶斯网络本身是一种不定性因果关联模型,它将多元知识图解可视化,贴切的蕴含了网络节点变

量之间的因果关系及条件相关关系;

贝叶斯网络具有强大的不确定性问题的处理能力,它用条件概率表达各个信息要素之间的相关关

系,能在有限的、不完整的、不确定的信息条件下进行知识学习和推理;

贝叶斯网络能有效的进行多源信息表达与融合,可将故障诊断与维修决策相关的各种信息纳入到网

络结构中,并按节点的方式统一进行处理与信息融合。

贝叶斯网络的缺陷:

研究如何根据数据和专家知识高效、准确的建立贝叶斯网络,是十多年来研究的热点之一,也是贝

叶斯网络更加广泛、有效地用于实际问题领域的关键和焦点之一。

目前对于这一类学习问题,主要有基于打分搜索的学习方法和基于依赖分析的学习方法,但前者

存在搜索空间巨大,可能收敛于局部最优解等问题,后者则存在节点之间的独立性或条件独立性判

断困难,高阶条件独立性检验的结果不够可靠等问题。

贝叶斯网络与马尔科夫链:

马尔科夫链蒙特卡罗(Markov Chain Monte CarloMCMC)方法是源于统计物理学和生物学的一

类重要的随机抽样方法,该方法广泛应用于机器学习、统计和决策分析等领域的高维问题的推理和

求积运算。

MHSMetropolis-Hasting Sampler)抽样算法作为MCMC方法中常用的抽样方法之一,通过构建

一条马尔科夫链,模拟一个收敛于Boltzmann分布的系统。将MHS抽样算法引入贝叶斯网络,能够

较好的解决进化学习方法中由于个体趋同而产生的早熟问题,保证算法的学习精度。

此外,针对其计算精度低、收敛速度较慢的不足,随机拟MCMC方法也具有一定的优越性。

不过,该算法存在的收敛速度慢和收敛性判断困难等问题仍未能得到有效解决。因此,如何更有效

地将MCMC方法用于贝叶斯网络的结构学习与推理学习成为近年来重要的研究方向之一。

4. 朴素贝叶斯

贝叶斯分类器是用于分类的贝叶斯网络。该网络中通常包含类节点C,其取值来自类集合               

;还包含一组节点表示用于进行分类的特征属性。对于贝叶斯网络分类器,若某一待分类的样本D,其分类特征值为,则样本D属于类别Ci的概

率 , 应满足:

由贝叶斯公式可以得到:

其中,可由领域专家的经验获得,而的计算较为困难。

贝叶斯网络分类器进行分类的两个阶段:

阶段一:贝叶斯网络分类器的学习(结构学习和CPT学习)

阶段二:贝叶斯网络分类器的推理(计算类节点的条件概率,对数据进行分类)

两个阶段的时间复杂度均取决于特征值间的依赖程度。

5. 贝叶斯分类器

根据对特征值间不同关联程度的假设,可以得出各种贝叶斯分类器,其中较典型、研究较深入的贝

叶斯分类器主要有四种,分别是:

NB Naïve BayesTAN Tree Augmented Naïve-Bayes

BAN BN Augmented Naïve-BayesGBNGlobal Bayesian Networks

朴素贝叶斯(Naïve Bayes)算法是贝叶斯分类器中研究较多,使用较广的一种,在许多场合,朴

素贝叶斯的分类算法可以与决策树和神经网络分类算法相媲美朴素贝叶斯分类器的基础假设一

个指定类别中各个属性的取值是相互独立的,在给定目标值的情况下,观察到联合的

的概率正好是对每个单独属性的概率乘积。

贝叶斯分类器: 

朴素贝叶斯简化:

考虑到是一个取max的过程,则对于结果不产生影响,故可以看作系数

a。则,原公式可以简化。

朴素贝叶斯分类器由DudaHart1937年提出,它是一个简单有效而且在实际使用中比较成功的

分类器。现在,被广泛的运用在数据挖掘、模式识别、故障诊断等众多领域。

朴素贝叶斯算法有很多优点:

应用范围广泛;可以很好的扩展到超大规模问题,并且不需要通过搜索来寻找最大后验概率的朴素

贝叶斯假设;可以轻松地应付有噪声的训练数据,并在适当的时候给出概率预测。

朴素贝叶斯分类器假设一个指定类别中各属性的取值是相互独立的。这一假设可以帮助有效减少在

构造贝叶斯分类器时所需要进行的计算量。不过,实际的应用领域中,各个属性相互独立的假设很

难成立,这也从很大程度上影响了朴素贝叶斯分类器的分类能力。当前,半朴素贝叶斯分类器、相

关属性删除、概率值条件、贝叶斯树以及懒惰贝叶斯规则方法,都是对朴素贝叶斯算法的改进与推

广,并在不同的领域取得了显著的成果。

6. 系统控制的应用

在信息技术迅速发展及其在军事领域广泛应用的条件下,防空作战环境变得愈加复杂,也给现代防

空作战中的空情探测带来了严峻的挑战。由于受到自身性能、电子干扰等因素的影响,不同的空情

雷达对同一空中目标的探测的准确度不同,从而影响了防控侦察预警信息的准确性,应用贝叶斯网

络算法探讨计算不同雷达在探测同一目标的可信度,通过数据融合推断出空中目标的类型,是贝叶

斯网络算法在系统可靠性领域的重要应用之一。

例子:假设两个空情雷达探测同一目标,目标可能的类型:A.大型战机、B.小型机密集编队、C.

小型战机、D.巡航导弹。在时刻t,一号空情雷达报告的条件概率表如表所示。

根据战前分析,假定权威人员预测战场中在某个作战阶段各种空袭兵器运用的概率为: 

那么在一号空情雷达报告信息中,报告目标类型大型战机、小型机密集编队、小型战机、巡航导弹

的概率分别为:P(A)P(B)P(C)P(D)

根据贝叶斯公式,则一号空情雷达报告目标类型为A的条件下,实际目标类型为ABCD的条

件概率分别为: 

表示传感器报告目标为类型A的条件下,实际目标为A的概率;  表示实际目标类

型为A的条件下,传感器报告目标类型为A的概率;P(A)表示存在类型为A的目标的先验概率;

表示所有传感器报告目标类型为A的概率之和,即

同样可以计算出一号空情雷达报告类型分别为BCD的条件下,实际目标类型的条件概率,如下

表所示:

于是,一号空情雷达报告假设目标类型为A的可信度为: 

同理可以得到第一号传感器报告假设目标类型为BCD的可信度,即  

为了提高探测的准确性,一般要设置一个可信度阈值,将计算出的可信度值与可信度阈值 比

较,看目标识别的可信度是否达到要求。假设,则以上的可信度值没有一个达到要求,因

此需要重新进行识别,将以上计算的可信度值作为下一次计算的先验概率。 

现略去计算步骤,可得到基于两个传感器报告的目标类型为ABC、D的可信度为:

 。同样假设,则可以知道B的可信度大

于阈值,则可判定,空中目标类型为B

7. 信息检索中的应用

贝叶斯网络检索模型可以计算术语与术语,术语与文档之间的条件概率。下图给出了一种贝叶斯网

络检索模型,利用同义词对查询术语进行扩展,用于信息检索领域。

假设有文档集合d表示为;这些文档的索引术语集合r表示为。右图即为贝叶斯网络模型扩展的拓扑结构,其中Q被定义为查询术语节点,定义为文档节点,定义为索引术语节点,有一条指向被它索引的文档的弧。 

用两个术语层来挖掘文档索引术语之间的关系,完全复制初始术语节点层r,得到另一个属于节点

t。对于查询术语Q,在索引术语层t查找他的同义词,则从Q 到有一条弧;从指向  

的弧,就是从指向 ,其中总有从指向的弧,是在一定衡量方法

下与最相关的术语集合。

在确定了贝叶斯网络模型之后,通过计算索引术语与术语之间、索引术语与文档之间的条件概率与

文档节点的后验概率,就能够获得全部文档节点的概率,并根据概率大小排序获得与查询节点最匹

配的检索结果。

考虑一种更简单的情况,即在查询节点和文档节点以外,只有一层术语节点的简单贝叶斯网络检索

模型,如下图所示。

假设查询节点为Q,术语节点集合为,文档节点集合为。根据图中

弧线所对应的关系,计算查询节点Q更接近于文档节点集合中的哪一个?

要求查询节点更接近哪一个文档节点,即分别求,选择其中概率值最大文档节点为所求。

根据朴素贝叶斯算法的原则,所有术语节点相互独立。且由图可知,除去查询节点层,所有术语节

点均为根节点。所以定义每一个术语相关的先验概率,则不相关的概率

其中M为集合中术语的数目(本例中M=6)。一般情况下,任意根术语节点相关的先验概率很小,

且与索引术语节点集合的规模成反比。

对于文档节点可知,任意文档节点的父节点集合由该文档的所有索引术语节点组成,即

。令中每个术语变量取值(相关或不相关)后的一个

组合,利用一般正则模型概率函数,定义文档相关的条件概率为

其中,为文档的索引术语的权重,,且。这意味

中相关术语越多, 的相关概率值就越大。关于权重的计算,给出相应数值如

下表:

T1

T2

T3

T4

T5

T6

D1

0.2

0.15

0.05

0.1

0.35

0.15

D2

0.3

0.05

0.15

0.2

0.15

0.15

D3

0.05

0.35

0.2

0.05

0.15

0.2

所以根据贝叶斯公式,可以得到下式:

 由于术语节点相互独立,根据条件独立性得:如果,则。否则,

。那么,上式可化简为:

则,代入数值得: 

同理: 

可见:即查询节点Q更接近文档节点 D3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1253892.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# APS.NET CORE 6.0 WEB API IIS部署

1.创建 APS.NET CORE6.0 WEB API项目 默认选项即可 源代码: 项目文件展开: launchSettings.json {"$schema": "https://json.schemastore.org/launchsettings.json","iisSettings": {"windowsAuthentication"…

记录华为云服务器(Linux 可视化 宝塔面板)-- Nginx篇

文章目录 配置Nginx服务器1、添加CentOS 7系统的Nginx yum资源库2、安装Nignx服务 设置Nginx安全级别(感觉可以先不设置)步骤一步骤二如有启发,可点赞收藏哟~ 配置Nginx服务器 1、添加CentOS 7系统的Nginx yum资源库 先安装rpm apt instal…

Linux 中的 ls 命令使用教程

目录 前言 如何运用 ls 命令 1、列出带有所有权的文件和目录 2、获取以人类可读的方式显示的信息 3、列出隐藏文件 4、递归列出文件 5、在使用 ls 时对文件和目录做区分 6、列出指定扩展名的文件 7、基于大小对输出内容排序 8、根据日期和时间排序文件 让我们来总结…

Nginx:配置文件详解

一、Nginx配置文件 main配置段:全局配置 events段:定义event工作模式 http {}:定义http协议配置 支持使用变量: 内置变量:模块会提供内建变脸定义 自定义变量:set var_name value 二、 主…

动态规划学习——斐波那契数列

目录 最长的斐波那契数列子序列的长度 1.题目 2.题目接口 3.解题思路及其代码 最长的斐波那契数列子序列的长度 1.题目 如果序列x_1&#xff0c;X_2&#xff0c;...&#xff0c;x_n 满足下列条件&#xff0c;就说它是斐波那契式的: 1.n > 3 2.对于所有i2 <n&a…

中间件介绍

一、中间件介绍 官方的说法&#xff1a;中间件是一个用来处理Django的请求和响应的框架级别的钩子。它是一个轻量、低级别的插件系统&#xff0c;用于在全局范围内改变Django的输入和输出。每个中间件组件都负责做一些特定的功能。 但是由于其影响的是全局&#xff0c;所以需…

HashMap的实现原;HashMap的工作原理;HashMap存储结构; HashMap 构造函数

文章目录 说一下HashMap的实现原理(非常重要)①HashMap的工作原理HashMap存储结构常用的变量HashMap 构造函数tableSizeFor() put()方法详解hash()计算原理resize() 扩容机制get()方法为什么HashMap链表会形成死循环 HashMap是我们在工作中使用到存储数据特别频繁的数据结构&am…

韵达快递查询,韵达快递单号查询,一键筛选出单号中的退回件

批量查询韵达快递单号的物流信息&#xff0c;并将其中的退回件一键筛选出来。 所需工具&#xff1a; 一个【快递批量查询高手】软件 韵达快递单号若干 操作步骤&#xff1a; 步骤1&#xff1a;运行【快递批量查询高手】软件&#xff0c;第一次使用的朋友记得先注册&#xff…

短期的规划

大方向&#xff1a; 学习编程的前期 大二上学期&#xff1a; 前期追求知识点的广度&#xff1a; 对各类数据结构的了解 熟悉数据库的各类操作&#xff0c;JDBC熟练使用 与此同时&#xff0c;提高写作能力&#xff0c;学习沉淀&#xff0c;提高技术影响力 大二的寒假&…

Java中的异常语法知识居然这么好玩!后悔没有早点学习

学习异常后&#xff0c;发现异常的知识是多么的吸引人&#xff01;不仅可以用来标记错误&#xff0c;还可以自己定义一个异常&#xff0c;用来实现自己想完成的业务逻辑&#xff0c;接下来一起去学习吧 目录 一、异常的概念及体系结构 1.异常的概念 2.异常的体系结构 3.异常…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《前景导向的主动配电网智能储能软开关规划方法》

这个标题涉及到电力系统中的主动配电网&#xff08;Active Distribution Network&#xff09;以及与之相关的智能储能软开关的规划方法。下面是对标题中各个关键词的解释&#xff1a; 前景导向的&#xff08;Future-oriented&#xff09;&#xff1a; 这表明该方法是以未来发展…

2022年全国硕士研究生入学统一考试管理类专业学位联考数学试题——解析版

文章目录 2022 年全国硕士研究生入学统一考试管理类专业学位联考数学试题一、问题求解&#xff1a;第 1∼15 小题&#xff0c;每小题 3 分&#xff0c;共 45 分。下列每题给出的 A、B、C、D、E 五个选项中&#xff0c;只有一项是符合试题要求的&#xff0c;请在答&#xff0e;题…

strlen和sizeof练习题(以64位机器为例)

例一 一般情况下&#xff0c;数组名表示首元素地址&#xff0c;只有在以下的情况中数组名表示整个数组的地址&#xff1a; 1.sizeof&#xff08;数组名&#xff09;&#xff1a;这里的数组名表示整个数组&#xff0c;计算的是整个数组的大小 2.&数组名&#xff1a;这里的…

五种多目标优化算法(MOPSO、MOAHA、NSGA2、NSGA3、MOGWO)求解微电网多目标优化调度(MATLAB)

一、多目标优化算法简介 &#xff08;1&#xff09;多目标粒子群优化算法MOPSO 多目标应用&#xff1a;基于多目标粒子群优化算法MOPSO求解微电网多目标优化调度&#xff08;MATLAB代码&#xff09;-CSDN博客 &#xff08;2&#xff09;多目标人工蜂鸟算法&#xff08;MOAHA…

C语言进阶之笔试题详解(1)

引言&#xff1a; 对指针知识进行简单的回顾&#xff0c;然后再完成笔试题。 ✨ 猪巴戒&#xff1a;个人主页✨ 所属专栏&#xff1a;《C语言进阶》 &#x1f388;跟着猪巴戒&#xff0c;一起学习C语言&#x1f388; 目录 引言&#xff1a; 知识简单回顾 指针是什么 指针变…

分布式篇---第七篇

系列文章目录 文章目录 系列文章目录前言一、如何将长链接转换成短链接,并发送短信?二、长链接和短链接如何互相转换?三、长链接和短链接的对应关系如何存储?四、如何提高系统的并发能力?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一…

航天宏图——宏图1号样例数据0.5米-5米分辨率(上海部分)

简介&#xff1a; 作为航天宏图“女娲星座”建设计划的首发卫星&#xff0c;航天宏图-1号可获取0.5米-5米的分辨率影像&#xff0c;具备高精度地形测绘、高精度形变检测、高分辨率宽幅成像以及三维立体成像等能力&#xff0c;在自然资源、应急管理、水利等行业与领域具有极高的…

【开源】基于Vue和SpringBoot的数字化社区网格管理系统

项目编号&#xff1a; S 042 &#xff0c;文末获取源码。 \color{red}{项目编号&#xff1a;S042&#xff0c;文末获取源码。} 项目编号&#xff1a;S042&#xff0c;文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、开发背景四、系统展示五、核心源码5…

LCM-LoRA模型推理简明教程

潜在一致性模型 (LCM) 通常可以通过 2-4 个步骤生成高质量图像&#xff0c;从而可以在几乎实时的设置中使用扩散模型。 来自官方网站&#xff1a; LCM 只需 4,000 个训练步骤&#xff08;约 32 个 A100 GPU 小时&#xff09;即可从任何预训练的稳定扩散 (SD) 中提取出来&#…

【深度学习笔记】03 微积分与自动微分

03 微积分与自动微分 导数和微分导数解释的可视化偏导数梯度链式法则自动微分非标量变量的反向传播分离计算 导数和微分 假设我们有一个函数 f : R → R f: \mathbb{R} \rightarrow \mathbb{R} f:R→R&#xff0c;其输入和输出都是标量。 如果 f f f的导数存在&#xff0c;这个…