贝叶斯基础

news2025/2/26 8:21:39

概要

贝叶斯定理描述的是条件概率,不同于全局概率,它表示当某一个事件(B)发生时,另一个事件(A)发生的概率。从机器学习的角度,从全局无法知道事件(A)发生的概率,但是如果能确认一些事情发生,如事件(B),那么就可以更新事件(A)发生的概率,从而逼近真实值。

基础知识

概率 -- 一件事发生的概率等于该事件发生的数目除以所有事件发生的数目,P(A);

条件概率 -- 一件事在特定条件下发生的概率,P(A|B)。如“假如我知道一个人是女士,那么她留长发的概率是多少”。这里B表示女士,A表示长头发;另外P(A|B)!= P(B|A),比如,P(cute | puppy) 是不一样的 P(puppy | cute)。如果我抱着是小狗,那么它可爱的概率就很高,如果我抱着的东西很可爱,那么它是小狗的概率就可能很低,因为它可能是小猫、兔子、刺猬或者是一个小宝宝;

联合概率 – 两件事同时发生的概率,P(A and B) = P(A) * P(B|A)。注意P(A and B) != P(A) * P(B)。原因是前者考虑了两件事的相关性,而后者没有。举个例子,如果A和B发生的概率都是50%,但两者是强相关的,A出现时B必然出现,那么P(A and B)=50%;反之如果A出现时B必然不会出现,那么P(A and B)=0;

边际概率 -- 即相对多变量的联合分布而言,当其他变量取一切可能,某变量取值的概率。边际概率是一个事件的概率,与另一个变量的结果无关。 我们可以从后文的公式中再体会边际概率的含义。

公式

P(A|B) – 条件概率,同时也是后验概率,它表示当事件B发生后,对于发生事件A的概率修正;

P(A) – 初始概率,同时也是前验概率,它可能是一个准确值,也可能表示我们对事件A发生的估计概率;

P(B|A) – 它也是个条件概率,在贝叶斯应用中,它是一个容易求得的值;

P(B) – 边缘概率

公式变换

贝叶斯公式有很多表现形式,适用于不同的应用场景。在这里我们对边际概率进行细化(根据它的定义)

贝叶斯公式的应用场景

  1. Understanding probability problems (including those in medical research)
  2. Statistical modelling and inference
  3. Machine learning algorithms (such as Naive Bayes, Expectation Maximisation)
  4. Quantitative modelling and forecasting

示例

示例1

第一个盒子有4个红球、2个绿球,第二个盒子有2个红球、4个绿球。假设有1/3的概率从第一个盒子内取球,有2/3的概率从第二个盒子内取球。随机从任意一个盒子内取任意一个球:

  1. 如果取到的球是红色的,那么有多大概率来至第一个盒子?
  2. 如果取到的球是红色的,那么有多大概率来至第二个盒子?
  3. 对比一下前两问的答案,并解释原因

解答1: 假设从第一个盒子取球的事件为E1,则P(E1) = 1/3,假设从第二个盒子取球的事件为E2,则P(E2) = 1/3。从第一个盒子取到红球的概率P(R|E1)=2/3,从第二个盒子取到红球的概率P(R|E2)=1/3。问题是求解P(E1|R),按照公式

解答2:

解答3:两问的答案相同,原因是贝叶斯公式同时考虑了选择某个盒子的概率,和从特定盒子中选择红球的概率。 

示例2

有一种疾病,1%的人群会感染上。医疗上检测该疾病,在得病的人群中有95%的几率能检测出,同时也有%2的几率在未感染的人群中检测出。如果一个人被检测出得该疾病,那么他真实获病得几率是多少?

解答:假设真实得病的事件为D,那么P(D)=1%,P(~D)=99%。检测出疾病的事件为E,那么P(E|D)=95%,P(E|~D)=2%。问题是P(D|E)

 

由此可见,即使被检测出疾病,真实获病的概率其实并不高。原因是前验概率非常低,同时检测误差却相对较高。 

示例3

市场上有3个工厂(A,B,C)生产灯泡,它们的市场占有率分别是20%,50%和30%。其对应的缺陷产品率分别是2%,1%,3%。如果有一个缺陷灯泡被检测到了,那么它来自于B工厂的概率是多少?

解答:首先P(A)=20%, P(B)=50%, P(C)=30%,另一个条件,假设缺陷产品的事件为D,则P(D|A)=2%, P(D|B)=1%, P(D|C)=3%, 问题是P(B|D)

由此可见,虽然B工厂的市场占有率较高,但是因为其产品缺陷率较低,导致问题产品来自于它生产的灯泡的概率也不高。

示例4

有一套雷达系统,当飞机在它的监控范围时,它有98%的概率能监测出来。但是当无飞机时,仍有5%的概率能监测出来。在任意时间,该空域出现飞机的概率是7%。

  1. 当雷达监测出飞机时,有多大概率无飞机存在?
  2. 当雷达监测出飞机时,有多大概率有飞机存在?
  3. 当雷达未监测出飞机时,有多大概率有飞机存在?
  4. 当雷达未监测出飞机时,有多大概率无飞机存在?

解答:飞机出现在该空域的时间为M,则P(M)=7%,P(~M)=93%。另一个条件,监测出飞机的事件为D,P(D|M)=98,P(D|~M)=5%。

  1. P(~M|D)=(0.93*0.05)/(0.93*0.05+0.98*0.07) = 0.404
  2. P(M|D)=(0.07*0.98)/(0.93*0.05+0.98*0.07) = 0.596
  3. 这里需要做一个转换,P(~D|M) = 1-P(D|M)和P(~D|~M) = 1-P(D|~M)。则P(M|~D)=0.0016
  4. P(~M|~D)=0.9984

参考文献

  1. 贝叶斯推理原理 - 知乎
  2. Bayes' Rule – Explained For Beginners
  3. Bayes Theorem Explained With Example - Complete Guide | upGrad blog
  4. https://www.analyzemath.com/probabilities/bayes-theorem.html

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/105481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IT行业岗位分析系统设计与实现(Spark+Hadoop)

目 录 摘要 I ABSTRACT II 1 引言 1 1.1 研究背景 1 1.2 研究意义 1 1.3 研究内容与组织结构 1 2 相关理论与技术介绍 3 2.1 HDFS简介 3 2.2 Spark简介 4 2.3 MongoDB数据库简介 6 2.4 爬虫技术简介 7 2.5 Echarts简介 8 2.6 Pyqt5简介 8 2.7 本章小结 8 3 系统需求分析 9 3.1…

BertNet、RoBertaNe

又带来了可扩展、可解释,从预训练语言模型中高效提取知识图谱的新框架 来自加州大学圣迭戈分校(UCSD)、卡内基梅隆大学(CMU)等机构的研究者提出了一种自动知识抽取框架,可以从 BERT 或 RoBerta 等预训练语…

fpga实操训练(利用fpga实现pwm)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 pwm,其实就是方波。它的本质就是通过方波中占空比的调节,实现对外部设备的控制。简单如台灯,复杂如电机都是这么…

【Java系列】小小练习——带你回顾Java基础语法

返回主篇章         👇 【Java】才疏学浅小石Java问道之路 Java小练习1. 练习一1.1 题目1.2 题解(附解析)2. 练习二2.1 题目2.2 题解(附解析)3. 练习三3.1 题目3.2 题解(附解析)小结1. 练习一 1.1 题目 定义三个变量,分别为人物性别、年龄、身高…

Python-实战:基于白鲸优化BWO算法的VMD超参数优化

目录 1、白鲸优化算法 2、BWO优化VMD参数 3、实战 3.1 原始时间序列数据 3.2 VMD分解--直接设置参数 3.3 采用BWO优化VMD 4、代码 在博客的基础上,本文利用白鲸优化算法对VMD的参数进行优化,采用python实现。 1、白鲸优化算法 白鲸优化算法([Beluga…

【Python】自动备份脚本

文章目录一、前言二、代码一、前言 之前因为疫情常常不知道会不会被封在家里,又不想把电脑带过来带过去,就做了这个自动备份的脚本。 功能如下: 自动从指定根目录里将找到的所有指定后缀名的文件备份到一个备份文件夹里;将备份…

ImageAdaptive-YOLO

又发现了一个yolo~~ 恶劣天气下的目标检测 也叫IA-YOLO 源代码:https://github.com/wenyyu/ImageAdaptive-YOLO 尽管基于深度学习的目标检测方法在传统数据集上取得了可喜的结果,但从恶劣天气条件下捕获的低质量图像中定位目标仍然具有挑战性。现有方…

三顾茅庐,七面阿里,25k*16offer,还原我的大厂面经

写在片头:声明,勿杠 首先简单说一下,这三次面试阿里并不是一次性去面的,实际上第一次面试时候还在大四,找的实习岗,不太清楚是什么部门,别问我为什么还记得面试题,有记录和复盘的习…

C++Easyx世界杯版跑酷小游戏

🐑本文作者:克隆窝🐑 🎮🔊本文代码适合编译环境:DEV-C💻 ✨🧨温馨提示:此文乃作者心血,如要转载请标注版权,否则视为抄袭!&#x1f38…

计算机毕设Python+Vue羊肉溯源系统(程序+LW+部署)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

Python图形用户界面(GUI)之PyQt6入门及转换视频格式示例

上篇文章中学习的wxPython用户界面,没有拖拽组件等操作,不是很方便,下面来看个更加强大的GUI>PyQt系列,拥有拖拽组件界面,这样设计界面就显得非常简单与方便了。Qt库由 Riverbank Computing开发,是最强大…

【Linux】版本控制器Git

​🌠 作者:阿亮joy. 🎆专栏:《学会Linux》 🎇 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根 目录👉Git概述&a…

Pytorch~单卡改多卡

搬来了这个,这是尝试单卡改多卡加速的过程中出现的bug记录:一是继承DistributedSampler的漏洞百出,二是master进程无法正常结束,这里详细的阐述了出错的细节以及给出了修改的方法。 先说明一下背景,目前正在魔改以下这篇论文的代…

JavaScript 中事件循环(eventloop)、垃圾回收机制、闭包、递归函数的理解及示例

事件循环(eventloop) 概念 js 是单线程,为防止阻塞代码,把同步代码交给 js 引擎执行 异步代码交给宿主环境, 同步代码放入执行栈中 异步代码等待时机送入任务队列中, 执行栈执行完毕 会去任务队列看是否有异步任务 有就送到执行…

Postman核心功能解析-参数化和测试报告

参数化处理 参数化:针对于某一个接口,有大量的的测试数据需要批量验证,一个一个的更改请求参数太耗时耗力,使用参数化批量处理数据会比较高效,常规通过文档参数化实现。 创建文件 格式CSV 文件内第一行信息 需要和参数…

谈谈转行数据分析以及工作的心得

由于两个月前写了一篇文章叫《自己找数据分析师时犯的错误》,然后这期间就一直有人问我找到工作了吗?面试的时候,面试官都是问你的什么呢?你从事数据分析工作之后主要干什么呢?所以想在这里为大家分别解答下。 首先回…

【Linux】编译器gcc / g++的使用

​🌠 作者:阿亮joy. 🎆专栏:《学会Linux》 🎇 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根 目录👉gcc / g的…

快速玩转ChatGPT全攻略

本文内容: 准备工作。 注册接嘛平台。 注册OpenAI账号。 开始畅聊。 一.准备工作: Proxy,美国,日本,韩国,新加坡,印度,不能用香港。 Chrome浏览器。 二、注册接嘛平台&#x…

在ARM微控制器上部署MATLAB/Simulink仿真模型

在ARM微控制器上部署MATLAB/Simulink仿真模型 苏勇,suyong_yq126.com,2022年12月 文章目录在ARM微控制器上部署MATLAB/Simulink仿真模型IntroductionOverviewMATLAB、Simulink、StateFlow、Real-Time Workshop之间的关系MATLAB Coder、Simulink Coder、…

最新版Android原生集成RN

前言 现在不少应用都是采用了混合开发模式,不论是原生加RN,或是原生加Flutter,或是原生加H5。原生实现主业务线,其他部分可以借助跨平台方案开发,提高开发效率,或者实现热更新,调高业务迭代效率。 下面简单介绍一下A…