【概率论教程01】对贝叶斯定理的追忆

news2025/1/11 14:03:55

一、说明

        贝叶斯定理,是一个需要反复体悟的道理,不是说公式解释清除就算Grasp,而是需要反复在实际项目中发挥,才能算掌握了。而实际应用中,并不是简单给出条件就可以套用,而是隐藏在迷雾一样的事实中,本人认为,最难办的两个事情是:1)隐变元问题,2)连续性假设。3)分布和分布的比较。总之,用好贝叶斯理论是需要下点苦功的。

二、提要

        概率分布是统计推断的支柱,要理解这些分布,我们至少应该对概率论有一些基本的了解。

2.1 这篇文章的目的是建立概率基础,我们将在本文中介绍的主题是:

  • 对概率的理解
  • 基本术语,如样本空间、事件、实验和结果。
  • 概率公理
  • 事件类型:独立事件、从属事件等
  • 概率规则:加法和乘法规则。
  • 条件概率的概念
  • 贝叶斯定理

2.2 了解概率论

概率论涉及不确定性和随机性的研究,提供分析事件和量化其发生可能性的工具。

三、基本术语

3.1 概率

概率是事件发生的可能性。

3.2 实验和结果

实验是指生成一组可能的结果或结果的过程或活动。这是我们有兴趣从概率角度研究的基本行为。

结果是作为实验结果而发生的单个结果。 它代表了给定实验中可能发生的单个结果之一。例如,当掷出公平的六面骰子时,可能的结果是数字 1、2、3、4、5 或 6。

等可能结果:当样本空间中的所有结果都有相同的发生机会时,它们被称为等可能结果。例如,在抛出一枚公平的硬币时,结果(正面或反面)的可能性相同。

3.3 样品空间和活动:

样本空间包含实验或观察的所有可能结果。

事件是样本空间的子集,表示感兴趣的特定结果。

3.4 不同类型的事件:

  1. Simple Event and Compound Event: If an event consists of a single result from the sample space, it is termed a simple event. For example, in rolling a fair six-sided dice we have a sample space of 1,2,3,4,5,6, but getting a “3” is a simple event. However, if want to have a number less than 3, then the event has more than two outcomes that is 1 and 2. Such events are known as compound events.
  2. 详尽的活动:穷举事件是一组共同覆盖整个样本空间的事件。换句话说,这些事件的并集等于整个样本空间。例如,在掷出一个公平的六面骰子时,得到一个小于 7 和大于 0 的数字将给我们整个空间“1”、“2”、“3”、“4”、“5”或“6”。此类事件是详尽无遗的事件,因为它们涵盖了所有可能的结果。
  3. 互斥活动:互斥事件是不能同时发生的事件。如果两个事件是相互排斥的,则意味着它们没有共同的结果。在数学上,如果 A 和 B 是互斥事件,则它们的交集 (A ∩ B) 是一个空集 (∅)。例如,在掷硬币时,事件“正面”和“反面”是相互排斥的。
  4. 独立活动:如果一个事件的发生不影响另一个事件的概率,则两个事件 A 和 B 是独立的。换句话说,一个事件发生的概率不取决于另一个事件发生。在数学上,对于独立事件 A 和 B,P(A ∩ B) = P(A) * P(B)。
  5. 依赖事件:如果一个事件的发生影响另一个事件的概率,则两个事件 A 和 B 是相关的。在这种情况下,一个事件发生的概率取决于另一个事件发生。在数学上,对于相关事件 A 和 B,P(A ∩ B) ≠ P(A) * P(B)。

四、如何找到事件的概率?

要找到概率中事件发生的可能性,步骤如下:

  1. 确定样本空间或实验可能结果的总数。
  2. 确定事件的有利结果的数量。
  3. 将步骤 2 中的值除以步骤 1 中获得的值以获得所需的概率。

4.1 概率公理

  1. 非负性:任何事件的概率都是非负值。也就是说,对于任何事件 A,P(A) ≥ 0。
  2. 规范化:事件的概率是介于 0 和 1 之间的数字,其中 0 表示不可能,1 表示确定性,介于两者之间的值表示发生的可能性。
  3. 加法:对于任何互斥事件(不能同时发生的事件),它们的并集概率等于它们各自概率的总和。也就是说,对于互斥事件 A 和 B,其中 A ∩ B = ∅(空集),P(A ∪ B) = P(A) + P(B)。

4.2 概率规则

加法规则和乘法规则是概率论中的基本原理,有助于计算复合事件的概率。

4.3.1 乘法规则

乘法规则指出,两个独立事件(A ∩ B)相交的概率等于它们各自概率的乘积:

P(A ∩ B) = P(A) * P(B)

如果有两个以上的独立事件,则规则将扩展到:

P(A ∩ B ∩ C ∩ ...) = P(A) * P(B) * P(C) * ...

4.3.2 加法规则

加法规则指出,两个互斥事件(A ∪ B)并集的概率等于它们各自概率的总和:

P(A ∪ B) = P(A) + P(B)

如果有两个以上的互斥事件,则规则将扩展到:

P(A ∪ B ∪ C ∪ ...) = P(A) + P(B) + P(C) + ...

4.3.3 补充规则

每当一个事件是另一个事件的补充时,它们的总和等于 1。

P(A') + P(A) = 1

P(A') = 1 — P(A)

4.3.4 条件概率

条件概率是指在另一个事件已经发生的情况下,一个事件发生的概率。

条件概率的公式由条件概率的乘法规则给出:

哪里:

  • P(A |B) 是给定事件 B 的事件 A 的条件概率。
  • P(A ∩ B) 是事件 A 和 B 交集(两个事件都发生)的概率。
  • P(B) 是事件 B 发生的概率。

例:

一个罐子里有4个绿色弹珠和6个黄色弹珠。从罐子里抽出了两个弹珠。第二颗大理石已经绘制出来,没有更换。两个绘制的弹珠都是黄色的概率是多少?

溶液

设 A = 第一个弹珠为黄色的事件;并设 B = 第二个弹珠为黄色的事件。我们知道以下内容:

  • 一开始,盒子里有 10 个弹珠,其中 6 个是黄色的。因此,P(A) = 6/10
  • 第一次选择后,罐子里有 9 个弹珠,其中 5 个是黄色的。因此,P(B|A) = 5/9

因此,根据乘法规则:

P(A∩B) = P(A)。P(B∣A)P(A∩B) = (6/10)∗(5/9)
= 30/90 = 1/3 = 0.33

五、贝叶斯定理

贝叶斯定理描述了基于可能与事件相关的条件的先验知识的事件概率。

似乎令人困惑?不用担心!我会让你变得简单。

贝叶斯定理作为一个逻辑框架,将新证据纳入我们现有的信念,使我们能够做出更明智的决定。它提供了一种系统的方法,可以在我们遇到新数据、观察或测试结果时更新概率。

它是概率论中最显着的发展之一,将人类认知纳入其应用。正如人类用新的经验来调整他们的信念一样,贝叶斯定理在结合一条新证据后增强了概率。

5.2 让我们举一个例子:

        想象一下,您是一名医生,面临着诊断患者的疾病。根据您的经验和知识,您对不同疾病的可能性有先验信念(先验概率)。现在,患者已经接受了诊断测试(新证据),该测试提供了某些测试结果(条件概率)。您需要更新您的初始信念(先验概率)以得出更准确的诊断(后验概率)。

5.3 数学之旅:从先验概率到后验概率

但是它如何在数学上更新概率呢?让我们理解这一点。

在这里,P(A) = 在任何证据存在之前假设(先验知识)为真的概率。

P(B) = 通过考虑证据变量的所有可能值来计算事件 B 的概率

P(B|A) = 看到给定假设的证据的概率为真。

P(A|B) = (后验)-给定证据的假设概率为真。

注意:由于存在先验事件或信念,因此事件A和B是独立的事件。

注意:分母 (P(B)) 充当归一化因子,确保概率总和为 1。

让我们通过一个数值示例来逐步说明贝叶斯定理。

六、考虑一个医疗场景,其中患者正在接受罕见疾病的检测。

假设我们有以下信息:

  1. 先验概率:P(疾病)= 0.01(患者患有该疾病的先验概率为 1%,因为它在一般人群中是一种罕见疾病。
  2. 灵敏度:P(阳性测试结果 |疾病)= 0.95(诊断测试的灵敏度为95%,这意味着在患者实际患有疾病的情况下获得阳性测试结果的概率。
  3. 特异性:P(阴性检测结果 |无疾病)= 0.90(诊断测试的特异性为 90%,这意味着在患者没有疾病的情况下获得阴性测试结果的概率。

现在,患者接受诊断测试,测试结果为阳性(事件B)。我们想计算患者实际患有该疾病的概率(事件 A |B).

        第 1 步:从先验概率开始:P(疾病) = 0.01

        第 2 步: 计算可能性:P(阳性测试结果 |疾病) = 0.95

        第 3 步: 计算边际概率:P(阳性测试结果)= P(阳性测试结果 |疾病) * P(疾病) + P(阳性测试结果 |无疾病) * P(无疾病) = 0.95 * 0.01 + (1–0.90) * (1–0.01) = 0.0495 + 0.009 = 0.0585

        第 4 步:应用贝叶斯定理:P(疾病 |阳性检测结果) = (P(阳性检测结果 |疾病) * P(疾病)) / P(阳性检测结果) = (0.95 * 0.01) / 0.0585 = 0.0095 / 0.0585 ≈ 0.1624

        第 5 步: 获得后验概率:P(疾病 |阳性测试结果) ≈ 0.1624

        在这个例子中,尽管测试结果为阳性,但患者实际患有该疾病的概率仅为16.24%左右。然而,患有这种疾病的先前信息仅为1%,尽管在给出证据后,它有所增加。

        虽然,对于被诊断患有某种疾病的人来说,它仍然很低。疾病的先验概率低,检验精度不高,导致后验概率相对较低。因此,这让我们想到测试实验室的概率可能不太准确。

参考资料:

阿希什·阿罗拉

所以,这就是我这篇文章的结尾,涵盖了概率论的基础知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1128254.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

『C语言进阶』自定义类型详解

🔥博客主页: 小羊失眠啦. 🔖系列专栏: C语言、Linux、Cpolar ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录 前言一、结构体1.1 结构体的基础知识1.2 结构体的声明1.3 结构体的特殊声明1.4 结构体的自引用1.5 结构体的初…

Unity开发过程中的一些小知识点

1、如何查询挂载了指定脚本的游戏物体 可以直接在Hierarchy面板上,搜索想要找的脚本名 2、如何将Unity生成的多个相同游戏物体获得序号 可以使用Unity的API Transform.GetSiblingIndex() 实现。 Transform.GetSiblingIndex()gameobject.idTransform.GetSiblingI…

PDF Reader Pro v2.9.8(pdf编辑阅读器)

PDF Reader Pro是一款PDF阅读和编辑软件,具有以下特点: 界面设计简洁,易于上手。软件界面直观清晰,用户可以轻松浏览文档,编辑注释和填写表单。功能强大,提供了多种PDF处理工具,包括阅读、注释…

高压放大器在扫描显微镜中的应用及优势是什么

随着科技的不断进步,扫描显微镜成为了现代显微镜技术的重要组成部分。它能够提供更高的分辨率、更广的视场和更强的功能,用于研究各种微观结构和材料的特性。而高压放大器在扫描显微镜系统中发挥着至关重要的作用。下面安泰电子Aigtek将详细介绍高压放大…

数据分享 I 第一至第四批专精特新“小巨人”企业数据

数据地址: 专精特新“小巨人”企业数据https://www.xcitybox.com/datamarketview/#/Productpage?id355 基本信息. 数据名称: 第一至第四批专精特新“小巨人”企业数据 数据格式: Shpxlsx 数据时间: 2022年 数据几何类型: 点 数据坐标系: WGS84坐标系 数据字…

c语言进阶部分详解(详细解析自定义类型——枚举,联合(共用体))

上篇文章介绍了结构体相关的内容,大家可以点击链接进行浏览:c语言进阶部分详解(详细解析自定义类型——结构体,内存对齐,位段)-CSDN博客 各种源码大家可以去我的gitee主页进行查找:唔姆 (Nerow…

Centos使用war文件部署jenkins

部署jenkins所需要的jdk环境如下: 这里下载官网最新的版本: 选择jenkins2.414.3版本,所以jdk环境最低得是java11 安装java11环境 这里直接安装open-jdk yum -y install java-11-openjdk.x86_64 java-11-openjdk-devel.x86_64下载jenkins最新…

python实验12_中文文本分析

实验12:中文文本分析 1.实验目标及要求 (1)掌握jieba库的常用方法。 (2)掌握使用WordCloud库绘制词云的方法。 (3)掌握使用networkx库绘制关系图的方法。 2. 实验主要内容 (1)分析文本“水浒…

ConcurrentHashMap底层具体实现知道吗?实现原理是什么

从这三个方面来回答: ConcurrentHashMap 的整体架构 ConcurrentHashMap 的基本功能 ConcurrentHashMap 在性能方面的优化 ConcurrentHashMap 的整体架构 这个是 ConcurrentHashMap 在 JDK1.8 中的存储结构,它是由数组、单向链表、红黑树组成. 当我们初始…

谈谈你对Spring的理解

谈谈你对Spring的理解 一,什么是Spring 1.介绍 Spring是一个用于开发Java应用程序的工具集合,它提供了许多方便的组件和工具,可以帮助开发者更轻松地构建企业级应用程序。 Spring Framework是Spring的核心部分,它可以帮助开发者…

windows的adb环境安装

需要配置androidhome和一些path

基于情感分析的网络舆情热点分析系统 计算机竞赛

文章目录 0 前言1 课题背景2 数据处理3 文本情感分析3.1 情感分析-词库搭建3.2 文本情感分析实现3.3 建立情感倾向性分析模型 4 数据可视化工具4.1 django框架介绍4.2 ECharts 5 Django使用echarts进行可视化展示5.1 修改setting.py连接mysql数据库5.2 导入数据5.3 使用echarts…

2023年信息科学与工程学院学生科协第二次软件培训

2023年信息科学与工程学院学生科协第二次软件培训 文章目录 2023年信息科学与工程学院学生科协第二次软件培训一维数组数组的概念定义格式一维数组的访问例题:练习题: 数组元素数量一维数组的初始化 二维数组定义格式二维数组的访问二维数组的存储结构二…

实现多余内容变成省略号

实现效果 代码 <p class"item-content">{{ item.content }}</p>样式 .item-content {white-space: nowrap;/* 禁止换行 */overflow: hidden;/* 隐藏溢出部分 */text-overflow: ellipsis;/* 使用省略号表示溢出部分 */ }

21.4 Python 使用GeoIP2地图定位

GeoIP2是一种IP地址定位库&#xff0c;它允许开发人员根据IP地址查找有关位置和地理位置的信息。它使用MaxMind公司的IP地址数据库&#xff0c;并提供一个方便的Python API。GeoIP2可以用于许多不同的应用程序&#xff0c;例如网站分析、广告定位和身份验证。GeoIP2提供了许多不…

达梦管理工具报错“结果集不可更新,请确认查询列是否出自同一张表,并且包含值唯一的列。”

在使用达梦数据库管理工具时&#xff0c;我们测试过程中时常需要更新表数据&#xff0c;有时为了便捷&#xff0c;会直接使用管理工具修改表数据的值&#xff0c;但偶尔会遇到“结果集不可更新&#xff0c;请确认查询列是否出自同一张表&#xff0c;并且包含值唯一的列。”的报…

天津五家受欢迎的python培训机构 python凭什么这么火?

在目前的编程语言中&#xff0c;Python的抽象程度是最高的&#xff0c;是最接近自然语言的&#xff0c;非常容易上手&#xff0c;许多想学编程的小伙伴都从python入手&#xff0c;今天我们就来聊聊关于大家非常困惑的一些点&#xff0c;下面就一起来看看吧。 python火的原因 …

Java的反射(reflection)机制的简单使用

目录 一、定义 二、用途 三、反射基本信息 四、反射相关的类 五、反射示例 六、反射的优点和缺点 一、定义 Java的反射机制是运行时的状态&#xff0c;可以通过反射来调用类里面的属性和方法&#xff0c;私有的属性和方法也可以调用&#xff0c;也可以对它们进行修改。 二…

React 核心与实战2023版

课程亮点: 完整的前后台项目(PC+移动;完成业务;)React 最新企业标准技术栈(React 18 + Redux + ReactRouter + AntD)React + TypeScript (为大型项目奠定了基础)课程内容安排: React 介绍 React 是什么? React 是由Meta公司研发,是一个用于 构建Web和原生交互界面…

升级 Xcode 15模拟器 iOS 17.0 Simulator(21A328) 下载失败

升级 IDE Xcode 15 后本地模拟器 Simulator 全被清空,反复重新尝试 Get 下载频频因网络异常断开而导致失败 ... 注:通过 Get 方式下载一定要保证当前网络环境足够平稳,网络环境不好的情况下该方法几乎成不了 解决办法 Get 方式行不通可以尝试通过 官网 途径先下载 模拟器安装包…