【预备理论知识——1】深度学习:概率论概述

news2024/12/24 2:12:59

简单地说,机器学习就是做出预测。

概率论

掷骰子

  1. 假设我们掷骰子,想知道看到1的几率有多大,而不是看到另一个数字。 如果骰子是公平的,那么所有六个结果{1,…, 6}都有相同的可能发生, 因此我们可以说 1 发生的概率为1/6。

  2. 然而现实生活中,对于我们从工厂收到的真实骰子,我们需要检查它是否有瑕疵。 检查骰子的唯一方法是多次投掷并记录结果。 对于每个骰子,我们将观察到中{1,…, 6}的一个值。 对于每个值,一种自然的方法是将它出现的次数除以投掷的总次数, 即此事件(event)概率的估计值。

  3. 大数定律(law of large numbers)告诉我们: 随着投掷次数的增加,这个估计值会越来越接近真实的潜在概率。经过500次实验,每个数出现概率接近真实概率1/6 。
    在这里插入图片描述

概率论公理

  1. 概率论的公理是由安德烈·柯尔莫哥洛夫(Andrey Kolmogorov)在20世纪30年代提出的,为概率论提供了一个坚实的数学基础。这些公理定义了概率空间和概率的基本概念。以下是概率论的三个基本公理:

    • 非负性:对于任何事件A ,其概率 P(A) 都是非负的,即:P(A)≥ 0

    • 归一性:样本空间(所有可能事件的集合)的概率为1,即: P(Ω) = 1 , 其中,Ω 是样本空间。

    • 可列可加性:如果事件 A~1~, A~2~, ...是两两互斥的(即对于任意的 i 不等于 j , Ai 和 Aj 不能同时发生),那么这些事件的并集的概率是各个事件概率的和,即:
      在这里插入图片描述

  2. 这些公理为概率论提供了一个坚实的基础,使得我们可以定义更复杂的概率概念,如条件概率、独立性、贝叶斯定理等。

随机变量

  1. 随机变量是概率论和统计学中的一个基本概念,它是一种将随机试验的结果映射到实数上的函数。随机变量使我们能够用数学方式描述和分析随机现象。随机变量几乎可以是任何数量,并且它可以在随机实验的一组可能性中取一个值。

  2. 随机变量主要分为两种类型:

    • 离散随机变量:其可能的取值是有限的或可数无限的。例如,掷骰子的结果就是一个离散随机变量,因为它只能取1到6之间的整数值。

    • 连续随机变量:其可能的取值是无限且连续的。例如,测量人的身高就是一个连续随机变量,理论上可以取任何正值。

处理多个随机变量

  1. 处理多个随机变量时,我们通常关心它们之间的相互关系以及如何联合描述这些变量的概率特性。
  2. 举一个更复杂的例子:图像包含数百万像素,因此有数百万个随机变量。 在许多情况下,图像会附带一个标签(label),标识图像中的对象。 我们也可以将标签视为一个随机变量。 我们甚至可以将所有元数据视为随机变量,例如位置、时间、光圈、焦距、ISO、对焦距离和相机类型。 所有这些都是联合发生的随机变量。 当我们处理多个随机变量时,会有若干个变量是我们感兴趣的。

联合概率

  1. 联合概率是描述两个或多个随机变量共同取特定值的概率的量度。它提供了这些变量之间关系的完整视图,包括它们是否独立以及它们之间如何相互依赖。
  2. 定义
    在这里插入图片描述

条件概率

  1. 条件概率是指在某个条件或事件已经发生的前提之下,另一个事件发生的概率。用数学语言来描述,如果事件
    A和事件B是两个随机事件,那么在事件B发生的条件下,事件A发生的概率记作P(A∣B)
  2. 公式
    在这里插入图片描述

贝叶斯定理

  1. 贝叶斯定理(Bayes’ Theorem)是概率论中的一个重要定理,它提供了一种计算条件概率的方法,特别是在已知其他相关事件的概率时。贝叶斯定理在统计学、机器学习、数据科学、医学诊断等领域有广泛的应用。
  2. 假设我们有事件A和事件B贝叶斯定理描述了在事件B发生的条件下,事件A发生的概率,即P(A∣B)与在事件A发生的条件下,事件B发生的概率,即P(B∣A)之间的关系:
    在这里插入图片描述

边际化

  1. 边际化(Marginalization)是概率论和统计学中的一个重要概念,它涉及将多维随机变量的概率分布转化为较低维度的概率分布。具体来说,边缘化是指通过求和或积分的方式,将一个或多个变量从联合概率分布中去除,从而得到剩余变量的边缘概率分布。
  2. 举例:假设我们有三个随机变量 AB C,它们的联合概率分布为 P(A,B,C)。如果我们想要找到变量 AB的边际概率分布,而忽略 C 的影响,我们可以通过对 C 的所有可能值进行求和来实现这一点:
    P(A,B)=∑~c~P(A,B,c);这里的求和是对所有可能的 C 值进行的。

独立性

  1. 在概率论和统计学中,独立性是一个基本概念,用来描述两个或多个事件或随机变量之间是否存在关联。如果两个事件或随机变量之间没有关联,即一个事件的发生不影响另一个事件发生的概率,那么它们就被称为是相互独立的。
  2. 对于两个事件 A 和 B,如果它们满足以下条件,则称事件 A 和 B 是独立的。这意味着事件 A 和 B 同时发生的概率等于它们各自发生概率的乘积。
    在这里插入图片描述

期望与方差

期望

  1. 为了概括概率分布的关键特征,我们需要一些测量方法。 一个随机变量的期望(expectation,或平均值(average))是随机变量的加权平均值,它反映了随机变量的中心趋势。
  2. 定义
    在这里插入图片描述

方差

  1. 在许多情况下,我们希望衡量随机变量与其期望值的偏置。这可以通过方差来量化;方差是衡量随机变量分散程度的度量,它表示随机变量的值与其期望值之间的差异的平方的期望值
  2. 定义:
    在这里插入图片描述
  3. 标准差是方差的平方根,它与原始数据具有相同的单位,因此通常用来描述数据的离散程度:
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2178239.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux date命令(用于显示和设置系统的日期和时间,不仅可以显示时间,还能进行复杂的时间计算和格式化)

文章目录 深入探讨 Linux Date 命令1. Date 命令详细功能解析1.1 命令概述1.2 命令语法 2. 时间显示与格式化2.1 标准时间输出2.2 自定义格式输出 3. 设置系统日期和时间3.1 基本用法3.2 注意事项 4. 实用示例与脚本应用4.1 生成时间戳秒级时间戳毫秒时间戳 4.2 时间戳转换4.3 …

什么是后仿

什么是后仿 参考 查了一圈发现网上对post netlist simulation 介绍的比较少,今天和大家聊聊post netlist simulation。 首先什么是post netlist simulation(后面简称 postsim )? Netlist simulation 有些公司也叫gate level simulation,是指将…

问:全国产业园数量增长,对中小企业意味着什么?

随着全国产业园数量的持续增长,这一趋势无疑为中小企业带来了前所未有的机遇与可能。产业园作为产业集聚的重要载体,不仅为中小企业提供了更广阔的发展空间,还通过资源共享、成本降低、创新协同等方式,助力企业快速成长。 对于中…

高效的视频压缩标准H.264介绍,以及H.264在视频监控系统中的应用

目录 一、概述 二、 工作原理 三、技术特点与优势 1、高效压缩率 2、高质量视频 3、错误恢复能力 4、灵活性 四、编解码过程 1、编码过程 2、解码过程 五、帧类型与结构 1、I帧 2、P帧 3、B帧 六、应用与优势 1、节省存储空间和带宽 2、提高视频质量 3、适应…

中间件技术

在Java开发中,中间件技术是一种非常关键且广泛使用的技术。中间件通常被定义为位于操作系统、网络和数据库之上的软件层,用于简化分布式系统的开发、部署和管理。它们提供了一系列服务,如消息传递、事务管理、安全控制等,以帮助开…

Eth-trunk的介绍以及实验配置

目录 技术背景 Eth-Trunk概念 LACP模式下优先级 LACP的抢占机制 Eth-Trunk 配置 LACP模式 手工模式 Eth-Trunk接口负载分担 技术背景 随着网络中部署的业务量不断增长,单条物理链路的带宽已不能满足正常的业务流量需求。这时可以选择使用更高带宽的接口板或…

招联金融内推-2025校招

【投递方式】 直接扫下方二维码,或点击内推官网https://wecruit.hotjob.cn/SU61025e262f9d247b98e0a2c2/mc/position/campus,使用内推码 igcefb 投递) 【招聘岗位】 后台开发 前端开发 数据开发 数据运营 算法开发 技术运维 软件测试 产品策…

yolov8/9/10模型在安全帽、安全衣检测中的应用【代码+数据集+python环境+GUI系统】

yolov8910模型安全帽、安全衣检测中的应用【代码数据集python环境GUI系统】 yolov8/9/10模型在安全帽、安全衣检测中的应用【代码数据集python环境GUI系统】 背景意义 安全帽和安全衣在工业生产、建筑施工等高风险作业环境中是保护工人免受意外伤害的重要装备。然而&#xff0…

推荐一款良心的视频去水印在线工具!!!

推荐一款良心的视频去水印在线工具!!! 去水印工具是专门设计来处理图像和视频中不需要的水印、标志、文字或其他元素的软件或在线服务。这些工具通过智能算法识别并移除特定元素,同时尽量保持原始内容的画质和细节。 应用场景 版权清理:去除网络上获取…

SpringBoot项目请求不中断动态更新代码

在开发中,有时候不停机动态更新代码热部署是一项至关重要的功能,它可以在请求不中断的情况下下更新代码。这种方式不仅提高了开发效率,还能加速测试和调试过程。本文将详细介绍如何在 Spring Boot 项目在Linux系统中实现热部署,特…

GPT与大模型行业落地实践探索

简介 本课程探讨GPT和大模型技术在行业中的实际应用和发展。课程将涵盖GPT的基础知识、原理、及其在行业中的应用案例,如财报分析和客服机器人。重点在于结合实际案例中的使用效果,讲解如何利用GPT的API开发企业级应用以及利用更高级的功能构造AI Agent。…

根据给定的相机和镜头参数,估算相机的内参。

1. 相机分辨率和传感器尺寸 最高分辨率:6000 4000 像素传感器尺寸:22.3 mm 14.9 mm 2. 计算像素大小 需要计算每个像素对应的实际尺寸(mm/pixel): 水平方向像素大小: 垂直方向像素大小: …

TypeScript 基本使用指南【前端 26】

TypeScript 基本使用指南 引言 TypeScript 是 JavaScript 的一个超集,它添加了类型系统和一些其他特性,使得开发大型应用时更加高效和可靠。TypeScript 代码最终会被编译成普通的 JavaScript 代码,这意味着你可以在任何支持 JavaScript 的环…

作家依靠AI一年内创作120部作品

近期,Tim Boucher因声称自己依托人工智能(AI)完成了逾120部作品而在社交网络上引起广泛关注。 Boucher的这种创作手法引发了众多讨论和争议。一些批评者对他依靠AI写作表示不满,认为这种做法缺乏诚实性,甚至涉嫌抄袭。…

区间预测 | Matlab实现ARIMA-KDE的时间序列结合核密度估计区间预测

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现ARIMA-KDE的时间序列结合核密度估计区间预测,ARIMA的核密度估计下置信区间预测。 2.含点预测图、置信区间预测图、核密度估计图,区间预测(区间覆盖率PICP、区间平均宽度百分比PIN…

Mac电脑快速回复的神器-快捷短语

我在使用Mac的时候,很多常用的句子、词语或者一些代码都需要手动输入,拷贝粘贴总是会被新内容覆盖,在需要高频输入的时候这样效率太低了,然后我就找到一个可以快速输入的神器——快捷短语 快捷短语是Mac上的一款非常强大的快速回…

Java_TestNg

TestNg 前言支持特性 使用步骤1.引入库 常用注解Test注解BeforeSuite AfterSuiteAfterClass BeforeClassAfterTest BeforeTestAfterGroups BeforeGroupsBeforeMethod AfterMethodDataProviderFactoryListenersPatameters断言相等 不相等true/falsenull / !nullequals / !equals…

CUDA 参考文章

CUDA:NVCC编译过程和兼容性详解_nvcc把cuda代码转换成什么-CSDN博客https://blog.csdn.net/fb_help/article/details/80462853 1、CUDA:NVCC编译过程和兼容性详解 CUDA:NVCC编译过程和兼容性详解 https://codeyarns.com/2014/03/03/how-to-sp…

Appinventor2 多屏幕之间如何共享过程?

先说结论:不能共享,但可以变通,这个问题上没有完美方案! Appinventor2 多屏幕之间如何共享过程?或者说如何跨屏幕调用其他屏幕的过程? 相信有很多人有过这样的问题,但是目前来看每个屏幕都是独…

自动化测试常见的面试题(超详细整理)

“ 今天我给大家介绍一些python自动化测试中常见的面试题,涵盖了Python基础、测试框架、测试工具、测试方法等方面的内容,希望能够帮助你提升自己的水平和信心。” 项目相关 1.什么项目适合做自动化测试? 答:一般来说&#xff…