机器学习中的数学基础(四):概率论

news2025/1/13 7:53:45

机器学习中的数学基础(四):概率论

  • 4 概率论
    • 4.1 一些概念
    • 4.2 二维随机变量
      • 4.2.1 离散型
      • 4.2.2 连续型
    • 4.3 边缘分布
      • 4.3.1 离散型边缘分布
      • 4.3.2 连续型边缘概率密度
    • 4.4 期望
      • 4.4.1 一维期望
      • 4.4.2 二维期望
    • 4.5 马尔可夫不等式
    • 4.6 切比雪夫不等式

在看西瓜书的时候有些地方的数学推导(尤其是概率论的似然、各种分布)让我很懵逼,本科的忘光了,感觉有点懂又不太懂,基于此,干脆花一点时间简单从头归纳一下机器学习中的数学基础,也就是高数、线代、概率论(其实大学都学过)。
本文全部都是基于我自己的数学基础、尽量用方便理解的文字写的,记录的内容都是我本人记忆不太牢靠、需要时常来翻笔记复习的知识,已经完全掌握的比如极限连续性啥的都不会出现在这里。

学习内容来自这里

4 概率论

4.1 一些概念

随机事件:
是什么?扔硬币,王者峡谷击杀数,一批产品合格数。。。这些有什么特点呢?

  • 可以在相同条件下重复执行
  • 事先就能知道可能出现的结果
  • 试验开始前并不知道这一次的结果

随机试验E的所有结果构成的集合称为E的样本空间: S = { e } S=\{e\} S={e}
抛硬币: S = S= S= {正面,反面}
击杀数: S = S= S= {0,1,2,.….}

频率和概率:
在这里插入图片描述
实验次数越多,越稳定。

古典概型:
在这里插入图片描述

条件概率:
在这里插入图片描述
在这里插入图片描述

P(B|A)与P(AB):
相同点:事件A、B都发生了
不同点:样本空间不同。在P(B|A)中,事件A成为样本空间,在P(AB)中,样本空间仍为 Ω \Omega Ω

独立性:
在这里插入图片描述

重复独立试验:

  • 重复独立试验:在相同的条件下,将试验E重复进行,且每次试验是独立进行的,即每次试验各种结果出现的概率不受其他各次试验结果的影响。
  • n重伯努利试验:若一试验的结果只有两个,A和 A ‾ \overline{A} A,在相同的条件下,将试验独立地重复进行n次,则称这n次试验所组成的试验为n重伯努利试验伯努利概型
    计算:
    在这里插入图片描述

4.2 二维随机变量

有两个指标,不仅要观察两个指标各自的情况,还要了解其相互的关系。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2.1 离散型

在这里插入图片描述

4.2.2 连续型

在这里插入图片描述
举例子:
在这里插入图片描述

4.3 边缘分布

边缘分布函数:二维随机变量(X, Y)作为整体,有分布函数F(x,y)。其中,X和y都是随机变量,它们的分布函数记为: F X ( x ) F_X(x) FX(x) F Y ( y ) F_Y(y) FY(y),称为边缘分布函数。
在分布函数F(x,y)中令y趋向于正无穷,就能得到 F X ( x ) F_X(x) FX(x)
在这里插入图片描述

4.3.1 离散型边缘分布

在这里插入图片描述

4.3.2 连续型边缘概率密度

连续型的边缘概率密度
对于连续型随机变量 ( X , Y ) (X, Y) (X,Y) ,概率密度为 f ( x , y ) f(x, y) f(x,y)
X , Y X, Y X,Y 的边缘概率密度为: f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y , f Y ( y ) = ∫ − ∞ + ∞ f ( x , y ) d x f_X(x)=\int_{-\infty}^{+\infty} f(x, y) d y,f_Y(y)=\int_{-\infty}^{+\infty} f(x, y) d x fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx
事实上: F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x [ ∫ − ∞ + ∞ f ( t , y ) d y ] d t = ∫ − ∞ x f X ( t ) d t F_X(x)=F(x,+\infty)=\int_{-\infty}^x\left[\int_{-\infty}^{+\infty} f(t, y) d y\right] d t=\int_{-\infty}^x f_X(t) d t FX(x)=F(x,+)=x[+f(t,y)dy]dt=xfX(t)dt
同理:
F Y ( y ) = F ( + ∞ , y ) = ∫ − ∞ y [ ∫ − ∞ + ∞ f ( x , t ) d x ] d t = ∫ − ∞ y f Y ( t ) d t F_Y(y) =F(+\infty, y)=\int_{-\infty}^y\left[\int_{-\infty}^{+\infty} f(x, t) d x\right] d t =\int_{-\infty}^y f_Y(t) d t FY(y)=F(+,y)=y[+f(x,t)dx]dt=yfY(t)dt

举例子:
在这里插入图片描述

4.4 期望

4.4.1 一维期望

离散型:
在这里插入图片描述
连续型:
在这里插入图片描述

4.4.2 二维期望

在这里插入图片描述
期望的性质:
在这里插入图片描述

4.5 马尔可夫不等式

方差:
在这里插入图片描述
大数定理:在试验样本不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
小的样本试验不足以以偏概全因为有一些局限。

马尔可夫不等式:
P ( X ≥ a ) ≤ E ( X ) a , X ≥ 0 , a > 0 P(X\geq a)\leq \frac{E(X)}{a},\quad X\geq 0, a>0 P(Xa)aE(X),X0,a>0
证明:由 X ≥ 0 X\geq 0 X0 X ≥ a X\geq a Xa 可知, X a ≥ 1 \frac{X}{a}\geq1 aX1,那么: P ( X ≥ a ) = ∫ a + ∞ f ( x ) d x ≤ ∫ a + ∞ X a d x P(X\geq a)=\int_{a}^{+\infty} f(x) dx\leq \int_{a}^{+\infty} \frac{X}{a} dx P(Xa)=a+f(x)dxa+aXdx。则:
在这里插入图片描述

4.6 切比雪夫不等式

在这里插入图片描述
中心极限定理:样本的平均值约等于总体的平均值。不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/162871.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue2.0开发之——组件数据共享-Eventbus(39)

一 概述 兄弟组件之间数据共享的方案—EventBusEventBus的使用步骤EventBus的使用示例 二 兄弟组件之间数据共享的方案—EventBus 在 vue2.x 中,兄弟组件之间数据共享的方案是EventBus。 三 EventBus的使用步骤 创建 eventBus.js 模块,并向外共享一…

个人项目部署在云服务器上以及购买云服务器后如何操作

一. 购买云服务器后简单的操作1.镜像: 镜像可以认为是云服务器的操作系统,选择什么镜像云服务器就安装对应的操作系统。云服务器操作系统主要分为两大类,即Linux和Windows. 本次说明在linux操作系统下进行项目的部署, 那么在选择镜像的时可以选择Linux镜…

linux系统中利用QT实现串口通信的方法

大家好,今天主要和大家分享一下,如何使用QT中的串口通信方法。 目录 第一:资源简介 第二:应用实例的具体实现 第三:程序运行效果 第一:资源简介 在开发板的资源中出厂系统中,默认已经配置了两…

ASP.NET Core 3.1系列(27)——Autofac使用JSON、XML配置文件

1、前言 很多IoC框架都支持以配置文件的形式实现接口和类的注册,Autofac当然也不例外。本文就来介绍一下如何利用JSON、XML等配置文件来实现接口和类的注册。 2、定义接口和类 这里搭建了一个简单的分层项目,如下图所示: Repository层代码…

Verilog HDL

一、基础语法 1. 基础知识 (1)逻辑值 逻辑0:低电平。 逻辑1:高电平。 逻辑X:未知,可能是高电平,也可能是低电平。 逻辑Z:高阻态,外部没有激励信号,是一…

读书笔记《深度学习与图像识别原理与实践 大白话讲解对小白易懂》2022-8-5

开始 目录前言1. 常见深度学习框架2. 图像分类算法2.1 传统类2.2 机器学习2.2.1 人工神经网络(神经元)2.2.2 卷积神经网络3. 目标检测算法3.1 分类定位(单目标)3.2 分类定位(多目标,目标检测)3.…

近端串扰NEXT和远端串扰的ADS仿真

目录 近端串扰NEXT和远端串扰FEXT 串扰仿真原理图 NEXT特征 减少NEXT的措施 FEXT特征 减少FEXT的措施 本文记录近阶段对近端串扰和远端串扰概念的理解。 经验法则:最大可容许串扰大约是信号摆幅的5%。 近端串扰NEXT和远端串扰FEXT 静态线上的靠近驱动源的一端…

CTF中常用的http知识点总结

目录 前提知识 请求头大全 响应头大全 请求方法大全 常见考点 从某ip访问 从某网站跳转 身份为admin才可以访问 从某某浏览器访问 靶场练习 [极客大挑战 2019]Http Become A Member 前提知识 请求头大全 Header解释示例Accept指定客户端可以接收的内容类型Accep…

逆向分析资料汇总

商务合作 2023年招聘 ​安全业务和软件业务(商务合作) 移动端漏洞或隐私合规检测 APP常见漏洞扫描器 ​移动端APP隐私合规检测 2023年逆向分析资料汇总 移动端漏洞/安全检测与隐私合规解决方案 Frida逆向分析基础 APP基于Frida脱壳 frida hook so导出或未导出函数的方法…

【写作能力提升】写作小白需要避免的五个写作误区和灵魂五问

“ 【写作能力提升】系列文章: 为什么建议你一定要学会写作? 手把手教你快速搞定4个职场写作场景 5种搭建⽂章架构的⽅法”免费赠送! ”一、前言 Hello,我是小木箱,今天主要分享的内容是: 写作小白需要避免的五个写作误区和灵魂五问。 二、 …

E. The Human Equation(前缀和与差分数组)

嘤,总算过了 题目大意:可以从一个序列中按照顺序(可间断)选出一堆数,选出的这些数可以做以下操作: 奇数位置+1+1+1,偶数位置−1- 1−1偶数位置+1…

微信小程序项目实例——食堂吃哪个

微信小程序项目实例——食堂吃哪个 文章目录微信小程序项目实例——食堂吃哪个一、项目展示二、操作流程和核心代码三、效果展示文末项目代码见文字底部,点赞关注有惊喜 一、项目展示 这是一款娱乐性的小程序 目的是为了解决大学生吃饭的选择困难症 用户可以选择不…

51单片机的特殊功能寄存器(SFR)

阅读前提醒: 文中提到的8051指的是8051微控制器,即51单片机 在上一篇文章51单片机的存储结构中,提到8051微控制器的RAM被划分为通用寄存器、按位寻址寄存器、寄存器组、以及特殊功能寄存器。 这里讲一下特殊功能寄存器(SFR&…

五金制造业ERP如何解决企业销售管理难题?

销售管理是五金制造企业管理中非常重要的一个环节,它决定着企业发展的提速和效益的提升。那么企业要如何才能做好销售管理呢?在这里五金制造业ERP系统就起到了重要作用。五金制造业常见的销售管理难题及解决方法:销售插单改单严重&#xff0c…

在不同环境下 Docker 的安装部署

本篇内容主要介绍了:Docker:不同环境下的安装部署,包括,Docker 在 Centos7 下的安装、Docker 在 MacOS 下的安装、Docker 在 Windows 下的安装、以及 Docker 服务相关基础命令! 文章目录一、Docker 在 Centos7 下的安装…

使用Redhat OpenStack发放云主机

云管理员操作创建项目登录到OpenStack主界面,使用admin账户登录,创建项目虚拟内核:表明此项目可以使用的vCPU的数量实例:表明该项目最多可以运行的虚拟机数量注入的文件:表明最多可以向此数据中心存多少文件已注入文件…

react基础Day03-生命周期render props模式高阶组件原理揭秘

组件生命周期(★★★) 目标 说出组件生命周期对应的钩子函数钩子函数调用的时机 概述 意义:组件的生命周期有助于理解组件的运行方式,完成更复杂的组件功能、分析组件错误原因等 组件的生命周期: 组件从被创建到挂…

JVM学习(二):JVM监控及诊断工具-命令行篇

一、概述性能诊断是软件工程师在日常工作中需要经常面对和解决的问题,在用户体验至上的今天,解决好应用的性能问题能带来非常大的收益。Java 作为最流行的编程语言之一,其应用性能诊断一直受到业界广泛关注。可能造成Java应用出现性能问题的因…

十二.自定义类型:结构体、联合、枚举

目录 一.结构体 1.结构体类型的基础知识 (1)结构的声明 (2)匿名结构体 (3)结构体变量的定义和初始化 (4)结构的自引用 (5)结构体传参 2.结构体内存对齐…

227. 基本计算器 II

227. 基本计算器 II题目算法设计:栈扩展:后缀表达式题目 传送门:https://leetcode.cn/problems/basic-calculator-ii/submissions/ 算法设计:栈 一个功能完备的计算器功能,有很多功能,我们需要从最简单的…