从0开始深度学习(3)——概率

news2024/12/24 3:51:13

1 基本概率论

  • 大数定律(law of large numbers):随着投掷次数的增加,这个估计值会越来越接近真实的潜在概率。
  • 从概率分布中抽取样本的过程称为抽样(sampling)
  • 将概率分配给一些离散选择的分布称为多项分布(multinomial distribution)

1.1 概率论公理

概率(probability)可以被认为是将集合映射到真实值的函数。
在给定的样本空间
S
中,事件A的概率, 表示为P(A),满足以下属性:
在这里插入图片描述

1.2 随机变量

  • 离散随机变量(discrete random variable):取值为有限个或可数无限个值的随机变量称为离散随机变量。这些值通常是整数或有限范围内的离散点。例如:抛硬币的次数、骰子的点数、某段时间内到达的顾客数量等

  • 连续随机变量(continuous random variable):取值为实数区间上的任何值的随机变量称为连续随机变量。这些值通常是无限可分的,并且可以在一定范围内取任意值。例如:一个人的身高、重量、温度测量等

  • 概率密度函数(Probability Density Function, PDF):描述连续随机变量的概率分布的一种函数,例如:用身高举例,PDF通常是指在一个特定人群中随机选取一个人的身高落在某个区间内的概率

2 处理多个随机变量

2.1 联合概率(joint probability)

指的是两个或多个事件同时发生的概率。如果我们将这些事件记作A和B,则联合概率P(A, B)表示事件A和事件B共同发生的概率。

2.2 条件概率(conditional probability)

指的是给定另一个事件已经发生的条件下,某个事件发生的概率。条件概率通常用符号 P(A∣B)表示,读作“在事件B发生的条件下事件A发生的概率”。

2.3贝叶斯定理

在这里插入图片描述
在这里插入图片描述

2.4 边际化(Marginalization)

指从联合概率分布中去除一个或多个随机变量的过程。

边际化的一个常见用途是从联合概率分布中提取单个变量或一组变量的概率分布。这通常通过求和(对于离散变量)或积分(对于连续变量)来实现,从而消除掉我们不感兴趣的变量。
在这里插入图片描述
在这里插入图片描述
边际化结果的概率或分布称为边际概率(marginal probability) 或边际分布(marginal distribution)。

2.5 独立性

如果两个随机变量A和B是独立的,意味着事件A的发生跟事件B的发生无关

3 期望与方差

3.1 期望(Expected Value)

指重复进行大量相同的试验时,随机变量的观测值的平均值。

3.1.1 对于离散随机变量X

在这里插入图片描述

3.2.1 对于连续随机变量X

在这里插入图片描述

3.2 方差(Variance)

方差是衡量随机变量与其期望值之间偏差平方的平均值
在这里插入图片描述
PS:
在这里插入图片描述

方差的平方根被称为标准差(standard deviation)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2098603.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【大模型实战篇】RoPE旋转位置编码PyTorch代码分析

1. 背景介绍 之前我们通过两篇技术文章《LLaMA3结构关键模块分析》和《RoPE旋转位置编码底层数学原理分析》对旋转位置编码RoPE的原理进行了必要的讲解。接下来,我们将针对来自rotary-embedding-torch【1】开源库的实现,对RoPE的PyTorch代码实现进行分…

前后端分离的security角色权限实现

本案例是使用SpringBoot2.7.6securityMyBatis-plusVue2axios实现 一、security简介 Spring Security是一个功能强大且高度可定制的身份验证和访问控制框架,专为Java应用程序设计。 (1)基本功能 身份验证(Authentication&#x…

关于安装MySQL遇到的问题

数据库相关概念 💡数据库系统 ( DataBase System, 简称 DBS) 是指计算机系统引入数据库后的系统构成, 是一个具有管理数据库功能的计算机软硬件综合系统。 数据库系统可以实现有组织地、动态地存储大量数据、提供数…

【补-办公室】拟批语的区别

拟批语 常见拟批语 批示、审示、阅示、核注 审批、审核、审阅、审定(订)、审发、审议、审处、阅改、阅知、阅研、阅处、研提、研办、研复、核(转)报、核示、核批、批办等 阅示和审示 区分是收文还是发文 发文审,收文阅…

本地部署AList并挂载小雅超集结合内网穿透实现无公网IP远程访问

文章目录 前言1. 本地部署AList2. AList挂载网盘3. 部署小雅alist3.1 Token获取3.2 部署小雅3.3 挂载小雅alist到AList中 4. Cpolar内网穿透安装5. 创建公网地址6. 配置固定公网地址 💡 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂&#xff…

jenkins-gitee-genkins

在电脑下载git 用一个有war包的项目 下载插件 添加 .ignore文件 添加target 建git仓库 提交 推送 推送完成在gitee能看到 这时候已经完成了前两部 项目如果添加功能

[嵌入式 C 语言] int main(int argc, char *argv[])

一、含义 在C语言中,main 函数是程序的起点,也就是执行的入口点。main 函数可以接受命令行参数,并且通常定义如下: int main(int argc, char *argv[]) int argc: 这个参数代表“参数计数”(Argument Count&#xff0…

实验记录 | PointMLP | Grouping layer + Geometric Affine

引言 自 PointNet 腾空出世,点云分析的深度框架便成为了该领域的热点,点云学习网络的发展便一发不可收拾。和大部分深度网络一样,点云网络遵循着 “降采样,聚合特征” 的基本思路,逐步提取点云的深度特征。 大部分点…

【九芯电子】星空灯语音识别芯片方案选型——NRK3301

在快节奏的现代生活中,人们对于居家环境的舒适性与便捷性追求日益增强,而星空灯语音控制的技术诞生,正是这一追求下的智慧结晶,极大地提升了居住的愉悦感与科技感。 九芯NRK3301语音识别芯片‌被广泛应用于智能照明产品中&#xf…

【python因果推断库2】使用 PyMC 模型进行差分-in-差分(Difference in Differences, DID)分析

目录 使用 PyMC 模型进行差分-in-差分(Difference in Differences, DID)分析 导入数据 分析 使用 PyMC 模型建模银行业数据集 导入数据 分析 1 - 经典 22 差分-in-差分 (DiD) 分析 2 - 具有多个干预前后观测值的差分-in-差分 (DiD) 分析 使用 PyMC…

VSCode + Git的常规操作(一)【描述详细直白,小白一学就会】

目录 一、文章简介 二、具体操作流程 1、操作前提 2、设置用户名、用户邮箱 (1)打开命令框 (2)配置用户名 (3)配置用户名邮箱 (4)查看配置 3、SSH密钥对的介绍、生成及配置…

008、架构_MDS

​架构 什么是元数据 什么是元数据 元数据又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能;GoldenDB 数据库元数据大致分为两类: 数据字典:库、表、字段属性信息、视图、函数、存储过程属…

【代码随想录训练营第42期 Day48打卡 - 单调栈 - LeetCode 739. 每日温度 496.下一个更大元素 I 503.下一个更大元素II

目录 一、做题心得 二、题目与题解 题目一:739. 每日温度 题目链接 题解1:暴力--超时 题解2:单调栈 题目二:496.下一个更大元素 I 题目链接 题解:单调栈哈希 题目三:503.下一个更大元素II 题目链…

神经网络训练不起来怎么办(五)| Batch Normalization

Ⅰ,领域背景 训练困境:当 input feature 在不同 dimension 上差距很大的时候,会产生一个非常崎岖的 error surface(误差平面)。这种崎岖多变的误差平面容易导致训练陷入以下的几个困境。 收敛困难:在崎岖…

注释1111

3。3 Batch Normalization (BN) 的工作原理 Batch Normalization 是在处理一个 "批次" 数据时,计算这个批次内所有样本的平均值和方差,然后使用这些统计量对每个样本进行归一化。这就是说: 批次(batch)&a…

局部整体(五)利用python绘制旭日图

局部整体(五)利用python绘制旭日图 旭日图( Sunburst Charts)简介 由于其形状像太阳光由内向外辐射出来,所以叫SunBurst(太阳爆发),中文也叫日出图。是多个层级的环图/饼图的拓展,可以显示多个…

GNU的编译工具链

文章目录 GNU的编译工具链 GNU的编译工具链 预编译器cpp 编译器 cc1 汇编器 as 链接器 ld 其中cpp和cc1属于gcc的一部分,as和ld属于binutils的一部分。

MySQL-如何定位慢查询

慢查询:页面加载过慢,接口压测响应时间过长(超过1s)

STM32基础篇:PWR

PWR简介 PWR(Power Control),为电源控制模块,负责管理STM32内部的电源供电部分,可以实现可编程电压监测器和低功耗模式的功能。 1、可编程电压监测器 简称PVD,可以监控VDD电源电压。当VDD下降到PVD阀值以…

yum安装nexus3详细教程分享

创建nexus用户,类似于这种中间件,尽量做到专户管理,当然如果你喜欢直接用root权限安装,更改配置文件也是可以支持的。但是实际上大多情况下,在生产环境是拿不到root权限的。 useradd -m nexus为nexus用户设置密码 pass…