【RL数学基础】概率论的基本概念:随机变量、概率密度函数、期望、随机抽样

news2025/3/6 23:59:33

文章目录

  • 1.随机变量(Random Variable)
  • 2.概率密度函数(Probability Density Function, PDF)
  • 3.期望(Expectation)
  • 4.随机抽样(Random Sampling)

1.随机变量(Random Variable)

在这里插入图片描述
随机变量(Random Variable) 是一个未知的量,它的值取决于一个 随机事件(Random events) 。以抛硬币为例,抛硬币就是一个 随机事件 。正面朝上记为0,反面朝上记为1,因此抛硬币的结果就是一个 随机变量 X X X

注意: 通常用大写字母 X X X表示随机变量;用小写字母 x x x表示随机变量的观测值。例如抛硬币:

  • 第1次是正面,则 x 1 = 0 x_{1}=0 x1=0
  • 第2次是反面,则 x 2 = 1 x_{2}=1 x2=1
  • 第3次是正面,则 x 3 = 0 x_{3}=0 x3=0
  • 第4次是正面,则 x 4 = 0 x_{4}=0 x4=0

2.概率密度函数(Probability Density Function, PDF)

在这里插入图片描述
概率密度函数(PDF)表示了:随机变量 X X X 在某个确定的点 x = x 0 x=x_0 x=x0 附近取值的可能性。

理解1: 以高斯分布/正态分布(Gaussian distribution)为例。高斯分布是个连续的概率分布,它的概率密度函数PDF公式为:
p ( x ) = 1 2 π σ 2 exp ⁡ ( − ( x − μ ) 2 2 σ 2 ) p(x)=\frac{1}{\sqrt{2 \pi \sigma^{2}}} \exp \left(-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right) p(x)=2πσ2 1exp(2σ2(xμ)2)

其中,随机变量 X X X 的取值可以是任意实数 x ∈ R x\in \mathcal{R} xR μ \mu μ是均值, σ \sigma σ是标准差 。

高斯分布的图像如下图所示。在高斯分布的概率密度函数PDF图像中,横轴 x x x 是随机变量 X X X 的取值,纵轴 p ( x ) p(x) p(x) 是随机变量的概率密度,曲线 p ( x ) p(x) p(x) 是高斯分布的概率密度函数 p ( x ) p(x) p(x)。图像说明了: x x x 在原点( x = 0 x=0 x=0 )附近取值的概率比较大;在远离原点的地方( x = ∞ x=\infty x= )取值的概率比较小。

在这里插入图片描述

理解2: 以离散的概率分布为例,如下图所示。 随机变量 X X X 的取值只能是离散的值 X ∈ { 1 , 3 , 7 } X \in \{1, 3, 7\} X{1,3,7}

在这里插入图片描述

离散的概率分布的概率密度函数PDF表示了随机变量 X X X 在 1、3、7 这三个点取值的可能性(概率):

  • p ( 1 ) = 0.2 p(1) = 0.2 p(1)=0.2 说明:随机变量 X X X x = 1 x=1 x=1 时取值的概率概率为0.2 (x=1的概率为0.2)
  • p ( 3 ) = 0.5 p(3) = 0.5 p(3)=0.5 说明:随机变量 X X X x = 3 x=3 x=3 时取值的概率概率为0.5 (x=3的概率为0.2)
  • p ( 7 ) = 0.3 p(7) = 0.3 p(7)=0.3 说明:随机变量 X X X x = 7 x=7 x=7 时取值的概率概率为0.3 (x=7的概率为0.3)
  • 同时还说明在其他地方的取值为0。

概率密度函数PDF的性质(令随机变量 X X X 的定义域为 X \mathcal{X} X ):

  • 对于连续型随机变量 X X X 的概率密度函数PDF,随机变量 X X X 积分的值等于1,即:
    ∫ x ∈ X p ( x ) d x = 1 \int_{x\in\mathcal{X}}^{} p(x) dx = 1 xXp(x)dx=1
  • 对于离散型随机变量 X X X的概率密度函数PDF,随机变量的和的值等于1,即:
    ∑ x ∈ X p ( x ) = 1 {\textstyle \sum_{x\in\mathcal{X}}^{} p(x)=1} xXp(x)=1

3.期望(Expectation)

在这里插入图片描述
期望的定义(令随机变量 X X X 的定义域为 X \mathcal{X} X ):

  • 连续型随机变量 X X X 的期望:
    E [ f ( x ) ] = ∫ x ∈ X p ( x ) ⋅ f ( x ) d x \mathbb{E}[f(x)]=\int_{x\in\mathcal{X}}^{} p(x)\cdot f(x)dx E[f(x)]=xXp(x)f(x)dx

  • 离散型随机变量 X X X 的期望:
    E [ f ( x ) ] = ∑ x ∈ X p ( x ) ⋅ f ( x ) \mathbb{E}[f(x)]=\textstyle \sum_{x\in\mathcal{X}}^{} p(x)\cdot f(x) E[f(x)]=xXp(x)f(x)

理解:

p ( x ) p(x) p(x) 是随机变量 X X X 观测值 x x x 的概率, f ( x ) f(x) f(x) 是随机变量 X X X 观测值 x x x 出现的次数。以掷色子为例:

p ( x = 1 ) = 1 6 p(x=1)=\frac 1 6 p(x=1)=61 f ( x ) = 10 f(x)=10 f(x)=10 的含义:其中 p ( x = 1 ) p(x=1) p(x=1) 表示色子点数为1出现的概率为 1 6 \frac 1 6 61 f ( x ) = 10 f(x)=10 f(x)=10 表示色子点数为1出现的次数为10次。

4.随机抽样(Random Sampling)

在这里插入图片描述

随机抽样: 按照随机原则,利用随机数,从总体中抽取样本的方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/103929.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

新一代免费开源大型企业数智制造解决方案

国家加速推进信创产业的开源自主可控 信创产业,即信息技术应用创新产业,其包含了从信息化基础设施到底层系统,再到上层的应用软件,与信息化建设过程中涉及有关的全产业链都必须安全与可控。信创产业涉及到的领域包括信息化基础设施…

编译安装nmon

nmon 是什么? nmon(Nigel’s performance Monitor for Linux)是一种Linux性能监视工具,当前它支持 Power/x86/x86_64/Mainframe/ARM 这五种 CPU 架构的 Linux,能将监控到的数据保存为 JSON 格式便于其他工具进行分析和…

【探索Spring底层】13.深入DispatcherServlet

文章目录1. DispatcherServlet概述2. DispatcherServlet的初始化时机3. DispatcherServlet初始化执行的操作4. RequestMappingHandlerMapping 基本用途5. RequestMappingHandlerAdapter 基本用途6. 参数和返回值解析器1. DispatcherServlet概述 DispatcherServlet是SpringMVC的…

AMS启动流程——APP启动过程

AMS流程图 基本慨念 1.zygote zygote意为“受精卵“。Android是基于Linux系统的,而在Linux中,所有的进程都是由init进程直接或者是间接fork出来的,zygote进程也不例外。 在Android系统里面,zygote是一个进程的名字。Android是基…

Effective C++(三):资源管理

个人读书记录,不适用教学内容。 目录 条款13:以对象管理资源 条款14:在资源管理类中小心copying行为 条款15:在资源管理类中提供对原始资源的访问 条款16:成对使用new和delete时要采取相同形式 条款17&#xff1a…

cubeIDE开发, STM32实时时钟(RTC)写入及读取日历时间开发要点

一、RTC简介 实时时钟的缩写是RTC(Real_Time Clock),核心是晶振,晶振频率一般为32768 Hz 。它为分频计数器提供精确的与低功耗的实基信号。它可以用于产生秒、分、时、日等信息。为了确保时钟长期的准确性,晶振必须正常工作,不能够…

中小企业的公司财务管理系统

开发工具(eclipse/idea/vscode等): 数据库(sqlite/mysql/sqlserver等): 功能模块(请用文字描述,至少200字): 本课题研究对象是中小企业财务管理系统,设计采用自己开发实践和所学知 识,系统部分主要分为以下…

【圣诞树代码】送她六棵圣诞树,祝她圣诞快乐~(送女朋友必备!)

“ 六棵圣诞树,满足她圣诞愿望 ” 距离25号圣诞节只有几天了,程序员有属于程序员的浪漫,这不来了~ 如果一颗圣诞树不够,那就送她六棵,祝她圣诞快乐~ 直接上效果图—— 01 02 03 04 05 06 代码如下: 第…

[1184]FinalShell下载安装

文章目录FinalShell介绍初步使用更换背景图连接记录删除FinalShell介绍 官网:http://www.hostbuf.com/ http://www.hostbuf.com/?install_fs FinalShell 简介: FinalShell 相当于 xshell ftp 的组合,即:FinalShell xshell f…

【计算机考研408】中断处理流程

中断请求 中断源是请求CPU中断的设备或事件,一台计算机允许有多个中断源。每个中断源向CPU发出中断请求的时间是随机的。 中断响应判优 中断响应优先级是指CPU响应中断请求的先后顺序。当多个中断源同时提出请求时,需通过中断判优逻辑来确定响应哪个中…

Python asyncore socket客户端开发基本使用

目录 介绍 1.定义类并且继承 asyncore.dispatcher 2.实现类中的回调代码 调用父类方法 创建 socket 对象 连接服务器 3.创建对象并且执行 asyncore.loop 进入运行循环 服务端示例代码 运行结果 注意: 介绍 asyncore库是python的一个标准库,提…

作为程序员,你离拿offer就差这个免费且好用的简历制作工具

为什么你的简历总是石沉大海?为什么你投递的岗位迟迟得不到回应?除了岗位招满、HR没看到以及竞争太激烈等客观因素外,最重要的是——“简历”出现了问题。 “简历”就像名片一样,在面试和求职的过程中,一份优质的简历…

数字孪生城市项目的关键技术展望

智慧城市是社会空间、物理空间和信息系统三元有机融合的条件下城市智慧化转型的新型态, 运用以数字孪生为代表的新一代信息化技术优化城市系统, 提升城市品质和综合竞争力, 从而实现可持续发展成为智慧城市构建的新趋势。 数字孪生城市项目的关键技术 北京智汇云舟科技有限公司…

chrome的几种存储storage模式

Storage生命周期存放数据大小与服务器通信localStore 除非被清除,否则永远保存 一般5MB 仅在客户端(即浏览器)中SessionStorage仅在当前会话下有效,关闭页面或者浏览器后被清除 一般5MB 保存,不参与和服务器的通信Cookies一般由服务器生成&a…

荣盛生物将再次上会:前三季度收入约2亿元,曾被暂缓审议

近日,上海证券交易所披露的信息显示,上海荣盛生物药业股份有限公司(下称“荣盛生物”)将于2022年12月26日接受科创板上市委员会的现场审议(即“上会”)。据贝多财经了解,荣盛生物曾于11月7月7日…

TCP滑动窗口、流量控制、拥塞控制

TCP滑动窗口、流量控制、拥塞控制一、滑动窗口二、流量控制三、拥塞控制一、滑动窗口 上篇博客我们介绍了TCP报文结构、确认应答机制、超时重传机制、连接管理机制。 TCP保证了可靠传输,但是失去了效率。那么怎么样尽可能提高传输效率呢??&a…

react笔记_07组件实例化对象的三大属性

目录前提状态(state)作用状态使用总结属性(props)展开运算符复习props-作为属性传入数据props-使用展开运算符展开对象props-进行数据类型限制propTypes语法校验规则举例说明defaultProps语法举例说明refs字符串形式的ref语法举例说明注意点回调形式的ref什么叫做回调&#xff…

RT-Thread 简介

1.RT-Thread 概述 RT-Thread,全称是Real Time-Thread,顾名思义,它是一个嵌入式实时多线程操作系统, 基本属性之一是支持多任务,允许多个任务同时运行并不意味着处理器在同一时刻真地执行了多个任务。 事实上&#xff…

Redis实战——签到统计(BitMap的用法)

1. 什么是BitMap 我们针对签到功能完全可以通过mysql来完成,比如说以下这张表 但是,用户一次签到,就是一条记录,假如有1000万用户,平均每人每年签到次数为10次,则这张表一年的数据量为 1亿条。 每签到一次…

js实现图片的放大缩小(鼠标长按拖拽、鼠标滚轮控制放大缩小)

系列文章目录 文章目录系列文章目录背景与效果图1.背景如下(功能图):2.效果图如下:拖拽后的效果缩放的效果放大的效果一、功能:支持鼠标长按拖拽1.鼠标事件:2.拖拽功能流程3.拖拽部分代码如下二、功能&…