概率 随机变量以及分布

news2024/10/21 17:33:45

一、基础定义及分类

1、随机变量

        随机变量是一个从样本空间(所有可能结果的集合)到实数集的函数。(随机变量的值可以是离散的,也可以是连续的。 )

        事件可以定义为随机变量取特定值的集合。

2、离散型随机变量

        随机变量的取值是可数的,即有限个或可数无限个。取值之间有“间隔”,不是连续变化的。每个取值都有一个特定的概率,且所有取值的概率之和等于1。

        概率质量函数(PMF):对于所有的 x,有 P(X=x)≥0;所有可能取值的概率之和等于1。

 例如:假设由5个黑球,3个白球,每次取一个球不放回,直到取到黑球为止,X为取到白球的数量,求取到黑球的概率。

解:列出渠道黑球可能(0白1黑、1白1黑、2白1黑、3白1黑),将白球数量列为X,则

P(X=0)= 5/8;P(X=1)= 3/8 * 5/7 =15/56;P(X=2)= 3/8 *2/7* 5/6=5/56;P(X=3)= 3/8 *2/7* 1/6* 5/5 =1/56

画出概率分布表:

X0123
P5/815/565/561/56

验证:5/8 +  15/56 + 5/56+ 1/56 =1

3、连续型随机变量

        取值可以是某个区间内任意实数的随机变量。随机变量的取值是连续的,可以在一个或多个区间内取任意值。 取值是不可数的,即有无限多个可能的取值。每个取值区间都有一个特定的概率,且整个取值范围的概率密度函数积分等于1。在任意一点的概率都是0。在函数曲线上某个点的概率其实是取的该点附近值的大小。

        概率密度函数(PDF) ;对于一维实随机变量X,如果存在非负可积函数f(x),使得对于任意实数x,a\leq b 存在 P(a<X\leq b)=\int _a^bf(x) dx;对于所有的 x,有f(x)\geq 0 ;整个取值范围的积分等于1,即\int _{-\infty}^{+\infty} f(x) dx=1 。概率密度函数的积分其实就是求曲线在某个区间内的面积。

例如:假设密度函数 ,求k

解:根据函数列出 \int _{-\infty}^{+\infty}f(x)dx=\int _{0}^{2}f(x)dx = \int _{0}^{2} kx+1dx = (\dfrac{k}{2} * x^2+x)|_0^2 =2k+2=1 => k =-1/2

二、分布函数

1、定义

        描述随机变量取值分布情况的函数,无论是离散型随机变量还是连续型随机变量,都可以通过分布函数来描述其概率特性。分布函数通常指的是累积分布函数(Cumulative Distribution Function, CDF),用 F(x) 表示。

2、使用方法

        积分布函数(CDF) ;对于随机变量 X,其累积分布函数 F(x) 定义为随机变量 X 取值小于或等于 x 的概率: F(x)=P(X≤x) 。

        随着 x 的增加,F(x) 是非减的,即 F(x1)≤F(x2)对于所有的 x1≤x2 成立。 F(x)的值域在 0 到 1 之间,即 0≤F(x)≤1。任意点 x 都是右连续的。对于离散型随机变量,F(x) 在任意点 x 是右连续,对于连续型随机变量,F(x) 在任意点 x 是连续的。

        常用公式: F(x) = P(X≤x) ;  P(X≤a) = F(a) ; P(X>a) = 1-P(X≤a) = 1-F(a); P(a<X≤b) = P(X≤b)-P(X≤a)=F(b)-F(a)

例如离散型:假设概率分布表如下(求分布函数F(x) ):

X-123
P1/21/31/6

   根据x取值划分({-\infty},-1)、(-1,2),(2,3),(3,{\infty}

则:F(x)=P(X≤-1)=0 ;F(x)=P(-1≤X<2)=1/2;F(x)=P(2≤X<3)=5/6 ; F(x)=P(3≤X<{\infty})=1

例如连续型:假设函数如图,求分布函数F(x):

根据x取值划分({-\infty},0)、(0,2)、(2,{\infty}

F(X)= \int _{0}^{2}f(x)dx =\int _{0}^{2} -1/2 * x +1 dx =  -1/4 * x^{2} + x

3、常见分布

3.1离散型

3.1.1、0-1分布

        伯努利分布 :C_n^k p^k {(1-p)}^{n-k}

3.1.2 几何分布

        在独立重复的伯努利试验中,首次成功所需的试验次数:  P(X=k)={(1-p)}^{k-1} ⋅ p

3.1.3、二项分布

        n 次伯努利试验中成功的次数,那么 X 服从参数为 n 和 p 的二项分布,记作 X∼B(n,p) :P(X=k)=C_n^kp^k{(1-p)}^{n-k} 

3.1.4、泊松分布

        固定时间或空间内事件发生次数的离散型概率分布。 适用于事件发生的概率较小且事件之间相互独立的情况。 P(X=k)=λ^k  /  k!    * e^-λ

3.1.5、均匀分布

        续均匀分布中,所有可能的结果是连续的,并且在相同长度间隔的分布概率是相同的。

        均匀分布的概率密度函数(PDF):对于连续型随机变量 X,如果它服从区间 [a,b]上的均匀分布,其概率密度函数为:f(x)= 1 / (b-a) ,其实就是面积为1,宽为 b-a 的长方形区域,那它的高就是1 / (b-a)

3.2、连续型

3.2.1、指数分布

        概率密度函数  x 是随机变量,表示事件发生的时间间隔;λ 是率参数,表示单位时间内事件发生的平均次数。其对应的分布函数如图:

3.2.2、正态分布

        表达形式: X \sim N(μ,σ^2)

        概率密度函数 (x 是随机变量;μ 是均值;σ是标准差;σ^2是方差),其基本性质为 y=f(x)以x=u为对称轴;x=u时,f(x)取到最大值 ;y=f(x)以x轴为渐近线,x±σ为拐点 ;σ固定,μ 变化,图像左右移动;μ 固定,σ变小,最高点上移,σ变大,最高点下移。

        分布函数 

3.2.3、标准正态分布

         表达形式: X \sim N(0,1) ;标准正态分布的均值为0,标准差为1(y轴是对称轴,为偶函数)

        概率密度函数 ,也就是在正态分布基础上将 μ 与 σ 进行赋值后变形。

        分布函数  

3.2.4、正态分布标准化

第一步:设 y=x-μ 

第二步:标准化,设 z = y /σ = (x-μ )/σ

得到了以Z为变量的正态分布函数  Z∼N(0,1) 。

标准化正态分布和正态分布的关系  

概率密度函数   

分布函数 

三、随机变量函数的分布

        从原有随机变量出发,通过某种函数关系得到新的随机变量。

1、离散型

第一步:确定x的值 ,找出所有使得 g(x)=y 成立的 x 的值。

第二步:对于每个满足条件的 x,将 X 取该值后的函数结果进行整理,相同结果的概率相加。

        离散型随机变量函数的分布函数计算,最简单的方法是列出随机变量X的分布表,然后根据新的函数关系计算出新随机变量Y的值,其值对应的概率就是X原来值对应的概率值,然后形成分布表,如果Y值有重复,则将重复值对应的概率相加即可。

例如1:假设随机变量X的分布表:求Y=X^2

X123
P0.20.50.3

解:根据x的变化列出y的变化

Y149
P0.20.50.3

例如2:假设随机变量X的分布表:求 Y=X^4 - 1

解:先根据随机变量的函数关系计算Y值,再将X的概率值填入

Y150-1015
P0.20.10.50.10.1

进行重复项合并,按照从低到高排列:

Y150-1
P0.30.20.5

2、连续型

第一步:获取 Y的分布函数 ;F_Y(y) =P(Y≤y) = P(g(X)≤y)

第二步:对分布函数求导获得概率密度函数:f_Y(y)=d/dy * F_Y(y)

例如:已知随机变量X的概率密度函数为 f_X(x),求 Y=3X+2 的密度函数,假设f_X(x)服从在区间[0,4]的均匀分布 ,求f_Y(x)

解:

第一步:求Y的分布函数:F_Y(x) =P(Y≤x) = P(g(X)≤x) = P(3X+2 ≤ x )=P(X≤(x-2)/3) =F_X((x-2)/3)

第二步:对分布函数求导:f_Y(x)=F_Y'(x) = F_x' ((x-2)/3) = 1/3 * f_X((x-2)/3)

第三步:带入x的概率密度函数内容,得到 区间从[0,4] =>[0,12] ,1/4=>1/12,其他不变

例如: 求Y=2X+8的概率密度

第一步:F_Y(x) =F_Y(Y ≤ x) = F_X(2X+8≤x)=F_X((x-8)/(2))

第二步:f_Y'(x)=F_Y'(X)=F_X'((x-8)/(2))=1/2 * f_X'((x-8)/(2))

第三步:带入x的密度函数,获得y的密度函数:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2213743.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么才能算AI智能体?

科技界对 AI 智能体的痴迷愈演愈烈。销售从智能体到自动化系统&#xff0c;比如像 Salesforce 和 Hubspot 这样的公司声称可以提供具有颠覆性的 AI 智能体。但是&#xff0c;我还没有看到一个真正令人信服、完全自主的基于 LLM 的智能体。市场上充斥着各种 “废物机器人”&…

OIDS与ERP:物料管理的高效协同

添加HanTop-MKT&#xff0c;咨询物料管理协同解决方案 客户案例 背景&#xff1a; 在当前快速发展的3C自动化行业&#xff0c;企业面临着前所未有的挑战。产品生命周期的缩短、个性化需求的增长以及市场变化的加速&#xff0c;都要求企业必须具备快速响应的能力。在这样的环…

一个月学会Java 第15天 枚举与Debug

Day15 枚举与Debug 这节课我们来看看枚举&#xff0c;和Debug&#xff0c;当我们学完并会用debug之后呢&#xff0c;编码会非常的舒服&#xff0c;而且debug就是调试嘛&#xff0c;所以我们会了debug之后&#xff0c;在程序哪里出问题也可以进行锁定。 第一章 枚举 枚举并不是非…

Spring Boot知识管理:提升团队协作效率

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统&#xff0c;它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等&#xff0c;非常适…

探索巅峰性能 |迅为 RK3588开发板深度剖析

RK3588作为瑞芯微公司旗下一款高端处理器的杰出代表&#xff0c;凭借卓越的性能与多样化的外设接口成为了众多开发和爱好者的首选。随着RK3588在市场上的广泛应用&#xff0c;大家不禁要提出疑问&#xff1a;RK3588究竟强在何处&#xff1f;在2022年&#xff0c;北京迅为电子推…

【Linux网络编程】--- Linux基本指令(上)

Welcome to 9ilks Code World (๑•́ ₃ •̀๑) 个人主页: 9ilk (๑•́ ₃ •̀๑) 文章专栏&#xff1a; Linux网络编程 &#x1f3e0; ls命令 语法 : ls -[选项] [目录或文件] 功能 : 对于目录,该命令列出该目录下的所有子目录与文件;对于文件,将列出文件名…

STL.string(上)

string string类string类构造string类对象的容量操作size和lengthmax_sizeappend小总结下size、capacity、append、operatorresizereserve 初识迭代器附录1. vs下string结构的说明&#xff08;解释前文为什么capacity是16而不是别的&#xff09; 由于string创始初期没有参照导致…

1.centos 镜像

centos 它有官网的下载地址&#xff1a;https://vault.centos.org/ 选择想要的版本&#xff0c;我选择 centos7.8 进入到镜像目录 isos 选择 x86_64 选择想要的版本&#xff0c;我选择 CentOS-7-x86_64-DVD-2003.iso 安装就正常安装就行。我选择虚拟机安装。这个参考&…

一区鱼鹰优化算法+深度学习+注意力机制!OOA-TCN-LSTM-Attention多变量时间序列预测

一区鱼鹰优化算法深度学习注意力机制&#xff01;OOA-TCN-LSTM-Attention多变量时间序列预测 目录 一区鱼鹰优化算法深度学习注意力机制&#xff01;OOA-TCN-LSTM-Attention多变量时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 1.基于OOA-TCN-LSTM-Attenti…

Java 入门基础篇11 - java基础语法

一 流程控制 1.1 流程控制语句介绍 一个java程序有很多条语句组成&#xff0c;流程控制语句是用来控制程序中的各语句执行的顺序&#xff0c;通过流程语句控制让程序执行顺序达到我们想要实现的功能。 其流程控制方式采用结构化程序设计中规定的三种基本流程结构&#xff1a;…

金融信用评分卡建模项目:AI辅助

最近我一直忙着开发一个信用评分卡建模工具&#xff0c;所以没有时间更新示例或动态。今天&#xff0c;我很高兴地跟大家分享&#xff0c;这个工具的基本框架已经完成了&#xff0c;并且探索性的将大语言模型&#xff08;AI&#xff09;整合了进去。目前ai在工具中扮演智能助手…

探索人工智能:深度解析未来科技的核心驱动力

目录 &#x1f354; 人工智能的应用方向 &#x1f354; 人工智能的发展历史 &#x1f354; 人工智能、机器学习、深度学习关系 &#x1f354; 为什么学习机器学习&#xff1f; &#x1f354; 小节 学习目标 &#x1f340; 了解人工智能的应用方向 &#x1f340; 了解人工智…

CICD持续集成交付与持续交付

一 CICD是什么 CI/CD 是指持续集成&#xff08;Continuous Integration&#xff09;和持续部署&#xff08;Continuous Deployment&#xff09;或持续交付&#xff08;Continuous Delivery&#xff09; 1.1 持续集成&#xff08;Continuous Integration&#xff09; 持续集成…

javascript object

用const去define一个constant 用let (如果要reassign的话) 一个变量。

每天3分钟,彻底弄懂神经网络的优化器(十一)AdamW

1. AdamW算法的提出 AdamW算法是由Ilya Loshchilov和Frank Hutter提出的。这一算法的详细描述和原理可以在论文《Decoupled Weight Decay Regularization》1中找到&#xff0c;该论文发表于2017年。在论文中&#xff0c;作者指出了传统Adam算法在权重衰减&#xff08;weight d…

初等数学几百年重大错误:将根本不是无穷集的真子集误为其真子集

黄小宁 【摘要】长为1的直线段形橡皮筋A拉长为长为2的橡皮筋B&#xff08;可二等分&#xff09;&#xff0c;去掉拉力使B缩短成原来的A&#xff0c;A不是B的一半。同样可证直线段L均匀压缩变短为直线段D&#xff5e;L不能成为L的一部分。数学一直误以为D是L的一部分使康脱推出…

C/C++栈和队列

一.队列 结构定义 FIFO:队列是一个先进先出的数据结构; 只允许从队首出元素,从队尾入元素; head和tail所包含的区间是左闭开的; 入队操作 没用真实将一号元素删除,而是将head指针向后移动一位,进行逻辑上的删除; 出队操作 将新元素储存在队尾指针所在的位置,并将队尾指针…

二校区图书馆一楼《中华再造善本》很多

上两幅为同一本书的&#xff0c;有“太平之时嫌官小&#xff0c;离乱之时怕出征”这句 上两幅为同一本书的&#xff0c;为《水浒传》节选 二校区图书馆一楼满眼都是线装的古书《中华再造善本》 图书馆五楼 图书馆四楼&#xff0c;一个人躺在长沙发上 图书馆一楼的透明电梯

Intel Xeon(至强) 服务器 CPU

Purley平台&#xff1a;Sky Lake&#xff08;第一代&#xff09;、Cascade Lake&#xff08;第二代&#xff09; Whitley平台&#xff1a;Cooper Lake、Ice Lake&#xff08;第三代&#xff09; Eagle Stream平台&#xff1a;Sapphire Rapids、Emerald Rapids&#xff08;第四…

Vite打包碎片化,如何化解?

背景 我们在使用Vite进行打包时&#xff0c;经常会遇到这个问题&#xff1a;随着业务的展开&#xff0c;版本迭代&#xff0c;页面越来越多&#xff0c;第三方依赖也越来越多&#xff0c;打出来的包也越来越大。如果把页面都进行动态导入&#xff0c;那么凡是几个页面共用的文…