概率论和随机过程的学习和整理20:条件概率我知道,但什么是条件期望?可用来解决递归问题

news2024/10/7 3:50:15

目录

1 目标问题: 什么是条件期望? 条件期望有什么用?

2 条件期望,全期望公式

3 条件期望,全期望公式 和 条件概率,全概率公式的区别和联系

3.1 公式如下

3.2 区别和联系

3.3 概率和随机过程

4 有什么用:---可以解决很多递归的问题

4.1 使用前有个前提:界定清楚你要求的随机变量的目标和类型

4.1.1 求的是次数,还是数量?

4.1.2 确定你要求的目标变量

4.2 例题1:计算出去的 时间= 步数 =次数,属于这一类问题

4.3 例题2:求次数,计算几何分布的期望

4.4 例题3:求个数,适合二项分布求成功的次数的期望

5 条件期望全期望公式和 马尔可夫转移 区别


1 目标问题: 什么是条件期望? 条件期望有什么用?

   这次先不说目标,先引用一个小学数学题作为开头

Q:假设已知1班平均分是93,2班平均分是95,那么两个班的平均分怎么算?

错误算法: (93+95)/2=94

  • 除非两个班的学生数量一样,否则就是错的
  • 这个不能用简单算术平均,得用加权平均

正确算法

  • 假设1班学生数量n1,平均分A1=93,假设2班学生数量n2,平均分A2=95
  • 根据平均分的定义
  • A0 = 总分数/总人数
  •     = (A1*n1 + A2*n2)/(n1+n2)
  •     = n1/(n1+n2)*A1 + n2/(n1+n2)*A2
  •     = 系数1*A1+系数2*A2
  •     = 人数权重比例1*A1+人数权重比例2*A2
  • 而权重 = 本班人数/ sum(所有班级人数和)

从这里引出了一个问题

Q1: 我们想知道总体的平均值,当然可以直接用总体的数计算,比如A0 = 总分数/总人数。但是如果我们已经知道了 总体的每个部分的平均值,是否可以根据这些算出总体的平均值呢?

A1: 答案是可以的,前面这个例子已经看到是可以的,总体均值= Σ部分均值*权重比例。

Q2: 接着问,如果这个总体不是确定的,而是一个随机变量,比如我们要求的是:这个随机变量的期望呢?

A2: 那么权重比例就变成了随机变量的概率,其实这个也就是 条件期望和全期望公式的内容

因此,引出了我们要讨论的主题:

  • 类比: 总体均值= Σ部分均值*权重比例
  • 全期望可以这么看
  • E(X) = ΣPi*E(X|Yi)      和上面是同一个表达方式
  • E(X) =E(E(X|Y))
  • E(X) = P1*E(X|Y1) + ..... +Pk*E(X|Yk) = ΣPi*E(X|Yi)
  • E(X) = E(E(X|Y)) = ΣPI*E(X|Yi) = P1*E(X|Y1) + ..... +Pk*E(X|Yk)  ,其中i属于(1,k)

2 条件期望,全期望公式

下面不同写法的概念是不同的

  • step1:  E(X) 是一个具体的数,随机变量的数学期望=随机变量的(概率)加权平均值=具体的数
  • step2:  因为在Y=y1的前提下,X还是有可能有几种情况,假设也是x1,x2...xk所以条件期望 E(X|Y=y1) = Σxi*P(xi|Y=y1) = x1*P(x1|Y=y1) +x2*P(x2|Y=y1) +...+xk*P(xk|Y=y1)
  • step3:  而对于随机变量X,Y还有多个取值y1,y2....yj,比如 E(X|Y=y1) 本身还对应着一个概率 Pj.  因此可以求期望 E(E(X|Y)) =ΣPI*E(X|Yj) = P1*E(X|Y1) + P2*E(X|Y2) +.....+Pj*E(X|Yj) 而实际上可证明,E(E(X|Y))=E(X)
  • step4: 所以全期望公式   E(X) = E(E(X|Y)) = ΣPI*E(X|Yi) = P1*E(X|Y1) + P2*E(X|Y2) + ..... +Pj*E(X|Yj)  ,其中i属于(1,j)

看下面的图理解

图是知乎的,参考   zhuanlan.zhihu.com/p/612709393

3 条件期望,全期望公式 和 条件概率,全概率公式的区别和联系

3.1 公式如下

  • 条件概率:     P(A|B) =  P(AB) / P(B)
  • 全概率公式:  P(A) =  P(AB1) * P(B1) +P(AB2) * P(B2) + ......+P(ABn) * P(Bn)
  • 条件期望:     E(X|Y=y1) =E(X|y1) = Σxi*P(xi|Y=y1)
  • 全期望公式: E(X) = E(E(X|Y)) = ΣPj*E(X|Yj) = P1*E(X|Y1) + ..... +Pj*E(X|Yj)  ,其中j属于(1,k)

3.2 区别和联系

  • 条件概率,全概率公式,是用来求概率的
  • 条件期望,全期望公式,是用来求各种 随机变量的期望值,而不是概率,比如,合成的平均次数,合成的目标的平均数量... ... 等等。

3.3 概率和随机过程

  • 概率一般是求 瞬时/切面的发生可能,主要关注概率
  • 随机过程,一般是求一个时间过程内的情况,或一个时间过程后的情况,可以关注概率,次数,数量。。。等等

4 有什么用:---可以解决很多递归的问题

4.1 使用前有个前提:界定清楚你要求的随机变量的目标和类型

4.1.1 求的是次数,还是数量?

条件期望和全期望公式,之所以不如条件概率和全概率公式那么好理解,是因为需要仔细理解好,要分析的问题里,目标--随机变量,到底是什么?

  • 是希望知道多次随机之后,随机变量的数量?       
  • 是希望知道多次随机后达到某个状态所用的次数?   有点类几何分布
  • 等等

4.1.2 确定你要求的目标变量

  • 比如1个A有可能变成A,B,C,D对于的概率是0.5,0.2,0.2,0.1
  • 那么如果我们有100个A,那么想问可以生成多少个D?
  • 那么如果我们有100个A,那么想问可以生成多少个C?
  • 如果我想合成1个D,需要多少次呢?
  • 这都是不同的问题

4.2 例题1:计算出去的 时间= 步数 =次数,属于这一类问题

  • 一个矿工被困矿井里,面前可以打开3个门,均等概率,1个门回到外面花费3小时,1个门回到现在地方花费5小时,1个门回到现在地方花费7小时,求问矿工回到外面平均需要时间?
  • 设置X为矿工出去要花的时间
  • E(X) = 1/3* 3+  1/3* (E(X)+5)+1/3* (E(X)+7)
  • 3 E(X) = 3+  E(X)+5 +E(X)+7
  • E(X) = 15

4.3 例题2:求次数,计算几何分布的期望

如果丢硬币

假设正面成功概率p, 反面失败概率1-p,问直到成功1次的次数是多少?(同几何分布)

可以直接用几何分布的概率和期望公式计算

  • 几何分布概率:         pdf=p*(1-p)^n
  • 几何分布期望次数: E(X)=1/p

也可以用 条件期望和全期望公式

令n为第1次出现正面的次数,而Y表示单次实验的正反情况

E(N) =P*E(N|Y=1) + (1-P)*E(N|Y=0)

  • 显然 E(N|Y=1) =1,因为既然 Y=1了那就成功了,那么次数N也就=1
  • 而因为Y=0了,已经多了1次,而每次试验都是独立了又开始重新试验E(N)所以E(N|Y=0) =1+E(N)

这就是递归的规律

  • E(N) =P*1 + (1-P)*(1+E(N))
  • E(N) =P +(1-P)+ (1-P)*E(N)
  • E(N) =1+ (1-P)*E(N)
  • E(N) =1/p

这也是一个递归的问题

4.4 例题3:求个数,适合二项分布求成功的次数的期望

Q: 如果丢硬币

假设正面成功概率p, 反面失败概率1-p,问直到丢100次,平均有几次是成功呢?(多少个正面?)

A: 只要 p不等于0,且因为每次丢硬币都是独立的,理论上每次都可能是正面/反面,所以100次试验,正面的次数可能是(0,100)

那么平均会出现几次正面呢?

  • 不适合几何分布求最后1次成功的次数
  • 而二次分布看起来是合适的,二项分布的概率,是求成功K次的概率,而二项分布的期望是np, 是k所有不同取值时*对应概率求和,E(X)=np 正好就是成功k次的平均次数。
  • 也可以用 条件期望和全期望公式

而Y表示单次实验的正反情况

一次试验时,可能是正面的个数

E(N) =P*E(N|Y=1) + (1-P)*E(N|Y=0) 

E(N) =P*1 + (1-P)*0

  •  如果E(N|Y=1) ,因为既然 Y=1了那就成功了,那么这就有了1个正面的个数1
  •  如果E(N|Y=0) ,那就是这次生成了反面,没有生成正面,那么正面的个数就是0

这就是递归的规律

  • 先看单次试验的
  • E(N) =P*1 + (1-P)*0
  • E(N) =P 
  • 而N次试验是独立的
  • 所以
  • n*E(N)=np

5 条件期望全期望公式和 马尔可夫转移 区别

总结1:

  • 一般来说,求次数,求个数都可以用条件期望等。
  • 而马尔可夫链一般是用来求概率的,当然也可以来求平均次数

总结2:

  • 条件期望,全期望公式,比马尔可夫链的适用性更广,
  • 马尔可夫链的要求比较严格,但是对适合处理的情况,处理更快更方便。
  • 马尔可夫链只关注 n-1状态和n状态之间的关系
  • 马尔可夫链一般适合1个东西进行多状态之间切换,一般不适合多变1等合成问题
  • 一般要求各个状态之间是等权重的,步长相等,不能被扭曲。而且如果状态数量太大,好像马尔可夫链计算也很麻烦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/774803.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Zabbix“专家坐诊”第200期问答汇总

问题一 Q:想请问下大佬们,我们zabbix最近有误告警的情况,这个怎么排查呢? 用了proxy,我看了proxy和server的日志,除了有慢查的日志,其它没有异常日志输出。 A:看下这个unreachable的…

首次与电商平台战略签约 第一三共与阿里健康达成战略合作

7月18日,阿里健康与第一三共在杭州正式签署战略合作协议。双方宣布将在此前合作基础上,全面深化心脑血管、风湿骨外科等疾病领域的合作深度,探索以患者为中心、以数字化为驱动力的创新型医药健康服务模式。据悉,此次合作是第一三共…

椒图--分析中心和后台管理中心

护网的时候我们要把右边的开关开启。开启就会对系统全量的记录,包含有网络行为日志,就会检测我们服务器里面的链接,端口箭头,内内网暴露的链接;进程操作日志,就可以看我们系统创建了哪些进程,就…

融云出海:不止假发出口和四卡四待手机,「非洲市场」的参差与机遇

↑ 点击预约“融云北极星”直播↑ 点击预约“实时社区”直播 比白皮书更精炼省流,比图谱更实用有效。 融云《社交泛娱乐出海作战地图》,被多位大咖标记为出海人必备工作手册。针对地图的核心模块,我们推出了系列解读文章,更详尽…

Redis数据持久化的两种方式

说明:Redis数据是存储在内存中的,Redis服务被关闭,数据是会被清除的。但Redis有数据持久化机制,在默认情况下,停止Redis服务会触发数据持久化机制,将数据保存下来,在下次启动时再读取出来。 Re…

解决spring security No AuthenticationProvider found for com.问题

No AuthenticationProvider found for com.xxx.xx 原因 当你验证过,后记得这个这里返回true。不然,就会出现既没有异常,又没验证返回通过的中间尴尬状态,security会当做没有验证通过来处理。 修改

HCIA-存储虚拟化

1、虚拟化概述 KVM是所有云平台的底座,虚拟化是所有云的基础,虚拟化只提供基础架构,云可以提供服务。 CNA是个定制的欧拉系统EulerOS,基于centos内核只保留和虚拟化相关的代码,CNA默认已经部署好kvm虚拟化的软件。CNA…

Visutal Studio2022 如何使用Github copilot

visual studio 2019 升级最新版本的2019也并没有搜索到,直接升级到visual studio 2022,看发布介绍也是2022的copilot Copilot 是一款由 OpenAI 开发的基于 GPT 模型的代码生成工具,可帮助开发者更快地编写代码。如果想在 Visual Studio 中使…

基于大模型的属性操作生成高效训练数据

概述 这篇论文的研究背景是关于利用大型语言模型(LLM)生成高效训练数据的方法。 以往的方法通常是通过LLM生成新的数据,但缺乏对生成数据的控制,这导致了生成数据的信息不足以反映任务要求。本文提出了一种基于LLM的属性操作生成方法,通过精…

如何应对客户报价要求过低的情况?这些方案帮你化解危机!

有个客户在寄样品之前让报价,并且要求承诺价格必须低于15美金,业务员同意了,让客户把样板安排寄到中国,但是收到样品后发现客户的样品在侧面还有一块突出的部分,所以15美金太低了,无论如何也得18美金&#…

计组4——总线Plus IO

(CPU外部的)总线 用于连接computer3大模块(MC/GPUIO) CPU内部的片内总线判优由时序逻辑实现 composition& priority-judging 通信方式 CPU内部的片内总线用于取指、译码、执行、中断的数据通信; IO 总线分为控制线、数据线和地址线,对IO设备的…

Error:Invalid or corrupt jarfile xxx.jar

现象 上传jar包,执行报错:Error:Invalid or corrupt jarfile xxx.jar 解决办法 本地正常执行,上传服务器执行报错。排查发现是因为文件不完整导致,重新上传,比对文件大小,一致后重新执行成功&…

如何在电子设备行业运用IPD?

电子设备是指由集成电路、晶体管、电子管等电子元器件组成,应用电子技术(包括)软件发挥作用的设备,包括电子计算机以及由电子计算机控制的机器人、数控或程控系统等。电子设备基本解释为由微电子器件组成的电器设备。固定资产分类中的电子设备&#xff0…

【重温篇】八大排序——归并排序

思路 归并排序是一种经典的排序算法,采用分治法的思想。它将待排序的数组分成两个较小的子数组,分别对这两个子数组进行排序,然后将排好序的子数组合并成一个有序的数组。 归并排序的主要思路如下: 分解:将待排序的数…

JMETERbeanshell多种姿势获取目标值

beanshell通过vars方式取值 JMETER三种取值方法步骤_securitor的博客-CSDN博客 beanshell通过props方式取值 JMETER取值二_securitor的博客-CSDN博客 beanshell通过source方式取值 JMETER取值三_securitor的博客-CSDN博客 beanshell通过jar包方式取值 JMETER取值四_securitor的…

PHP客服系统-PhpWorkmanChat客服系统修改管理员密码

作为一款流行的开源PHP客服系统,基于thinkphp和workman,跨平台轻量级客服系统源码 管理员表是v2_admin 账户是admin,如果密码忘记了怎么办。可以直接修改数据库表v2_admin ,密码规则是md5(密码 加密盐) , 加密盐可以在…

STL源码刨析_stack _queue

目录 一. 介绍 1. stack 介绍 2. queue 介绍 二. 模拟实现 1. stack 模拟实现 2. queue 模拟实现 三. deque 1. deque 接口 2. 底层 一. 介绍 1. stack 介绍 stack(栈)是一种容器适配器,它提供了一种后进先出(LIFO&#xff0…

如何优化APP应用内的广告点击率?提升变现收益?

对于大部分广告主来说,广告点击率(CTR)越高越好,而点击率又与收益密切相关。如何优化点击率,让应用内的流量售卖收益最大化呢? 说到优化点击率,那么就一定要说说这个名词: 点击率&…

第五章 动态规划(一)——背包问题

文章目录 01背包问题完全背包多重背包分组背包背包练习题2. 01背包问题3. 完全背包问题4. 多重背包问题 I5. 多重背包问题 II9. 分组背包问题 01背包问题 n个物品,每个物品的体积为 v i v_i vi​,价值为 w i w_i wi​,每次只能选择一个物品放…

JavaScript的库——jquery

JavaScript的库——jquery 一、jQuery的hello 将代码写在一个闭包中 二、面试题: jQuery的ready函数和JavaScript的onload事件有什么区别? 是null,因为拿不到box,代码在后面,还没有执行。 所以需要将代码放在后面&am…