人工智能数学基础--概率与统计15:多维随机变量/向量

news2024/11/29 0:52:26

一、多维随机变量定义

一般地,设X=(X1,X2,···,X,)为一个n维向量,其每个分量,即X1、···、Xn都是一维随机变量,则称X是一个n维随机向量或n 维随机变量

与随机变量一样,随机向量也有离散型和连续型之分。

二、离散型多维随机向量

一个随机向量X=(X1,···,Xn),如果其每一个分量Xi 都是一维离散型随机变量,则称X为离散型的。

2.1、离散型多维随机向量的概率

定义2.1
以 a i 1 , a i 2 , ⋅ ⋅ ⋅ 记 X i 的全部可能值 ( i = 1 , 2 , ⋅ ⋅ ⋅ ) ,则事件 X 1 = a 1 j 1 , X 2 = a 2 j 2 , ⋅ ⋅ ⋅ , X n = a n j n 的概率称为随机向量, 以{a_{i1},a_{i2},···}记X_i的全部可能值(i=1,2,···), 则事件 {X1=a_{1j_1},X2=a_{2j_2},···,Xn=a_{nj_n}} 的概率称为随机向量, ai1,ai2,⋅⋅⋅Xi的全部可能值(i=1,2,⋅⋅⋅),则事件X1=a1j1,X2=a2j2,⋅⋅⋅,Xn=anjn的概率称为随机向量,
记为:
在这里插入图片描述
X=(X1,···,Xn)的概率函数或概率分布,概率函数应满足条件:
在这里插入图片描述

2.2、多项分布

多项分布是最重要的离散型多维分布,在实际中经常遇到,如一个总体按照属性分成几类时就是多项分布。

2.2.1 定义

设A1,A2,··,An,是某一试验之下的完备事件群,即事件A1,··,An,两两互斥,其和为必然事件(每次试验时,事件A1,···,An必发生一个且只发生一个)。分别以P1,P2,··,Pn记事件A1,A2,···,An的概率,则pi≥0,P1+···+pn=1。
现在将试验独立地重复 N次,而以Xi记在这N 次试验中事件Ai出现的次数(i=1,···,n),则X=(X1,··,Xn)为一个n维随机向量。它取值的范围是:X1,···,Xn都是非负整数,且其和为N。X的概率分布就叫做多项分布,有时记为M(N;P1,···,Pn)

2.2.2 计算方法

为定出这个分布,要计算事件 B=(X1=k1,···,Xi=Ki,···,Xn=Kn}的概率,只需考虑Ki都是非负整数且K1+···+Kn=N的情况,否则P(B)=0。

为计算P(B),从N次试验的原始结果j1,j2,···,jN 出发,它表示第一次试验事件Aj1发生,第二次试验 A j2发生,等等。为使事件 B发生,在j1,j2,···,jN中应有k1个1,k2个2,等等。这种序列的数目,等于把N个相异物体分成n堆,各堆依次有k1,k2,···,kn件的不同分法。不的分法共有N!/(k1!···kn!)种。其次,由于独立性,利用概率乘法定理知,每个适合上述条件的原始结果序列j1j2···jn,出现的概率应为 p 1 k 1 p 2 k 2 ⋅ ⋅ ⋅ p n k n p_1^{ k1}p_2^{ k2}···p_n^{kn} p1k1p2k2⋅⋅⋅pnkn。于是得到:
在这里插入图片描述
上式就是多项分布的概率函数,其名称是由多项展开式:
在这里插入图片描述
Σ ∗ 表示求和的范围为: k i 为非负整数, k 1 + ⋅ ⋅ ⋅ + k n = N Σ^*表示求和的范围为:k_i为非负整数,k1+···+kn=N Σ表示求和的范围为:ki为非负整数,k1+⋅⋅⋅+kn=N
在上式中,令xi=pi,并且利用p1+···+pn=1,得:
在这里插入图片描述

三、连续型多维随机变量

3.1 定义

设X=(X1,···,Xn)是一个n维随机向量,其取值可视为n维欧氏空间 R n R^n Rn中的一个点,如果X的全部取值能充满 R n R^n Rn中某一区域,则称它是连续型的多维随机变量

与一维连续型变量一样,描述多维随机向量的概率分布,最方便的是用概率密度函数。为此,我们引进一个记号:X∈A,读作“X属于A”或“X落在A内”,其中A是 R n R^n Rn中的集合:{XE∈A}是一个随机事件,因为做了试验以后,X的值就知道了,因而也就能知道它是否落在A内。

3.2 多维随机变量的概率密度函数

定义 若f(x1,···,xn)是定义在 R n R^n Rn上的非负函数,对 R n R^n Rn中的任何集合A,有:

则称f是X的(概率)密度函数。
如果把A取成全空间 R n R^n Rn,则{X∈A}为必然事件,其概率为1。因此应有
在这里插入图片描述
这也是概率密度函数必须满足的一个条件。

3.3 均匀分布

二维随机向量X=(X1,X2),其概率密度函数为:
在这里插入图片描述
则 f 非负且满足式(2.6)。

该函数对应的图形如下:

在这里插入图片描述
全部概率均匀分布在对应矩形内,即P(X∈A)与A的面积成正比,因此把X的分布称为图中矩形上的均匀分布

3.6 二维正态分布

最重要的多维连续分布是多维正态分布,二维情况下的二维正态分布概率密度函数形式如下:
在这里插入图片描述
这里为了方便,引入了记号exp,其意义为:exp(c)= e c e^c ec。上述概率密度函数包含了5个常数a、b、 σ 1 2 、 σ 2 2 σ_1^2、σ_2^2 σ12σ22、ρ,它们是二维正态分布的参数,其可取值的范围为:
a、b∈(-∞,+∞), σ 1 > 0 、 σ 2 > 0 σ_1>0、σ_2>0 σ1>0σ2>0,ρ∈(-1,1)

二维正态分布常记为N(a,b, σ 1 2 、 σ 2 2 σ_1^2、σ_2^2 σ12σ22ρ),它在三维空间的函数图形好像一个椭圆切面的钟倒扣在Ox1x2平面上,其中心在(a,b)点。

可以证明N(a,b, σ 1 2 、 σ 2 2 σ_1^2、σ_2^2 σ12σ22,**ρ)**满足式(2.6)的要求,因此这是一个概率密度函数。

3.7 关于连续随机变量需要注意的几点

  1. 不论是一维还是多维连续随机变量,在定义时的实质是需要有满足式(2.6)的概率密度函数(对于一维就是一个变量)存在;
  2. 概率密度函数在一个区间或区域上是否连续没有要求;
  3. 连续随机向量的各分量都是随机变量,但并不是各分量都是随机变量就一定是随机向量;
  4. 可以用概率分布函数去描述多维随机向量的概率分布,其定义为:F(x1,x2,…,xn)=P(X1<x1,X2<x2,…,Xn<xn),但在多维情况下,很少用分布函数。

3.8 边缘分布

设X=(X1,…,Xn)为一个n维随机向量,X有一定的分布F,这是一个n维分布,因为X的每个分量Xi都是一维随机变量,故它们都有各自的分布Fi(i=1,···,n),这些都是一维分布,称为随机向量X 或其分布F的边缘分布,也称为边际分布。边缘分布完全由原分布F确定。

3.8.1 离散随机向量的边缘分布

以第一个分量为例,离散型随机向量的边缘分布的概率密度计算公式为:
在这里插入图片描述
可以证明,对于多项分布M(N;p1,…,pn),其对应的边缘分布就是二项分布B(N,pi)。

3.8.2 连续随机向量的边缘分布

设随机向量X=(X1,…,Xn)有概率密度函数f(x1,…,xn),其分量Xi的边缘分布的概率密度函数就是将xi固定,对函数f剩余的n-1个变量在-∞和+∞之间做定积分,如x1的密度函数下:
在这里插入图片描述
按照此方式,可以证明二维正态分布的边缘分布是一维正态分布。

四、小结

本文介绍了多维随机向量的概念和其概率密度函数定义以及边缘分布的定义,并举例说明了多项分布、均匀分布、正态分布等多维随机向量的典型分布。多维随机向量也分为离散型和连续型两种,其边缘分布就是一种普通的分布,只是将其中一个分量或多个分量看做变量其余分量是全域积分所得到的分布,因此边缘分布可以是一维的,也可以是多维的。
与边缘分布相对应,多维随机向量也被称为联合分布

任何一个随机向量的分布F都可以决定其一个分量的边缘分布Fi,但即使知道了所有分量的边缘分布Fi,也不足以决定随机向量的分布F。例如两个标准正态分布如果其参数ρ不同,以二者分别作为二维随机向量的边缘分布,其对应的随机向量是不同的分布。这是因为边缘分布只考虑了单个分量的情况,未考虑其关系。

更多人工智能数学基础请参考专栏《[人工智能数学基础]一维(https://blog.csdn.net/laoyuanpython/category_10382948.html)》。

写博不易,敬请支持:

如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!

关于老猿的付费专栏

  1. 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
  2. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
  3. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
  4. 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。

前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。

对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。

如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。

老猿Python,跟老猿学Python!

☞ ░ 前往老猿Python博文目录 https://blog.csdn.net/LaoYuanPython ░

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/763676.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

程序环境和预处理超详细讲解

目录 程序的翻译环境和执行环境 详解编译链接 翻译环境 编译本身也分为几个阶段 运行环境 预处理&#xff08;预编译&#xff09;详解 预定义符号 #define #define 定义标识符 #define 定义宏 #define 替换规则 #和## ## 的作用 带副作用的宏参数 宏和函数对比 …

git如何撤销commit(未push)

文章目录 前言undo commitreset current branch to here Undo Commit&#xff0c;Revert Commit&#xff0c;Drop Commit的区别 是否删除对代码的修改是否删除Commit记录是否会新增Commit记录Undo Commit不会未Push会&#xff0c;已Push不会不会Revert Commit会不会会Drop Com…

看看去年蓝桥考了什么,第十三届蓝桥杯省赛(C/C++ 大学B组)题解

文章目录 A&#xff1a;九进制转十进制问题描述运行限制题目思路代码演示 B&#xff1a;顺子日期问题描述运行限制题目思路代码演示 C&#xff1a;刷题统计问题描述评测用例规模与约定运行限制题目思路代码演示 D&#xff1a;修剪灌木问题描述评测用例规模与约定运行限制题目思…

【广州华锐互动】VR地铁消防逃生路线演练系统

随着城市轨道交通的不断发展&#xff0c;事故应急演练的重要性也越来越受到重视。而VR技术的应用&#xff0c;为地铁消防逃生路线演练带来了许多亮点&#xff0c;包括以下几个方面&#xff1a; 首先&#xff0c;VR技术可以提供高度真实的模拟场景。在传统的事故应急演练中&…

t-date-time-picker如何默认当前年月

打开小程序展示当前年月&#xff0c;效果图如下 实现方法&#xff1a;使用new Date().toISOString().slice(0, 7)截取7位即可

卡尔曼滤波:再也不用瑟瑟发抖了

本文来自公众号“AI大道理” —————— 目标跟踪中&#xff0c;在数据关联后往往要进行卡尔曼滤波。 数据关联算法得到了每个目标的观测数据。 卡尔曼滤波使用关联的观测数据来估计目标的状态&#xff0c;并预测目标的未来位置和速度等信息。 目标跟踪过程中&#xff0c;…

0基础学习VR全景平台篇 第62篇:基本功能-如何发布VR视频

戳我先了解“全景视频上传规范” 1、点击【上传】按钮&#xff0c;打开本地文件夹&#xff0c;上传符合要求的全景视频素材&#xff0c;可以选择单个或多个视频同时上传。 2、视频上传成功以后&#xff0c;需要处理一段时间&#xff0c;请耐心等待。 视频处理好以后&#xff0…

编程语言有哪些?介绍常见的编程语言

&#xff08;又是水文章的一天&#xff09;&#xff1a;&#xff09; 在当今数字化时代&#xff0c;编程语言成为了连接人类与计算机的关键工具。无论是网页开发、移动应用程序还是大规模软件开发&#xff0c;选择合适的编程语言对于开发人员来说至关重要。本文将介绍一些常见的…

Cesium-源码打包1.106

在有Cesium源码打包的需求下&#xff0c;可以这样进行&#xff0c; 1.106的源码目录结构如下&#xff1a; 1.在下载的源码目录中运行 npm install 出现node_modules文件夹&#xff0c;然后我们就可以根据需求去修改源码&#xff0c;本文用的版本是1.106&#xff0c; packag…

C语言--动态内存管理(图解)

文章目录 C程序的内存开辟为什么存在动态内存分配动态内存分配函数malloc和freecallocrealloc 常见的动态内存错误对空指针的解引用操作对动态开辟空间的越界访问对非动态开辟内存使用free释放使用free释放一块动态开辟内存的一部分对同一块动态内存多次释放动态开辟内存忘记释…

浅析电力企业一体化云运维管理平台

摘要&#xff1a;电力的发展,关系着我国社会和谐和稳定,在当今科学技术不断向前发展的时代,在电力企业发展中须要结合现今的科学技术,保证电力企业的信息化建设水平能够符合时代的发展趋势。本文主要分析当前电力企业一体化云运维管理的重要性,并就云运维管理中存在的问题进行有…

Spring 6【BeanFactory代码演示、实例化Bean的两种方式】(三)-全面详解(学习总结---从入门到深化)

目录 六、BeanFactory代码演示 七、实例化Bean的两种方式 六、BeanFactory代码演示 上面的案例代码就是我们平时使用Spring Framework的代码。 为了让小伙伴们能感受到BeanFactory&#xff0c;我们还是用实际代码来进行演示一下。毕竟 ApplicationContext在牛&#xff0c;对…

hadoop学习之hdfs学习

HDFS 文件系统,可以说是分布式数据库吧 结构是 目录树 适用场景:一次写入,多次读出.好像不太支持改删 优点: 1.高容错: 因为他会备份,所以一份出问题了,并不影响其他几份 如果副本丢失后,定时恢复.应该是定时检查然后恢复 每次启动,DN向NN汇报备份的存储情况.默认每个6个小时重…

波奇学Linux:git和gdb调试

git用来版本控制&#xff0c;同样是版本控制的软件还有svn等。 git的特定是具有网络功能的版本控制器&#xff0c;开源&#xff0c;client和server是一体的。(去中心化分布式管理) client和server一体意味着远程仓库和本地仓库是平等地位&#xff0c;远程仓库是特殊的仓库而已…

rtmp推流

目录 1、解压代码工程2、进入工程文件夹3、修改Makefile中的交叉编译路径4、编译5、板子上6、window上打开ffplay进行拉流注意:推流之前要先搭建好nginx服务器 1、解压代码工程 sudo unzip ffmpeg_rv1126_network_project_mark_finally.zip 2、进入工程文件夹 cd ffmpeg_rv…

AudioFocus源码分析

使用情景 在音视频app开发中一般会遵循音频焦点的机制&#xff0c;播放时申请音频焦点&#xff0c;丢失焦点后暂停播放&#xff0c;恢复焦点后继续播放等。尤其在车载开发时&#xff0c;涉及到三方应用和自研应用&#xff0c;导致经常出现音频焦点混乱混音等问题。 private f…

分享几个不常用的web api

分享几个不常用的web api 屏幕捕获 顾名思义&#xff0c;屏幕捕获 API 允许我们捕获屏幕内容&#xff0c;从而使构建屏幕录制的过程变得轻而易举。 在示例中我们使用video标签来显示捕获屏幕内容。 <video id"preview" autoplay>不支持HTML5 </video>…

Jmeter(119)-函数threadNum妙用

今天的接口场景是&#xff1a;有N个用户需要每隔5秒去查询一次数据&#xff0c;也就是说N个用户会去循环执行同一个接口。一开始的时候将用户参数化时使用了counter&#xff0c; 要执行2个线程3次循环&#xff0c;发现每次循环时&#xff0c;接口中用户参数的数据就会不一样&am…

统计页面左右+上下自适应布局

1:如果需要调整分栏数量,那么只需要删除对应数据,修改百分比即可. <!DOCTYPE html> <html><head><meta charset"utf-8"><title></title><style type"text/css" lang"less" >body{margin: 0px ;}.box…

2.1Label Button 标签和按钮

2.1Label & Button 标签和按钮 窗口主体框架 每一个 tkinter 应用的主体框架都可以包含下面这部分. 定义 window 窗口 和 window的一些属性, 然后书写窗口内容, 最后执行window.mainloop让窗口活起来. import tkinter as tkwindow tk.Tk() window.title(my window) wind…