现代数字信号处理I-P2概率论学习笔记

news2024/10/10 5:10:17

目录

学习视频链接:

1. 三要素及关系

2. 期望和方差的定义及基本性质

2.1 期望(均值)定义:

在实际工作中很难获得随机变量的分布或者概率密度,用矩描述随机变量

2.2 期望基本性质:

2.3 方差定义

2.4 凸函数下期望不等式

3. 均方意义下确定参数对随机变量的最优估计

4. 两组随机变量函数映射下的最佳逼近

4.1 条件期望的引入

4.2 条件期望的性质

a. 条件期望仍然是随机变量

b. 条件期望保留了期望的线性性质

c. 条件期望的期望,是无条件期望

d. 条件期望的提出性

关于条件期望计算的一个例子:

4.3 均方意义下,利用条件期望获得一个随机变量对另外一个随机变量的最佳估计

4.4 一个随机变量对另外一个随机变量的最佳估计结论

5. 参数化模型下的最优估计

5.1 参数化模型和非参数化模型

5.2 频率学派参数化模型的最优估计

5.3 方差和偏差的Tradeoff

5.4 两种估计量的简单对比

5.5 方差与样本方差

6. 条件方差


学习视频链接:

2.概率论复习_哔哩哔哩_bilibili

1. 三要素及关系

数据(data)

模型(model)

决策(Decision)

统计:由数据总结模型

概率:给定模型做决策,模型属于先验知识

仿真:由模型产生数据,蒙特卡洛,适用于真实数据很难获得的场景

大数据:由大量数据直接做决策,此处可能由于大量数据而无法收敛到一个可靠模型

2. 期望和方差的定义及基本性质

2.1 期望(均值)定义:

在实际工作中很难获得随机变量的分布或者概率密度,用矩描述随机变量

期望是随机变量的一阶矩,是一个数。

物理中表示刚体的重心,用一个点表示一个物体。

2.2 期望基本性质:

 期望的基本性质恒成立。

2.3 方差定义

如果均值可以描述随机变量的中心未知,那么方差描述的是随机变量的散度(Dispersion)

2.4 凸函数下期望不等式

一般情况,非线性函数下期望的函数和函数的期望不相等:

对于凸函数,存在

进一步:

因此:

简单解释,凸函数图像类似:

凸函数具有性质:二阶导数大于等于0,存在任意a点,使得所有的x满足

是与有关的线性函数。

当X是随机变量,两边取期望:

此时,取,因此存在:

简单证明完毕。

3. 均方意义下确定参数对随机变量的最优估计

虑一组数据采样后得到的随机变量,现在我们需要采用一些方法去逼近该随机变量。

常用的方法,可以认为该随机变量来自于对一个确定数值的采样,因此用一个常数去尝试逼近。

在开始探讨方法之前,需要先定义逼近方法的评估手段,最常用的是比较两种数据的距离,一般我们可以采用均方误差来表示:

由于开根号在正数据域上不影响原始函数的单调性,因此可以直接去掉开根号展开优化,因此上述问题可以描述为:寻找一个待估计的常数,使得的距离最小,用数学语言描述为:

为求上述最小距离对应的,一种简便的方法是可以直接对原始函数求导,并令导数为0求得:

得到:

因此,得到此时:

换句话说,期望就是在均方距离定一下,对随机变量的固定值最佳逼近。另外,方差此时就是最佳逼近下的误差,或者也称为残差:

4. 两组随机变量函数映射下的最佳逼近

4.1 条件期望的引入

上述问题进一步延申,如果存在两种不同的随机数据XY

在统计信号处理领域,我们希望构建某种模型/函数后,完成对产生一种映射,使得:

上述属于问题变成需要寻找某个函数g,使得距离最小。这是在函数空间中寻找最优函数。属于泛函优化,比较困难,需要引入新的工具:条件期望

4.2 条件期望的性质

a. 条件期望仍然是随机变量

可以认为消除了关于X的随机特性,但条件Y的随机性却是保留的,因此是以Y有关的随机变量

上式消除了X的随机特性,但是关于Y的随机变量

b. 条件期望保留了期望的线性性质

c. 条件期望的期望,是无条件期望

形式化证明过程:

是和有关的随机变量,因此取期望需要乘的概率密度函数,再积分:

代入的定义本身:

积分合并,并交换顺序:

根据联合概率密度定义:

因此:

根据边缘概率密度定义:

因此,最终:

d. 条件期望的提出性

条件期望中存在Y的因子,可以提出:本质上算X的期望,此时条件参数Y的随机性暂时消失,此时与Y相关的都是确定性的数据:

关于条件期望计算的一个例子:

如果是独立同分布的:

那么

如果此时n如果也是随机性,即:求和的个数也具有随机性,可以采用条件期望计算,此时需要假设N与独立:

4.3 均方意义下,利用条件期望获得一个随机变量对另外一个随机变量的最佳估计

此时回到上述问题,即:

思路是将后面的暂时变成确定性的数,此时沿用上述结论,

得到的最优估计应该就是,但由于此时属于条件,因此此时的最优估计应该是,即:

根据条件期望的期望性质,得到:

此时,也就得到了的最优估计,即:

上述的过程有点草率,下面进入严格证明:

均方意义下,一个随机变量对另外一个随机变量进行逼近,最优逼近就是条件期望:

如果上式中交叉项为0,就可以直接得到上述结论,即:

因此,下面的重点寻求证明

上式中除了之外,其他都是关于的随机变量,因此,再次利用:

计算条件期望:

上式最后一般用到了在对X求期望时不存在与X有关的随机变量,此时由于:

最终:

因此,最有逼近为:

4.4 一个随机变量对另外一个随机变量的最佳估计结论

经管上述结果比较完美,但在实际工作中,由于条件期望非常难求,因此需要兼顾好算和性能优异两个指标,寻求其他的估计方法。

5. 参数化模型下的最优估计

5.1 参数化模型和非参数化模型

统计信号处理的具体工作:

获得一批采样数据:

希望通过上述数据,建立模型Model,模型一般非两类:参数化模型和非参数化模型

参数化模型:对随机数据的分布有具体认识,即知道数据服从什么分布,如:

但是分布中的参数未知。

例如,对应高斯分布:

非参数化模型:近年来,在机器学习中越来越流行,例如聚类Clustering Classification,关心的是数据分几类,但对具体的分布参数可以不感兴趣。

在统计信号处理中,我们希望构建一个有采集数据到待估计参数的映射函数:

该映射函数,可以称为是Estimator,对应机器学习中称为Feature,在统计学习中称为Feature Extraction。

5.2 频率学派参数化模型的最优估计

在频率学派的统计学范畴,我们认为待估计的参数尽管未知,但是确定的参数。

在贝叶斯派中,未知参数认为也是随机的,将在后续介绍。

在确定性参数假设下,统计信号处理需要寻找:

根据刚刚的推导,最优估计应该是:

 但由于的确定性的参数,因此没有随机性:

上述过程尽管说明了就是 本身,但是没有给用户提供任何映射的函数,因此解决不了实际问题。

5.3 方差和偏差的Tradeoff

重新观察估计方差:

上式中都是确定性参数,因此交叉项为0:

因此:

上式将估计的均方误差分为了两项,即:方差+偏差

随机误差对应方差Variance,系统误差对应的是偏差Bias。

5.4 两种估计量的简单对比

既然最优估计的证明过程没有给出实际可操作的映射函数,那么我们需要自己构建估计的具体映射。

例如采样一个直流信号的电压:

其中真值是A

构造一种估计:

该估计也是无偏的:

但:

因此该估计经过无偏,但是估计的方差与噪声方差一致。

我们构造另外一个估计:

显然,该估计也是无偏的:

上式中,用到了:

其中是确定性的常数。

另外,在是不相关的假定下,上式中:

因此:

对比的两种估计,尽管都是无偏估计,但是估计的方差要小于,这也是多次采样去平均的意义。

另外,当时,,该特性称为估计的Consistent相合估计。

5.5 方差与样本方差

在常规的实验中,我们一般采用如下两个公式处理数据:

数据平均的效果刚刚已经展现,

此时可以发现,样本方差的计算定义为:

其中分母不是而是,本质上是在估计方差,而除是确保该估计是无偏的。

如果在上述估计中,如果知道带估计量的真值,那么:

这样才是无偏的,但是实际中,我们不知道的真值,因此用样本平均替代替代,此时如果要保证估计的无偏性,那么需要除1,此时用替代 计算的方差有,也称为是样本方差,下面是证明过程,我们计算:

其中用到了

 因此,上式为:

假定当独立同分布,那么:

因此:

代入:

而由于:

因此:

也就是:

方差的无偏估计。

6. 条件方差

基于上述已推导的结论,我们知道条件期望:

那么我们同样定义条件方差:

此时存在公式:

证明过程:

而上式中,都不存在随机变量X,因此:

因此:

其中:

而:

因此:

证明结束。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2201099.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android Studio Koala Feature Drop 稳定版现已推出

作者 / Android Studio 产品经理 Sandhya Mohan Android Studio Koala Feature Drop (2024.1.2) 现已推出!🐨 🔗 Android Studio https://developer.android.google.cn/studio 今年早些时候,我们宣布每个 Android Studio 动物版本…

10月9日笔记(域内用户登录凭据窃取)

缺:BloodHound自动化分析域环境未实现(环境问题) 获取常见应用软件凭据 为了扩大可访问的范围,测试人员通常会搜索各种常见的密码存储位置,以获取用户凭据。一些特定的应用程序可以存储密码,以方便用户管…

python的特殊方法——魔术方法

前言 __init__(self[]) ​编辑 __call__(self [, ...]) __getitem__(self, key) __len__(self) __repr__(self) / __str__(self) __add__(self, other) __radd__(self, other) 参考文献 前言 官方定义好的,以两个下划线开头且以两个下划线结尾来命名的方法…

PostgreSQL学习笔记四:GUI管理工具

PostgreSQL 是一款广泛使用的开源关系数据库管理系统,拥有许多图形用户界面(GUI)工具来帮助用户更高效地管理数据库。以下是一些流行的 PostgreSQL 管理工具: pgAdmin: 一个流行的开源 PostgreSQL GUI 工具&#xff0c…

处理“navicat premium 2003 - 无法在 192.168.10.140 上连接到 MySQL 服务器(10060“未知错误“)”的问题:

以下是一些可能的解决方法来处理“navicat premium 2003 - 无法在 192.168.10.140 上连接到 MySQL 服务器(10060"未知错误")”的问题: **一、检查 MySQL 服务状态** 1. 确认 MySQL 服务是否正在运行。你可以在服务器上通过任务管…

Django makemigrations时出现TypeError: ‘module‘ object is not iterable

使用Python 3.11、Django 5.1.2 写完model进行makemigrations时出现报错 报错的最下面提到了我自己创建的一个应用里的urls.py,尝试着给里面加上一个列表 然后问题解决了。。。 不知道为什么 makemigrations的时候会去检查urls。。。

mybatisPlus对于pgSQL中UUID和UUID[]类型的交互

在PGSQL中&#xff0c;有的类型是UUID和UUID[]这种类型&#xff0c;在mybatis和这些类型交互的时候需要手动设置类型处理器才可以&#xff0c;这里记录一下类型处理器的设置 /*** UUID类型处理器*/ public class UUIDTypeHandler extends BaseTypeHandler<UUID> {/*** 获…

Kubernetes中的pod管理及优化

华子目录 什么是pod1.创建自主式pod&#xff08;生产不推荐&#xff09;优点缺点示例1示例2示例3示例4 2.利用控制器管理pod&#xff08;推荐&#xff09;应用版本的更新 3.利用yaml文件部署应用优点3.1yaml配置文件参数3.2如何获取资源帮助 yaml文件编写示例1.运行简单的单个容…

实现std::sort,replace,fill,accumulate,equal等函数

std::sort /// <summary>/// std::sort 是从小到大排列的/// </summary>/// <typeparam name"IteratorClass"></typeparam>/// <typeparam name"ComparingFunctions"></typeparam>/// <param name"itBegin&qu…

PAT甲级-1150 Travelling Salesman Problem

题目 题目大意 旅行商问题是NP-hard问题&#xff0c;即没有多项式时间内的解法&#xff0c;但是可以验证答案是否正确。给定一个无向图&#xff0c;判断简单环&#xff0c;复杂环和非环。对应“TS simple cycle”、“TS cycle”、“Not a TS cycle”。还要求出环的最小路径权值…

力扣11-盛最多水的容器

题目 给定一个长度为 n 的整数数组 height 。有 n 条垂线&#xff0c;第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线&#xff0c;使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 说明&#xff1a;你不能倾斜容器。…

DAY28||39.组合总数 |40.组合总和Ⅱ |131.分割回文串

39.组合总数 题目&#xff1a;39. 组合总和 - 力扣&#xff08;LeetCode&#xff09; 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target &#xff0c;找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 &#xff0c;并以列表形式返回。你可以…

Java基本数据类型转换

一、自动类型转换 1.基本介绍 当Java程序在进行赋值或者运算时&#xff0c;精度小的类型自动转换为精度大的数据类型&#xff0c;这个就是自动类型转换数据类型按精度&#xff08;容量&#xff09;大小进行排序为&#xff1a; ![在这里插入图片描述](https://i-blog.csdnimg.…

数据中心物理安全的历史和演变

在当今的数字时代&#xff0c;数据中心托管已成为我们互联世界的支柱。这些设施在存储、管理和处理我们日常生活所需的大量信息方面发挥着至关重要的作用。从社交媒体平台和电子商务网站到流媒体服务和云计算&#xff0c;数据中心为我们依赖的数字服务提供支持。 随着企业越来…

K8s-资源管理

一、资源管理介绍 在kubernetes中&#xff0c;所有的内容都抽象为资源&#xff0c;用户需要通过操作资源来管理kubernetes。 kubernetes的本质上就是一个集群系统&#xff0c;用户可以在集群中部署各种服务&#xff0c;所谓的部署服务&#xff0c;其实就是在kubernetes集群中…

【图文并茂】【软件无线电】如何用收音机接收图片,如何将图片编码到不同频点上,捕获在频谱上跳动的MIKU

如何将图片编码到不同频点上&#xff0c;捕获在频谱上跳动的MIKU 这篇文章和数字信号处理有关,或者说跟SDR软件无线电有关,只是考虑这样一个问题,如何将一张图片,编码放到不同的频点上,使得接收方能够通过SDR模块,捕获这样的信号,然后通过绘制频谱,来得到我们编码的那张图片。 …

LVS-DR+Keepalived 高可用群集部署

LVS-DRKeepalived 高可用群集部署 Keepalived 的工作原理LVSKeepalived 高可用群集部署配置负载调度器&#xff08;主、备相同&#xff09;关闭防火墙和核心防护及准备IPVS模块配置keeplived&#xff08;主、备DR 服务器上都要设置&#xff09;启动 ipvsadm 服务调整 proc 响应…

快速区分 GPT-3.5 与 GPT-4

问&#xff1a;鲁迅为什么暴打周树人&#xff1f; GPT3.5回答 各种稀奇古怪的理由 GPT4回答 正确区分鲁迅和周树人是同一个人 国内GPT入口 https://ai-to.cn/url/?ulihaimao

电商商品数据采集||高并发||多语言请求实例演示|京东|淘宝商品详情数据SKU价格

以京东商品数据采集为例 京东商品详情接口数据采集是指通过调用京东提供的商品详情API接口&#xff0c;获取商品的详细信息。以下是一个简单的步骤来实现这个功能&#xff1a; 1. 注册京东开发者账号 首先&#xff0c;你需要注册一个京东开发者账号&#xff0c;并创建一个应…

【原创】Android Studio 中安装大模型辅助编码插件:通义灵码

在 Android Studio 中内置了 Ginimi 预览版&#xff0c;但需要“加速器”才可使用。 在国内有平替的软件同样可以使用&#xff0c;比如 阿里的通义灵码&#xff0c;智谱的CodeGeeX等&#xff0c;从功能和使用上来说都是大同小异。 这里我们以通义灵码为例来讲解其安装和使用 通…