【LinearAlgebra】Chapter 12 - Linear Algebra in Probability Statistics

news2024/9/22 19:34:54

在这里插入图片描述

文章目录

Chapter 12 - Linear Algebra in Probability & Statistics

我们从本章的三个基本词汇开始:均值(mean)方差(variance)概率(probability)。在写公式之前,让我先粗略地解释一下它们的含义:

平均值指平均值或期望值
方差 σ 2 \sigma^2 σ2 衡量与平均值 m m m 的平均平方距离
n n n 种不同结果的概率都是正数 p 1 , ⋯   , p n p_1, \cdots, p_n p1,,pn 相加为 1 1 1


当然,平均数很容易理解。我们从这里开始。但是现在我们有两种不同的情况,你们必须弄清楚。一方面,我们可以从完成的试验中得到结果(样本值)。另一方面,我们可能从未来的试验中得到预期的结果(期望值)。让我举几个例子:

样本值 随机抽取 5 5 5 名新生,年龄分别为 18 、 17 、 18 、 19 、 17 18、17、18、19、17 1817181917
样本均值 1 5 ( 18 + 17 + 18 + 19 + 17 ) = 17.8 \frac{1}{5}(18 + 17 + 18 + 19 + 17) = 17.8 51(18+17+18+19+17)=17.8
概率 大一新生的年龄分别是 17 17 17 岁( 20 % 20\% 20%)、 18 18 18 岁( 50 % 50\% 50%)、 19 19 19 岁( 30 % 30\% 30%)。
随机选择一个大一新生的预期年龄 E [ x ] = ( 0.2 ) 17 + ( 0.5 ) 18 + ( 0.3 ) 19 = 18.1 \text{E}[x] = (0.2) 17 + (0.5) 18 + (0.3) 19 = 18.1 E[x]=(0.2)17+(0.5)18+(0.3)19=18.1

17.8 17.8 17.8 18.1 18.1 18.1 都是正确的平均值。样本均值 N N N 个采样点 x 1 , ⋯   , x N x_1, \cdots, x_N x1,,xN 从一个完成的试验开始。它们的平均值是 N N N 个观测样本的平均值:

样本均值 m = μ = 1 N ( x 1 + x 2 + ⋯ + x N ) (1) m = \mu = \frac{1}{N} (x_1 + x_2 + \cdots + x_N) \tag{1} m=μ=N1(x1+x2++xN)(1)

x x x 的期望值开始于年龄 x 1 , ⋯   , x n x_1, \cdots, x_n x1,,xn 的概率 p 1 , ⋯   , x n p_1, \cdots, x_n p1,,xn

期望值 m = E [ x ] = p 1 x 1 + p 2 x 2 + ⋯ + p n x n (2) m = \text{E}[x] = p_1 x_1 + p_2 x_2 + \cdots + p_n x_n \tag{2} m=E[x]=p1x1+p2x2++pnxn(2)

这就是 p ⋅ x p \cdot x px。注意 m = E [ x ] m = \text{E}[x] m=E[x] 告诉了我们期望什么, m = μ m= μ m=μ 告诉我们得到什么。


通过取很多样本(比如说一个很大的 N N N),样本结果将接近概率。“大数定律(Law of Large Numbers)”认为,随着样本量 N N N 的增加,样本均值以 1 1 1 的概率收敛于其期望值 E [ x ] \text{E}[x] E[x]。一枚均匀硬币出现背面的概率为 p 0 = 1 2 p_0=\frac{1}{2} p0=21,出现正面的概率为 p 1 = 1 2 p_1=\frac{1}{2} p1=21。然后 E [ x ] = ( 1 2 ) 0 + ( 1 2 ) 1 \text{E} [x] = (\frac{1}{2}) 0 + (\frac{1}{2}) 1 E[x]=(21)0+(21)1 N N N 次抛硬币中正面出现的比例是样本均值,接近期望 E [ x ] = 1 2 \text{E}[x] =\frac{1}{2} E[x]=21

这并不意味着如果我们看到的反面多于正面,那么下一个样本很可能是正面。几率仍然是 50 % 50\% 50%。前 100 100 100 次或 1000 1000 1000 次投掷确实会影响样本均值。但是 1000 1000 1000 次抛硬币不会影响它的极限——因为你要除以 N → ∞ N \rightarrow \infty N


Variance (around athe mean) 方差(接近均值)

方差 σ 2 \sigma^2 σ2 表示到期望均值 E [ x ] \text{E}[x] E[x] 的期望距离(平方)。样本方差 S 2 S^2 S2 表示离样本均值的实际距离(平方)。平方根是标准差 σ σ σ S S S

样本方差 S 2 = 1 N − 1 [ ( x 1 − m ) 2 + ⋯ + ( x N − m ) 2 ] (3) S^2 = \frac{1}{N-1} [(x_1-m)^2 + \cdots + (x_N-m)^2] \tag{3} S2=N11[(x1m)2++(xNm)2](3)

样本年龄 x = 18 , 17 , 18 , 19 , 17 x=18,17,18,19,17 x=18,17,18,19,17 有均值 m = 17.8 m = 17.8 m=17.8。样本有方差 0.7 0.7 0.7

S 2 = 1 5 − 1 [ ( . 2 ) 2 + ( − . 8 ) 2 + ( . 2 ) 2 + ( 1.2 ) 2 + ( − . 8 ) 2 ] = 1 4 ( 2.8 ) = 0.7 S^2 = \frac{1}{5-1} [(.2)^2 + (-.8)^2 + (.2)^2 + (1.2)^2 + (-.8)^2] = \frac{1}{4}(2.8) = 0.7 S2=511[(.2)2+(.8)2+(.2)2+(1.2)2+(.8)2]=41(2.8)=0.7

当我们计算平方时,负号消失了。请注意!统计学家除以 N − 1 = 4 N - 1 = 4 N1=4(而不是 N = 5 N = 5 N=5),因此 S 2 S^2 S2 σ 2 \sigma^2 σ2 的无偏估计。样本均值中已经包含了一个自由度。

一个重要的恒等式来自于将每个 ( x − m ) 2 (x-m)^2 (xm)2 分成 x 2 − 2 m x + m 2 x^2- 2mx + m^2 x22mx+m2

sum of  ( x i − m ) 2 = ( sum of  x i 2 ) + 2 m ( sum of  x i ) + ( sum of  m 2 ) = ( sum of  x i 2 ) + 2 m ( N m ) + N m 2 sum of  ( x i − m ) 2 = ( sum of  x i 2 ) − N m 2 (4) \begin{aligned} \text{sum of } (x_i - m)^2 &= (\text{sum of } x_i^2) + 2m(\text{sum of } x_i) + (\text{sum of } m^2) \\ &= (\text{sum of } x_i^2) + 2m(Nm) + N m^2 \\ \text{sum of } (x_i - m)^2 &= (\text{sum of } x_i^2) - N m^2 \end{aligned} \tag{4} sum of (xim)2sum of (xim)2=(sum of xi2)+2m(sum of xi)+(sum of m2)=(sum of xi2)+2m(Nm)+Nm2=(sum of xi2)Nm2(4)

这是一个通过添加 x 1 2 + ⋯ + x N 2 x_1^2 + \cdots + x_N^2 x12++xN2 来找寻 ( x 1 − m ) 2 + ⋯ + ( x N − m ) (x_1-m)^2+\cdots+(x_N-m) (x1m)2++(xNm) 的等价方式。


现在从概率 p i p_i pi (绝不会是负值)开始,而不再是样本。我们找到期望值而不是样本值。方差 σ 2 \sigma^2 σ2 是统计学中的关键数字。

方差 σ 2 = E [ ( x − m ) 2 ] = p 1 ( x 1 − m ) 2 + ⋯ + p n ( x n − m ) 2 (5) \sigma^2 = \text{E} [(x-m)^2] = p_1 (x_1-m)^2 + \cdots + p_n (x_n-m)^2 \tag{5} σ2=E[(xm)2]=p1(x1m)2++pn(xnm)2(5)

我们对期望值 m = E [ x ] m = \text{E}[x] m=E[x] 的距离进行平方。我们没有样本,只期望。我们知道概率,但我们不知道实验结果。


Continuous Probability Distributions 连续概率分布

到目前为止,我们有 n n n 种可能的结果 x 1 , ⋯   , x n x_1,\cdots,x_n x1,,xn。如果样本年龄为 17 、 18 、 19 17、18、19 171819 岁时,只有 n = 3 n = 3 n=3。如果我们用天而不是年来衡量年龄,那么就会有一千种可能的年龄(太多了)。最好允许 17 17 17 20 20 20 岁之间的每个数字——一个可能年龄的连续体。那么年龄 x 1 , x 2 , x 3 x_1, x_2, x_3 x1,x2,x3 岁的概率 p 1 , p 2 , p 3 p_1, p_2, p_3 p1,p2,p3 必须移动到概率分布(probability distribution) p ( x ) p(x) p(x) 17 ≤ x ≤ 20 17 \le x \le 20 17x20 的连续范围内。

解释概率分布的最好方法是举两个例子。它们是均匀分布(uniform distribution)正态分布(normal distribution)。均匀分布很容易。正态分布非常重要。


均匀分布

假设年龄均匀分布在 17.0 17.0 17.0 20.0 20.0 20.0 之间。这些数字之间的所有年龄都是“同等可能的”。当然,任何一个确切的年龄都没有机会。你得到 x = 17.1 x = 17.1 x=17.1 x = 17 + 2 x=17+ \sqrt{2} x=17+2 的概率为零。你可以真实地提供(假设我们的均匀分布)一个新生年龄小于 x x x 的概率 F ( x ) F(x) F(x)

年龄小于 x = 17 x=17 x=17 的概率为 F ( 17 ) = 0 F(17)=0 F(17)=0 x ≤ 17 x\le 17 x17 永远不会发生
年龄小于 x = 20 x=20 x=20 的概率为 F ( 20 ) = 1 F(20)=1 F(20)=1 x ≤ 20 x\le 20 x20 会发生
年龄小于 x x x 的概率为 F ( x ) = 1 3 ( x − 17 ) F(x)=\frac{1}{3}(x-17) F(x)=31(x17) F F F 0 0 0 1 1 1

公式 F ( x ) = 1 3 ( x − 17 ) F(x) = \frac{1}{3}(x-17) F(x)=31(x17) 给出在 x = 17 x= 17 x=17 F = 0 F = 0 F=0;那么 x < 17 x < 17 x<17 就不会发生。它给出在 x = 20 x= 20 x=20 F ( x ) = 1 F(x)=1 F(x)=1;那么 x ≤ 20 x \le 20 x20 是肯定的。在 17 17 17 20 20 20 之间,这个均匀模型的累积分布(cumulative distribution) F ( x ) F(x) F(x) 的图呈线性增长。


画出 F ( x ) F(x) F(x) 的图和它的导数 p ( x ) = p(x) = p(x)= 概率密度函数(probability density function)。

在这里插入图片描述

你可以说 p ( x ) d x p(x) \text{d}x p(x)dx 是样本落在 x x x x + d x x+\text{d}x x+dx 之间的概率。这是极其真实的(infinitesimally true): p ( x ) d x p(x) \text{d}x p(x)dx 等于 F ( x + d x ) − F ( x ) F(x+\text{d}x) - F(x) F(x+dx)F(x)。以下是完整描述:

F = integral of  p  Probability of a ≤ x ≤ b = ∫ a b p ( x ) d x = F ( b ) − F ( a ) (6) F = \text{integral of } p \quad \text{ Probability of} a \le x \le b = \int_{a}^{b} p(x) \text{d}x = F(b) - F(a) \tag{6} F=integral of p Probability ofaxb=abp(x)dx=F(b)F(a)(6)

F ( b ) F(b) F(b) x ≤ b x \le b xb 的概率。我减去 F ( a ) F(a) F(a) 使 x ≥ a x \ge a xa 保持不变。这样有 a ≤ x ≤ b a \le x \le b axb


Mean and Variance of p ( x ) p(x) p(x) p ( x ) p(x) p(x) 的均值和方差

一个概率分布的均值 m m m 和方差 σ 2 \sigma^2 σ2 是多少?之前我们添加了 p i x i p_i x_i pixi 来获得均值(期望均值)。对于一个连续分布我们对 x p ( x ) x p(x) xp(x) 积分:

均值 m = E [ x ] = ∫ x p ( x ) d x = ∫ x = 17 20 ( x ) ( 1 3 ) d x = 18.5 m = \text{E}[x] = \int x p(x) \text{d} x = \int_{x=17}^{20} (x) (\frac{1}{3}) \text{d}x = 18.5 m=E[x]=xp(x)dx=x=1720(x)(31)dx=18.5

对于均匀分布,均值 m m m 介于 17 17 17 20 20 20 之间。那么随机值 x x x 低于中点 m = 18.5 m = 18.5 m=18.5 的概率为 F ( m ) = 1 2 F(m) = \frac{1}{2} F(m)=21


Normal Distribution: Bell-shaped Curve

N Coin Flips and N → ∞ N \rightarrow \infty N

Monte Carlo Estimation Methods

Review: Three Formulas for the Mean and the Variance


12.2 Covariance Matrices and Joint Probabilities

12.3 Multivariate Gaussian and Weighted Least Squares

\begin{aligned} \end{aligned}

Ref

  1. Introduction to Linear Algebra - GILBERT STRANG
  2. 为什么分母从n变成n-1之后,就从【有偏估计】变成了【无偏估计】?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/834539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

idea-常用插件汇总

idea-常用插件汇总 码云插件 这个插件是码云提供的ps-码云是国内的一款类似github的代码托管工具。 Lombok Lombok是一个通用Java类库&#xff0c;能自动插入编辑器并构建工具&#xff0c;简化Java开发。通过添加注解的方式&#xff0c;不需要为类编写getter或setter等方法…

[MYSQL]查询单位时间消耗量

请求哪位大神给我优化一下mysql语句. 数据库表:(日/月/年 数据表和data_hour结构一样,懒得复制了,不然太长) DROP TABLE IF EXISTS data_source;#数据源 create table IF not EXISTS data_source ( num int unsigned not null auto_increment PRIMARY KEY COMMENT序号 …

关于win11 debian wsl 子系统安装启动docker一直starting,无法启动

首先我先说明&#xff0c;我的步骤都是按照官网步骤来的 通过官网的操作步骤 通过测试命令 sudo docker run hello-world得到下面的命令&#xff0c;我们通过启动命令 sudo service docker start 执行结果如下图 也就是说无法启动&#xff0c;一直显示在启动中 遇到这种情况…

Ubuntu安装git

使用 apt-get install git 安装git 报错&#xff1a; 这个错误信息通常表示您的系统上没有可用的 git 软件包。这可能是因为您的软件源列表中没有包含 git 软件包所在的软件源&#xff0c;或者您的软件源列表已经过期。 解决&#xff1a; 如果您使用的是 Ubuntu 或类似…

Vue2与Vue3响应式原理

Vue2的响应式 Vue3的响应式

(杭电多校)2023“钉耙编程”中国大学生算法设计超级联赛(5)

1001 Typhoon 计算几何 对于每一个避难点,计算其到所有线段的距离,取min即可 AC代码&#xff1a; #include<iostream> #include<algorithm> #include<cstring> #include<vector> #include<deque> #include<cmath> #include<cstdio&…

【云原生】K8S二进制搭建二:部署CNI网络组件

目录 一、K8S提供三大接口1.1容器运行时接口CRI1.2云原生网络接口CNI1.3云原生存储接口CSI 二、Flannel网络插件2.1K8S中Pod网络通信2.2Overlay Network2.3VXLAN2.4Flannel 三、Flannel udp 模式的工作原理3.1ETCD 之 Flannel 提供说明 四、vxlan 模式4.1Flannel vxlan 模式的工…

Packet Tracer - 配置初始路由器设置

Packet Tracer - 配置初始路由器设置 目标 第 1 部分&#xff1a;检验默认路由器配置 第 2 部分&#xff1a;配置并检验初始路由器配置 第 3 部分&#xff1a;保存运行配置文件 拓扑图 背景信息 在本练习中&#xff0c;您将执行基本的路由器配置。您将使用加密密码和明文…

HDFS架构刨析

HDFS架构刨析 概述HDFS架构图整体概述主角色&#xff1a;namenodefsimage内存元数据镜像文件edits log&#xff08;Journal&#xff09;编辑日志 从角色&#xff1a;datanode主角色辅助角色&#xff1a;secondarynamenode 重要特性主从架构分块存储机制副本机制namespace元数据…

京津冀特大暴雨,带给应急通信工作怎样的启示?

上个月&#xff0c;我发卫星基站中移集采那篇文章的时候&#xff0c;就提到&#xff1a;未来即将进入汛期&#xff0c;应急通信装备将发挥重要作用。 果不其然&#xff0c;没多久&#xff0c;超强台风“杜苏芮”形成并登陆福建&#xff0c;造成巨大破坏。 除了在南方地区的肆虐…

Java工程师研学之路【003Java基础语法下】

知识体系 挑战&#xff08;challenge&#xff09; 从终端输入字符串(输入的个数不超过10个)&#xff0c;当输入遇到end字符串时&#xff0c;结束输入并且打印出之前输入的所有字符串。 思路&#xff1a;首先要输出end之前的所有字符串&#xff0c;故可以使用数组把输入的字符…

zookeeper+kafka分布式消息队列集群的部署

目录 一、zookeeper 1.Zookeeper 定义 2.Zookeeper 工作机制 3.Zookeeper 特点 4.Zookeeper 数据结构 5.Zookeeper 应用场景 &#xff08;1&#xff09;统一命名服务 &#xff08;2&#xff09;统一配置管理 &#xff08;3&#xff09;统一集群管理 &#xff08;4&…

零代码爬虫平台SpiderFlow的安装

什么是 Spider Flow &#xff1f; Spider Flow 是一个高度灵活可配置的爬虫平台&#xff0c;用户无需编写代码&#xff0c;以流程图的方式&#xff0c;即可实现爬虫。该工具支持多数据源、自动保存至数据库、任务监控、抓取 JS 动态渲染页面、插件扩展&#xff08;OCR 识别、邮…

17、YML配置文件及让springboot启动时加载我们自定义的yml配置文件的几种方式

YML配置文件及加载自定义配置文件的几种方式 ★ YAML配置文件 其实本质和.properties文件的是一样的。 Spring Boot默认使用SnakeYml工具来处理YAML配置文件&#xff0c;SnakeYml工具默认就会被spring-boot-starter导入&#xff0c;因此无需开发者做任何额外配置。 YAML本质…

为Android构建现代应用——应用导航设计

在前一章节的实现中&#xff0c;Skeleton: Main structure&#xff0c;我们留下了几个 Jetpack 架构组件&#xff0c;这些组件将在本章中使用&#xff0c;例如 Composables、ViewModels、Navigation 和 Hilt。此外&#xff0c;我们还通过 Scaffold 集成了 TopAppBar 和 BottomA…

论文阅读- Uncovering Coordinated Networks on Social Media:Methods and Case Studies

链接&#xff1a;https://arxiv.org/pdf/2001.05658.pdf 目录 摘要&#xff1a; 引言 Methods Case Study 1: Account Handle Sharing Coordination Detection 分析 Case Study 2: Image Coordination Coordination Detection Analysis Case Study 3: Hashtag Sequen…

Leetcode-每日一题【剑指 Offer 39. 数组中出现次数超过一半的数字】

题目 数组中有一个数字出现的次数超过数组长度的一半&#xff0c;请找出这个数字。 你可以假设数组是非空的&#xff0c;并且给定的数组总是存在多数元素。 示例 1: 输入: [1, 2, 3, 2, 2, 2, 5, 4, 2]输出: 2 限制&#xff1a; 1 < 数组长度 < 50000 解题思路 前置知…

手把手教新手最新Maven3.9.3下载安装配置

当前文档地址&#xff1a;有道云笔记 手把手教新手最新Maven3.9.3下载安装配置 1.下载 Maven官网&#xff1a;Maven – Maven Documentation 1.1打开主页&#xff0c;点击 Download 1.2 选择二进制压缩包&#xff0c;点击apache-maven-3.9.3-bin.zip进行下载 1.3 选择合适的…

租赁类小程序定制开发|租赁管理系统源码|免押租赁系统开发

随着互联网的发展&#xff0c;小程序成为了一种重要的移动应用开发方式。租赁小程序作为其中的一种类型&#xff0c;可以为很多行业提供便利和创新。下面我们将介绍一些适合开发租赁小程序的行业。   房屋租赁行业&#xff1a;租房小程序可以帮助房东和租户快速找到合适的租赁…

史上最全docker启动命令

docker Docker 启动镜像 一、查看当前docker中下载的镜像&#xff0c;如下图&#xff0c;当前我的Docker容器中存在两个镜像 &#xff0c;tomcat、mysql 二、启动镜像 (因启动命令参数过多&#xff0c;同时各种镜像启动时可以增加额外的参数&#xff0c;本次以启动mysql5.6为例…