正态分布的推导笔记

news2025/1/10 16:21:16

本篇文章来源于知乎上一篇关于正态分布推导的文章,醍醐灌顶,因此记录下笔记

在这里插入图片描述

from Introduction To The Normal Distribution (Bell Curve), BySaul Mcleod, PhD, https://www.simplypsychology.org/normal-distribution.html

假设有误差概率密度函数 f ( t ) f(t) f(t),现在有 n n n 个独立观测的值 x 1 x_1 x1 x 2 x_2 x2 ⋯ \cdots x n x_n xn,假设真值为 μ \mu μ,那么误差为:

ε 1 = x 1 − μ ε 2 = x 2 − μ ⋮ ε n = x n − μ \begin{aligned} \varepsilon_{1} & =x_{1}-\mu \\ \varepsilon_{2} & =x_{2}-\mu \\ & \vdots \\ \varepsilon_{n} & =x_{n}-\mu \end{aligned} ε1ε2εn=x1μ=x2μ=xnμ

根据生活经验,这个误差 ε \varepsilon ε,在做大量的观测下,其大部分的数值应在 0 0 0 附近范围波动,且出现的频数较多。而误差大的观测值,相应的 ∣ ε ∣ |\varepsilon| ε 也应很大,出现的频数也应该较小。做极大似然函数:

L ( μ ) = ∏ i = 1 n f ( ε i ) = f ( x 1 − μ ) f ( x 2 − μ ) ⋯ f ( x n − μ ) \begin{aligned} L(\mu) & =\prod_{i=1}^{n} f\left(\varepsilon_{i}\right) \\ & =f\left(x_{1}-\mu\right) f\left(x_{2}-\mu\right) \cdots f\left(x_{n}-\mu\right) \end{aligned} L(μ)=i=1nf(εi)=f(x1μ)f(x2μ)f(xnμ)

L ( μ ) L(\mu) L(μ) 取自然对数:

ln ⁡ [ L ( μ ) ] = ln ⁡ [ ∏ i = 1 n f ( ε i ) ] = ln ⁡ [ f ( x 1 − μ ) f ( x 2 − μ ) ⋯ f ( x n − μ ) ] = ln ⁡ [ f ( x 1 − μ ) ] + ln ⁡ [ f ( x 2 − μ ) ] + ⋯ + ln ⁡ [ f ( x n − μ ) ] = ∑ i = 1 n ln ⁡ [ f ( x i − μ ) ] \begin{aligned} \ln [L(\mu)] & =\ln \left[\prod_{i=1}^{n} f\left(\varepsilon_{i}\right)\right] \\ & =\ln \left[f\left(x_{1}-\mu\right) f\left(x_{2}-\mu\right) \cdots f\left(x_{n}-\mu\right)\right] \\ & =\ln \left[f\left(x_{1}-\mu\right)\right]+\ln \left[f\left(x_{2}-\mu\right)\right]+\cdots+\ln \left[f\left(x_{n}-\mu\right)\right] \\ & =\sum_{i=1}^{n} \ln \left[f\left(x_{i}-\mu\right)\right] \end{aligned} ln[L(μ)]=ln[i=1nf(εi)]=ln[f(x1μ)f(x2μ)f(xnμ)]=ln[f(x1μ)]+ln[f(x2μ)]++ln[f(xnμ)]=i=1nln[f(xiμ)]

为了得到 ln ⁡ [ L ( μ ) ] \ln [L(\mu)] ln[L(μ)] 的最大值,对其 ln ⁡ [ L ( μ ) ] \ln [L(\mu)] ln[L(μ)] 求偏导并令其等于 0 0 0

∂ ln ⁡ [ L ( μ ) ] ∂ μ = ∂ ∑ i = 1 n ln ⁡ [ f ( x i − μ ) ] ∂ μ = − ∑ i = 1 n f ′ ( x i − μ ) f ( x i − μ ) = 0 \begin{aligned} \frac{\partial \ln [L(\mu)]}{\partial \mu} & =\frac{\partial \sum_{i=1}^{n} \ln \left[f\left(x_{i}-\mu\right)\right]}{\partial \mu} \\ & =-\sum_{i=1}^{n} \frac{f^{\prime}\left(x_{i}-\mu\right)}{f\left(x_{i}-\mu\right)} \\ & =0 \end{aligned} μln[L(μ)]=μi=1nln[f(xiμ)]=i=1nf(xiμ)f(xiμ)=0

g ( t ) = f ′ ( t ) f ( t ) g(t)=\frac{f^{\prime}(t)}{f(t)} g(t)=f(t)f(t),则上述式子变成:

∑ i = 1 n g ( x i − μ ) = 0 \sum_{i=1}^{n} g\left(x_{i}-\mu\right)=0 i=1ng(xiμ)=0

到了这一步后,精彩的部分就开始来了,这也是高斯的高明之处,他认为 μ \mu μ 的无偏估计应为 x ˉ \bar{x} xˉ,则原式子变为

∑ i = 1 n g ( x i − x ˉ ) = 0 \sum_{i=1}^{n} g\left(x_{i}-\bar{x}\right)=0 i=1ng(xixˉ)=0

其中,

x ˉ = 1 n ∑ i = 1 n x i \bar{x}=\frac{1}{n} \sum_{i=1}^{n} x_{i} xˉ=n1i=1nxi

解上述方程,对每个 x i x_i xi 求偏导,比如对 x 1 x_1 x1 求偏导,可得如下方程:

∂ ∑ i = 1 n g ( x i − x ˉ ) ∂ x 1 = ∂ ∑ i = 1 n g ( x i − 1 n ∑ i = 1 n x i ) ∂ x 1 = g ′ ( x 1 − x ˉ ) ( 1 − 1 n ) + g ′ ( x 2 − x ˉ ) ( − 1 n ) + ⋯ + g ′ ( x n − x ˉ ) ( − 1 n ) = 0 \begin{aligned} \frac{\partial \sum_{i=1}^{n} g\left(x_{i}-\bar{x}\right)}{\partial x_{1}} & =\frac{\partial \sum_{i=1}^{n} g\left(x_{i}-\frac{1}{n} \sum_{i=1}^{n} x_{i}\right)}{\partial x_{1}} \\ & =g^{\prime}\left(x_{1}-\bar{x}\right)\left(1-\frac{1}{n}\right)+g^{\prime}\left(x_{2}-\bar{x}\right)\left(-\frac{1}{n}\right)+\cdots+g^{\prime}\left(x_{n}-\bar{x}\right)\left(-\frac{1}{n}\right) \\ & =0 \end{aligned} x1i=1ng(xixˉ)=x1i=1ng(xin1i=1nxi)=g(x1xˉ)(1n1)+g(x2xˉ)(n1)++g(xnxˉ)(n1)=0

g ′ ( x i − x ˉ ) g^{\prime}\left(x_{i}-\bar{x}\right) g(xixˉ) 看做未知数,把上述 个齐次线性方程组写成矩阵方程 A x = 0 \boldsymbol{A x}=\mathbf{0} Ax=0 的形式:

( 1 − 1 n − 1 n ⋯ − 1 n − 1 n 1 − 1 n ⋯ − 1 n ⋮ ⋮ ⋮ ⋮ − 1 n − 1 n − 1 n 1 − 1 n ) ( g ′ ( x 1 − x ˉ ) g ′ ( x 2 − x ˉ ) ⋮ g ′ ( x n − x ˉ ) ) = ( 0 0 ⋮ 0 ) \left(\begin{array}{cccc} 1-\frac{1}{n} & -\frac{1}{n} & \cdots & -\frac{1}{n} \\ -\frac{1}{n} & 1-\frac{1}{n} & \cdots & -\frac{1}{n} \\ \vdots & \vdots & \vdots & \vdots \\ -\frac{1}{n} & -\frac{1}{n} & -\frac{1}{n} & 1-\frac{1}{n} \end{array}\right)\left(\begin{array}{c} g^{\prime}\left(x_{1}-\bar{x}\right) \\ g^{\prime}\left(x_{2}-\bar{x}\right) \\ \vdots \\ g^{\prime}\left(x_{n}-\bar{x}\right) \end{array}\right)=\left(\begin{array}{c} 0 \\ 0 \\ \vdots \\ 0 \end{array}\right) 1n1n1n1n11n1n1n1n1n11n1 g(x1xˉ)g(x2xˉ)g(xnxˉ) = 000

对于上述方程组的系数矩阵 M \mathbf{M} M,将第 1 , 2 , 3 ⋯   , n 1,2,3 \cdots,n 1,2,3,n 行依次加到第 1 1 1 行,可得如下矩阵:

M = ( 1 − 1 n − 1 n ⋯ − 1 n − 1 n 1 − 1 n ⋯ − 1 n ⋮ ⋮ ⋮ ⋮ − 1 n − 1 n − 1 n 1 − 1 n ) → ( 0 0 ⋯ 0 − 1 n 1 − 1 n ⋯ − 1 n ⋮ ⋮ ⋮ ⋮ − 1 n − 1 n − 1 n 1 − 1 n ) \boldsymbol{M}=\left(\begin{array}{cccc} 1-\frac{1}{n} & -\frac{1}{n} & \cdots & -\frac{1}{n} \\ -\frac{1}{n} & 1-\frac{1}{n} & \cdots & -\frac{1}{n} \\ \vdots & \vdots & \vdots & \vdots \\ -\frac{1}{n} & -\frac{1}{n} & -\frac{1}{n} & 1-\frac{1}{n} \end{array}\right) \rightarrow\left(\begin{array}{cccc} 0 & 0 & \cdots & 0 \\ -\frac{1}{n} & 1-\frac{1}{n} & \cdots & -\frac{1}{n} \\ \vdots & \vdots & \vdots & \vdots \\ -\frac{1}{n} & -\frac{1}{n} & -\frac{1}{n} & 1-\frac{1}{n} \end{array}\right) M= 1n1n1n1n11n1n1n1n1n11n1 0n1n101n1n1n10n11n1

第一行全为0,那么 det ⁡ M = 0 \det{M}=0 detM=0,这只能说明方程组有无穷多解,具体还要算出 rank ⁡ ( M ) \operatorname{rank}(\boldsymbol{M}) rank(M)。最终,上述方程组的解可以写为

X = k ( g ′ ( x 1 − x ˉ ) g ′ ( x 2 − x ˉ ) ⋮ g ′ ( x n − x ˉ ) ) = k ( 1 1 ⋮ 1 ) \boldsymbol{X}=k\left(\begin{array}{c} g^{\prime}\left(x_{1}-\bar{x}\right) \\ g^{\prime}\left(x_{2}-\bar{x}\right) \\ \vdots \\ g^{\prime}\left(x_{n}-\bar{x}\right) \end{array}\right)=k\left(\begin{array}{c} 1 \\ 1 \\ \vdots \\ 1 \end{array}\right) X=k g(x1xˉ)g(x2xˉ)g(xnxˉ) =k 111

g ′ ( x 1 − x ˉ ) = g ′ ( x 2 − x ˉ ) = ⋯ = g ′ ( x n − x ˉ ) = k g^{\prime}\left(x_{1}-\bar{x}\right)=g^{\prime}\left(x_{2}-\bar{x}\right)=\cdots=g^{\prime}\left(x_{n}-\bar{x}\right)=k g(x1xˉ)=g(x2xˉ)==g(xnxˉ)=k,解微分方程,可得:

g ( t ) = k t + b g(t)=k t+b g(t)=kt+b

求解该微分方程:

∫ f ′ ( t ) f ( t ) d t = ∫ k t   d t ⇔ ∫ d [ f ( t ) ] f ( t ) = 1 2 k t 2 + c ⇔ ln ⁡ [ f ( t ) ] = 1 2 k t 2 + c ⇔ f ( t ) = K e 1 2 k t 2 \begin{aligned} \int \frac{f^{\prime}(t)}{f(t)} \mathrm{d} t=\int k t \mathrm{~d} t & \Leftrightarrow \int \frac{\mathrm{d}[f(t)]}{f(t)}=\frac{1}{2} k t^{2}+c \\ & \Leftrightarrow \ln [f(t)]=\frac{1}{2} k t^{2}+c \\ & \Leftrightarrow f(t)=K \mathrm{e}^{\frac{1}{2} k t^{2}} \end{aligned} f(t)f(t)dt=kt dtf(t)d[f(t)]=21kt2+cln[f(t)]=21kt2+cf(t)=Ke21kt2

同时, f ( t ) f(t) f(t) 为概率密度函数,那么其从 − ∞ -\infty ∞ \infty 的积分为 1 1 1(概率密度的正则性)

∫ − ∞ + ∞ f ( t ) d t = ∫ − ∞ + ∞ K e 1 2 k t 2   d t = K ∫ − ∞ + ∞ e − t 2 2 σ 2   d t = K 2 σ [ ∫ − ∞ + ∞ e − ( t 2 σ ) 2   d ( 1 2 σ t ) ] [ 2 σ ∫ − ∞ + ∞ e − ( s 2 σ ) 2   d ( 1 2 σ s ) ] = K 2 σ ∫ − ∞ + ∞ ∫ − ∞ + ∞ e − ( u 2 + v 2 ) d u   d v = K 2 σ ∫ 0 2 π d θ ∫ 0 + ∞ e − r 2 r   d r = K 2 σ π = 1 \begin{aligned} \int_{-\infty}^{+\infty} f(t) \mathrm{d} t & =\int_{-\infty}^{+\infty} K \mathrm{e}^{\frac{1}{2} k t^{2}} \mathrm{~d} t \\ & =K \int_{-\infty}^{+\infty} \mathrm{e}^{-\frac{t^{2}}{2 \sigma^{2}}} \mathrm{~d} t \\ & =K \sqrt{\sqrt{2} \sigma\left[\int_{-\infty}^{+\infty} \mathrm{e}^{-\left(\frac{t}{\sqrt{2} \sigma}\right)^{2}} \mathrm{~d}\left(\frac{1}{\sqrt{2} \sigma} t\right)\right]\left[\sqrt{2} \sigma \int_{-\infty}^{+\infty} \mathrm{e}^{-\left(\frac{s}{\sqrt{2} \sigma}\right)^{2}} \mathrm{~d}\left(\frac{1}{\sqrt{2} \sigma} s\right)\right]} \\ & =K \sqrt{2} \sigma \sqrt{\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} \mathrm{e}^{-\left(u^{2}+v^{2}\right)} \mathrm{d} u \mathrm{~d} v} \\ & =K \sqrt{2} \sigma \sqrt{\int_{0}^{2 \pi} \mathrm{d} \theta \int_{0}^{+\infty} \mathrm{e}^{-r^{2}} r \mathrm{~d} r} \\ & =K \sqrt{2} \sigma \sqrt{\pi} \\ & =1 \end{aligned} +f(t)dt=+Ke21kt2 dt=K+e2σ2t2 dt=K2 σ[+e(2 σt)2 d(2 σ1t)][2 σ+e(2 σs)2 d(2 σ1s)] =K2 σ++e(u2+v2)du dv =K2 σ02πdθ0+er2r dr =K2 σπ =1

最终求得概率密度函数:

f ( t ) = 1 2 π σ e − 1 2 ( t σ ) 2 f(t)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{1}{2}\left(\frac{t}{\sigma}\right)^{2}} f(t)=2π σ1e21(σt)2

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1022580.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VMwave虚拟机配置和外网联通

还原默认设置之后,参考 VMwave 虚拟机的三种上网方式_51CTO博客_虚拟机网络设置的三种 设置桥接模式 ,配置虚拟机为静态IP(网段和主机相通)。

利用prctl 函数给线程命名

头文件&#xff1a; #include <sys/prctl.h> 函数原型&#xff1a; extern int prctl (int __option, ...) 作用&#xff1a; 这个函数是为系统量身定做的&#xff0c;它的功能取决于第一个参数 option &#xff1b; 参数含义&#xff1a; option:功能选项 arg2~ar…

动画制作如何选择动作捕捉动画制作服务

近日&#xff0c;长宁ART PARK 大融城迎来了首位虚拟代言人“光艺”&#xff0c;拥有着极具感染力的笑容、数字人形象辨识度极高&#xff0c;在裸眼3D巨屏中&#xff0c;为市民带来虚实交互体验。而这种数字人动画的背后&#xff0c;大多以动作捕捉动画制作技术为主。 *素材源于…

opengl下的视锥体剔除和凸多边形剔除

预备知识 法线方程表达式的一般形式为Ax+By+Cz+D=0,其中(A,B,C)是平面的法向量,D是平面的截距。 平面上一点为P(x0,y0,z0),则点P到平面的距离为:d = |Ax0+By0+Cz0+D| / √(A+B+C) (因为法向量没有归一化,所以得到法向量上的投影要除以法向量长度) 假设n是归一化后的法向…

企业架构LNMP学习笔记50

aof默认是不开的。备份频率是更高的。 aof备份的频率&#xff1a; appendfsync always&#xff1a; 每次收到写命令就立即强制写入磁盘&#xff0c;最慢的&#xff0c;但是保证完全持久化&#xff0c;不推荐使用。 appendfsync everysec&#xff1a; 每秒强制写入磁盘一次&a…

IPO解读丨转向国内帐篷市场,泰鹏智能能否抓住露营经济的红利?

IPO节奏阶段性放缓之际&#xff0c;北交所近日迎来了一家新上市企业。 北交所审议结果显示&#xff0c;山东泰鹏智能家居股份有限公司&#xff08;简称为“泰鹏智能”&#xff09;符合发行条件、上市条件和信息披露要求&#xff0c;成功过会&#xff0c;进入发行准备阶段。 据…

【力扣每日一题】2023.9.10 打家劫舍Ⅳ

目录 题目&#xff1a; 示例&#xff1a; 分析&#xff1a; 代码&#xff1a; 题目&#xff1a; 示例&#xff1a; 分析&#xff1a; 题目翻译有些烂&#xff0c;我来二次翻译一下&#xff0c;找出数组中k个两两互不相邻的数&#xff0c;求出它们的最大值。要求最大值尽可…

功能定义-变道碰撞预警

功能概述 变道碰撞预警(Lane Change Warning)功能包括两个子功能&#xff1a; ——盲区监测(Blind Spot Detection)&#xff0c;其功能表现为实时监测驾驶员视野盲区&#xff0c;并在其盲区内出现其他道路使用者时发出提示或警示信息 ——接近车辆报警(Closing Vehicle Warnin…

字符串函数和内存函数详解(1)

&#x1f435;本文将通过函数原型、用法、模拟实现等多个方面全面讲解字符串的库函数 1.strlen&#x1f4da; 1.1函数用法&#x1f4d7; strlen函数用来计算字符串的长度&#xff0c;它会从接收到字符的地址开始读取直到遇到\0&#xff0c;每读取一个非\0的字符长度1&#xff…

荣膺ODCC 三项大奖!记忆科技旗下忆联再获行业认可

9月13—14日&#xff0c;由开放数据中心委员会&#xff08;ODCC&#xff09;举办的“2023 ODCC开放数据中心大会” 在北京举办。忆联母公司记忆科技作为国内领先IT硬件厂商受邀参会&#xff0c;以一站式成果为在场嘉宾带来一场科技盛宴。在本次大会中&#xff0c;忆联凭借极具竞…

华为MTL流程的六个模块初步解析

大家好&#xff01; 昨天华研荟给大家介绍了华为MTL流程的基本概念和发展历程&#xff0c;今天我们来了解下华为MTL流程的六个模块。 如昨天所述&#xff0c;华为的MLT流程主要有六个模块&#xff1a;市场洞察、市场管理、联合创新、销售赋能、激发需求、营销质量管理。 接下…

Spring 工厂

目录 一、Spring 工厂创建复杂对象 1、什么是复杂对象 2、 Spring 工厂创建复杂对象的 3 种方式 &#xff08;1&#xff09;FactoryBean 接口 开发步骤&#xff1a; 细节&#xff1a; FactoryBean 的实现原理[简易版] Factory Bean 总结 &#xff08;2&#xff09;实例…

IGEV深度估计测试代码

生成点云的测试脚本&#xff1a; import sys sys.path.append(core) DEVICE cuda import osos.environ[CUDA_VISIBLE_DEVICES] 0 import argparse import glob import numpy as np import torch from tqdm import tqdm from pathlib import Path from igev_stereo import IG…

2020-2023小样本学习(FSL)顶会论文及开源代码合集(已分类整理)

这次分享的是近四年&#xff08;2020-2023&#xff09;各大顶会中的小样本学习&#xff08;FSL&#xff09;论文&#xff0c;有160篇&#xff0c;涵盖了FSL三大类方法&#xff1a;数据、模型、算法&#xff0c;以及FSL的应用、技术、理论等领域。 由于论文数量太多&#xff0c…

【文末赠书】SRE求职必会 —— 可观测性平台可观测性工程(Observability Engineering)

文章目录 〇、导读一、实现可观测性平台的技术要点是什么&#xff1f;二、兼容全域信号量三、所谓全域信号量有哪些&#xff1f;四、统一采集和上传工具五、统一的存储后台六、自由探索和综合使用数据七、总结★推荐阅读《可观测性工程》直播预告直播主题直播时间预约直播 视频…

福建厦门航空飞机发动机零部件检测3D测量尺寸偏差比对-CASAIM中科广电

航空航天是一个创新型发展国家的尖端命脉&#xff0c;代表着一个国家科学技术的先进水平。在航空航天工业的发展和组成领域中&#xff0c;对于在制造业中的航空航天产品零部件精度要求十分严苛&#xff0c;从前期的设计、中期建造、后期维修检测&#xff0c;任何一个环节、任何…

vue一直自动换行问题解决

html换行主要是由于< div >标签引起的&#xff0c;而vue的一些前端组件本身就会自带< div >&#xff0c;比如el-input的标签拆分出来之后就形成了如下的内容 因此之前我采用 <el-form-item prop"code" v-if"captchaOnOff"><el-inpu…

【算法挨揍日记】day06——1004. 最大连续1的个数 III、1658. 将 x 减到 0 的最小操作数

1004. 最大连续1的个数 III 1004. 最大连续1的个数 III 题目描述&#xff1a; 给定一个二进制数组 nums 和一个整数 k&#xff0c;如果可以翻转最多 k 个 0 &#xff0c;则返回 数组中连续 1 的最大个数 。 解题思路&#xff1a; 首先题目要我们求出的最多翻转k个0后&#x…

BMS电池管理系统的蓝牙芯片 国产高性能 低功耗蓝牙Soc芯片PHY6222

电池管理系统是对电池进行监控与控制的系统&#xff0c;将采集的电池信息实时反馈给用户&#xff0c;同时根据采集的信息调节参数&#xff0c;充分发挥电池的性能。但是&#xff0c;前技术中&#xff0c;在管理多个电池时&#xff0c;需要人员现场调试与设置&#xff0c;导致其…

优化Java代码效率和算法设计,提升性能

在Java开发中&#xff0c;代码效率低下和算法不合理可能导致程序性能下降。下面将从以下几个方面探讨如何优化Java代码和算法设计&#xff0c;以提高程序的性能&#xff1a; 通过这些优化策略&#xff0c;我们可以显著提升Java程序的性能和响应速度。 一、选择合适的数据结构…