一、引言
在《人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布》介绍了连续随机变量概率分布及概率密度函数的概念,并介绍了连续随机变量一个重要的概率密度函数:正态分布的概率密度函数的定义以及推导、使用场景,本文将介绍连续随机变量重要的标准正态分布。
二、标准正态分布
2.1、定义
在《人工智能数学基础–概率与统计12:连续随机变量的概率密度函数以及正态分布》介绍了正态分布 X ~ N(u,σ²):
f
(
x
)
=
(
2
π
σ
)
−
1
e
−
(
x
−
u
)
2
2
σ
2
(
−
∞
<
x
<
∞
)
{\Large f(x) = (\sqrt{2π} \;σ )^{-1}e^{-\frac{(x-u)^2}{2σ^2}}} \;\;\;\;\;\;\;\;\;\;(-∞<x<∞)
f(x)=(2πσ)−1e−2σ2(x−u)2(−∞<x<∞)
其中u和σ²为正态分布的“参数”,都是常数,u为任何实数,0<σ<∞。
当正态分布的参数u=0、σ²=1时,正态分布的概率密度函数就简化为:
f
(
x
)
=
e
−
x
2
2
/
2
π
(
−
∞
<
x
<
∞
)
{\Large f(x) = e^{-\frac{x^2}2}} /\sqrt{2π} \;\;\;\;\;\;\;\;\;\;(-∞<x<∞)
f(x)=e−2x2/2π(−∞<x<∞)
这就是正态分布N(0,1)的密度函数,N(0,1)就称为标准正态分布,其密度函数常记为φ(x),分布函数记为Φ(x)。
2.2、标准整体分布与正态分布的关系
标准正态分布是正态分布的一种特例,标准正态分布函数非常重要,因为任意的正态分布函数N(u,σ²)都可以转换成标准正态分布N(0,1),对于任意的X~N(u,σ²),则 Y = (X-u)/σ ~ N(0,1),证明过程如下:
这个分布函数的导数就是标准正态分布密度函数。
2.3、标准正态分布函数表
标准正态分布函数非常重要,因此其变量与值的数据在概率论相关著作中都有x取值和函数值的表,下表是标准正态分布函数 Φ ( x ) = ( 2 π ) − 1 ∫ − ∞ x e − t 2 2 d t Φ(x) = (\sqrt{2π})^{-1}∫^x_{-∞} e^{-\frac{t^2}{2}}dt Φ(x)=(2π)−1∫−∞xe−2t2dt当0≤x≤2.98时的函数值对应表,其中纵坐标为x取值到十分位的值,横坐标为x百分位的值,表格中为分布函数的值,当0≤x≤2.98时此表中没有表达的x的对应函数值,可通过线性插值法获得。
当x<0时,可用Φ(x) =1-Φ(-x)转换为x大于0的情况,这个转换证明如下:
2.4、应用案例
例、已知 X~N(1.5,2²),计算P(-1≤x≤2)。
解:
P
(
−
1
≤
x
≤
2
)
=
P
(
−
1
−
1.5
2
≤
X
−
1.5
2
≤
2
−
1.5
2
)
=
P
(
−
1.25
≤
X
−
1.5
2
≤
0.25
)
=
Φ
(
0.25
)
−
Φ
(
−
1.25
)
=
Φ
(
0.25
)
+
Φ
(
1.25
)
−
1
=
0.4931
P(-1≤x≤2) = P(\frac{-1-1.5}{2}≤\frac{X-1.5}{2}≤\frac{2-1.5}{2})\\=P(-1.25≤\frac{X-1.5}{2}≤0.25)=Φ(0.25)-Φ(-1.25)=Φ(0.25)+Φ(1.25)-1=0.4931
P(−1≤x≤2)=P(2−1−1.5≤2X−1.5≤22−1.5)=P(−1.25≤2X−1.5≤0.25)=Φ(0.25)−Φ(−1.25)=Φ(0.25)+Φ(1.25)−1=0.4931
其中Φ(0.25)、Φ(1.25)的值通过查表加线性插值得到。
三、小结
本文是老猿学习中国科学技术大学出版社出版的陈希孺老先生的《概率论与数理统计》的总结和思考,标准正态分布N(0,1)是正态分布N(u,σ²)的特例,本文介绍了标准正态分布的由来、正态分布转换成标准正态分布的方法以及标准正态分布函数值表和应用案例。
更多人工智能数学基础请参考专栏《人工智能数学基础》。
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
关于老猿的付费专栏
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_9607725.html 使用PyQt开发图形界面Python应用》专门介绍基于Python的PyQt图形界面开发基础教程,对应文章目录为《 https://blog.csdn.net/LaoYuanPython/article/details/107580932 使用PyQt开发图形界面Python应用专栏目录》;
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_10232926.html moviepy音视频开发专栏 )详细介绍moviepy音视频剪辑合成处理的类相关方法及使用相关方法进行相关剪辑合成场景的处理,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/107574583 moviepy音视频开发专栏文章目录》;
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_10581071.html OpenCV-Python初学者疑难问题集》为《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的伴生专栏,是笔者对OpenCV-Python图形图像处理学习中遇到的一些问题个人感悟的整合,相关资料基本上都是老猿反复研究的成果,有助于OpenCV-Python初学者比较深入地理解OpenCV,对应文章目录为《https://blog.csdn.net/LaoYuanPython/article/details/109713407 OpenCV-Python初学者疑难问题集专栏目录 》
- 付费专栏《https://blog.csdn.net/laoyuanpython/category_10762553.html Python爬虫入门 》站在一个互联网前端开发小白的角度介绍爬虫开发应知应会内容,包括爬虫入门的基础知识,以及爬取CSDN文章信息、博主信息、给文章点赞、评论等实战内容。
前两个专栏都适合有一定Python基础但无相关知识的小白读者学习,第三个专栏请大家结合《https://blog.csdn.net/laoyuanpython/category_9979286.html OpenCV-Python图形图像处理 》的学习使用。
对于缺乏Python基础的同仁,可以通过老猿的免费专栏《https://blog.csdn.net/laoyuanpython/category_9831699.html 专栏:Python基础教程目录)从零开始学习Python。
如果有兴趣也愿意支持老猿的读者,欢迎购买付费专栏。