概率密度函数(PDF)正态分布

news2025/1/16 10:07:47

概率密度函数(PDF)是一个描述连续随机变量取特定值的相对可能性的函数。对于正态分布的情况,其PDF有一个特定的形式,这个形式中包括了一个常数乘以一个指数函数,它假设误差项服从均值为0的正态分布:
正太分布(高斯分布)
p ( ϵ ( i ) ) = 1 2 π σ 2 exp ⁡ ( − ( ϵ ( i ) ) 2 2 σ 2 ) p(\epsilon^{(i)}) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(\epsilon^{(i)})^2}{2\sigma^2}\right) p(ϵ(i))=2πσ2 1exp(2σ2(ϵ(i))2)
各名词解释:
p ( ϵ ( i ) ) p(\epsilon^{(i)}) p(ϵ(i)):这部分表示给定误差 ϵ ( i ) \epsilon^{(i)} ϵ(i)的概率密度。

σ 2 \sigma^2 σ2:正态分布的形状完全由两个参数决定:均值( μ \mu μ)和方差( σ 2 \sigma^2 σ2)。均值决定了分布的中心位置,而方差(标准差的平方)决定了分布的离散程度。这里均值( μ \mu μ)都假设为0因此不讨论。详细解释一下 σ 2 \sigma^2 σ2

  1. σ 2 \sigma^2 σ2是分布宽度的度量, σ 2 \sigma^2 σ2的数值表示数据分布的离散程度: σ 2 \sigma^2 σ2越大,数据分布越分散; σ 2 \sigma^2 σ2越小,数据分布越集中(如上图中的钟形越瘦)。
  2. σ 2 \sigma^2 σ2的计算过程:
    a.假设你有一组数据 X = { x 1 , x 2 , . . . , x n } X = \{x_1, x_2, ..., x_n\} X={x1,x2,...,xn},且已知均值 μ \mu μ为0。
    b.计算每个数据点的平方: x i 2 x_i^2 xi2计算了每个数据点距离均值(0)的距离的平方。
    c.计算这些平方的平均值(即方差 σ 2 \sigma^2 σ2): σ 2 = 1 n ∑ i = 1 n x i 2 \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2 σ2=n1i=1nxi2(即 x i 2 x_i^2 xi2求和后平均)

1 2 π σ 2 \frac{1}{\sqrt{2\pi\sigma^2}} 2πσ2 1:这是正态分布概率密度函数的前缀,其中 σ 2 \sigma^2 σ2是方差。它的作用是确保概率密度函数(PDF)的积分——也就是函数下整个面积等于1。在数学上,这意味着对于连续概率分布,确保所有概率值的总和为1。

exp: e e e是一个重要的数学常数(自然对数的底数),约等于2.71828,而exp是 e e e的幂。exp用于计算概率的指数部分,确保了大多数数据点都集中在平均值附近,而远离均值的数据点则呈指数级减少,就是让曲线呈“钟形曲线(高斯分布)”。

− ( ϵ ( i ) ) 2 2 σ 2 -\frac{(\epsilon^{(i)})^2}{2\sigma^2} 2σ2(ϵ(i))2:这是exp指数函数内的幂,代表了 ϵ ( i ) \epsilon^{(i)} ϵ(i)偏离均值0的程度。

  1. 由于我们假设误差项 ϵ \epsilon ϵ均值为0,所以这里直接用 ϵ ( i ) \epsilon^{(i)} ϵ(i)。这个比例的平方表示了误差项的值距离均值(0)的距离的平方,然后除以 2 σ 2 {2\sigma^2} 2σ2来“标准化”这个距离。在正态分布中,这个距离的平方越大,观测到该误差的概率就越低。
  2. 这个过程与误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)的值(第 i i i个数据点的误差项)的平方成正比,这里的平方是必要的,因为我们对误差的大小感兴趣,而不管它是正的还是负的。平方确保了所有的误差值都是非负的,且更大的误差(无论正负)都会产生更大的平方值。
  3. 与方差 σ 2 {\sigma^2} σ2的两倍成反比,这里 σ 2 {\sigma^2} σ2表示整个数据集中的误差项的分布宽度。方差的两倍是概率密度函数的标准组成部分,用于“标准化”误差项的平方,这样不同的分布(具有不同的方差)就可以使用相同的函数形式。这里的乘以 1 2 σ 2 \frac{1}{2\sigma^2} 2σ21类似于计算出“相对”值而不是“绝对”值,在不改变误差项的方向的情况下,调整它的相对重要性。主要作用是:由于不同的数据集可能有不同的方差(即不同的误差分布宽度),我们需要有一种方式来标准化这些误差,使它们可以在统一的尺度上比较。
  4. − 1 2 σ 2 -\frac{1}{2\sigma^2} 2σ21:这个负号和分母 2 σ 2 {2\sigma^2} 2σ2一起工作,形成一个比例因子,表示一个衰减的过程,它反映了误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)相对于方差的大小。由于是负指数,误差项的平方越大, e e e的幂就越小,从而降低了该误差值的概率密度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1287506.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

算法通关村第十三关-白银挑战数字与数学高频问题

大家好我是苏麟 , 今天带来数字与数学的高频问题 . 加一 描述 : 给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。 最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。 你可以假设除了整数 0 之外,这个…

D9741 应用于电视摄像机,笔记本电脑等产品中,3.6V ~ 35V 100mA 三极管驱动

D9741是一块脉宽调制方三用于也收路像机和笔记本电的等设备上的直流转换器。在便携式的仪器设备上。 主要特点:● 高精度基准电路 ● 定时闩锁、短路保护电路 ● 低电压输入时误操作保护电路 ● 输出基准电…

时间选择器

<el-form-item label"时间范围"><!-- <el-date-picker size"small"v-model"createTime"type"daterange"range-separator"至"start-placeholder"请输入起始创建时间"end-placeholder"请输入终止创…

【优选算法系列】【专题一双指针】第四节.15. 三数之和和18. 四数之和

文章目录 前言一、三数之和 1.1 题目描述 1.2 题目解析 1.2.1 算法原理 1.2.2 代码编写 1.2.3 题目总结二、四数之和 2.1 题目描述 2.2 题目解析 2.2.1 算法原理 2.2.2 代码编写 …

美股电动汽车股票分析:蔚来和Rivian这两只都遭受了重创的股票,哪个更值得投资?

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 Rivian(RIVN)和蔚来(NIO)都是目前美股市场上最受关注的电动汽车股票。虽然蔚来在全球最大的电动汽车市场中国扮演着重要角色&#xff0c;但Rivian也击败了很多传统汽车制造商&#xff0c;并成为了第一家在美国推出全电动皮…

Python爬虫完整代码模版——获取网页数据的艺术

Python爬虫完整代码模版——获取网页数据的艺术 在当今数字化世界中&#xff0c;数据是价值的源泉。如何从海量数据中提取所需信息&#xff0c;是每个数据科学家和开发者必须面对的问题。Python爬虫作为一种自动化工具&#xff0c;专门用于从网站上抓取数据。本文将提供一个Py…

Servlet作业1

1.【单选题】 (10分) &#xff08;B &#xff09;是一个用 Java 编写的程序&#xff0c;是一种实现了Servlet接口的类&#xff0c;它是由web容器负责创建并调用&#xff0c;在服务器容器上运行&#xff0c;用于接收和响应用户的请求。 A.Filter B.Servlet C.Request D.Res…

C语言之联合和枚举

C语言之联合和枚举 文章目录 C语言之联合和枚举1. 联合体1.1 联合体的声明1.2 联合体的特点1.3 结构体和联合体对比1.4 联合体大小的计算1.5 联合体小练习 2. 枚举2.1 枚举类型的声明2.2 枚举类型的优点2.3 枚举类型的使用 1. 联合体 1.1 联合体的声明 像结构体⼀样&#xff…

C/C++,组合算法——K人活动选择问题(Activity-Selection-Problem)的源程序

1 活动选择问题 Activity-Selection-Problem with k persons 给定两个大小为 N 的数组S[]和E[]表示商店的开始和结束时间&#xff0c;以及一个整数值 K 表示人数&#xff0c; 任务是找出如果他们基于以下条件最佳地访问每个商店&#xff0c;他们总共可以访问的商店的最大数量…

UEC++ 探索虚幻5笔记(捡金币案例) day12

吃金币案例 创建金币逻辑 之前的MyActor_One.cpp&#xff0c;直接添加几个资源拿着就用 //静态网格UPROPERTY(VisibleAnywhere, BlueprintReadOnly)class UStaticMeshComponent* StaticMesh;//球形碰撞体UPROPERTY(VisibleAnywhere, BlueprintReadWrite)class USphereCompone…

《Pandas1.x实例精解 》书籍分享

Pandas介绍 Pandas&#xff1a;Python数据分析的瑞士军刀 在数据科学、机器学习和人工智能日益繁荣的今天&#xff0c;有效、准确地处理和分析数据已经成为了成功的关键。Python&#xff0c;作为一种强大且易于学习的编程语言&#xff0c;已经在这一领域占据了重要的地位。而…

面试多线程八股文十问十答第三期

面试多线程八股文十问十答第三期 作者&#xff1a;程序员小白条&#xff0c;个人博客 相信看了本文后&#xff0c;对你的面试是有一定帮助的&#xff01; ⭐点赞⭐收藏⭐不迷路&#xff01;⭐ 1.介绍一下自旋锁 重量级锁竞争时&#xff0c;尝试获取锁的线程不会立即阻塞&…

Web自动化测试怎么做?Web网页测试全流程解析

1、功能测试 web网页测试中的功能测试&#xff0c;主要测试网页中的所有链接、数据库连接、用于在网页中提交或获取用户信息的表单、Cookie 测试等。 &#xff08;1&#xff09;查看所有链接&#xff1a; 测试从所有页面到被测特定域的传出链接。 测试所有内部链接。 测…

前后端分离vue+Nodejs社区志愿者招募管理系统

1、首页 1)滑动的社区照片册 使用轮播图&#xff0c;对社区的活动纪念与实时事件宣传。 每个图片附有文字链接&#xff0c;点击跳转对应社区要闻具体页。 2)社区公告栏 日常的社区公告以及系统说明在此区域中进行说明与展示。 2、志愿活动 1)志愿活动发布 想发布需要登录 2)志愿…

12.5_黑马数据结构与算法Java

目录 001 二分查找 算法描述 002 二分查找 算法实现 003 二分查找 问题1 循环条件 004 二分查找 问题2 中间索引 thinking&#xff1a;反码补码原码&#xff1f; thinking&#xff1a;二进制转十进制&#xff1f; thinking&#xff1a;无符号右移&#xff1f; 005 二分…

图像语义分割算法(FCN/U-net)

Some definitions &#xfeff; 与目标检测不同&#xff0c;语义分割任务不但要对图片中的物体的位置和类别进行预测&#xff0c;还要精确地描绘出不同类物体之间的边界&#xff08;注意是不同类物体&#xff0c;而不是不同物体。若对同一类的不同物体也进行区分&#xff0c;则…

【CentOS】配置 Apache 服务

yum install httpd -y# 查看是否安装成功 httpd -v # 出现版本号表示成功# 启动服务 systemctl start httpd# 查看状态 systemctl status httpd # running 即可成功 ● httpd.service - The Apache HTTP ServerLoaded: loaded (/usr/lib/systemd/system/httpd.service; disable…

Unity环境配置并解决visual studio 不能智能代码提示Unity代码问题(一)

1、请先安装好unity和Visual Studio 2019 2、Visual Studio需要安装如图&#xff08;2019才会有那个移动的可以勾选&#xff09; 3、Unity配置 file->build setting windows->package manager 安装如下图 edit->preferences 3、创建c#脚本 如果还是没能智能提…

JDBC简介及快速入门-黑马(P1)

黑马视频b站链接&#xff1a; 01-JDBC简介&快速入门_哔哩哔哩_bilibili &#x1f436;一、JDBC 简介 JDBC 概念&#xff1a; JDBC 就是使用 Java 语言操作关系型数据库的一套 API。 全称&#xff08;Java DataBase Connectivity&#xff09; Java 数据库连接 JDBC 本质…

佳易王会员管理软件店铺积分以及积分兑换系统

一、佳易王会员管理软件大众版 部分功能简介&#xff1a; 1、会员信息登记 &#xff1a;可以直接使用手机号登记&#xff0c;也可以使用实体卡片&#xff0c;推荐用手机号即可。 2、会员卡类型 &#xff1a;可以自由设置卡的类型&#xff0c;比如&#xff1a;充值卡、计次卡、…