概率与常见的概率分布

news2025/1/17 6:06:34

        概率是数据分析、机器学习中最基础的知识。也是在生活中最实用的一门学科,学了很多大道理不一定能过好一生,学好概率则有一定概率会变得更好。为大概率坚持,为小概率备份。

概率与分布

    要想了解概率,首先得搞清楚概率和概率分布的问题

1.概率是什么?

    定义:概率反映的是一个事件发生可能性的大小。概率将“可能性”量化了。

2.概率分布是什么?

    定义:用于表述随机变量取值的概率规律。简而言之就是随机变量分布的规律。

3.概率与分布有什么关系?

    概率和分布之间存在密切关系。概率是分布的具体取值,而分布是对随机变量在不同取值上的概率进行建模。这两者相辅相成,共同构建了对不确定性的数学描述。

    例如:下图是一个正态分布,红点是表示在这个分布中,为x的概率,黄色的区域表示在这个分布中x属于这个黄色区域内的概率

图片

常见的概率分布

    在搞清楚概率分布之前我们还得先了解随机变量

什么是随机变量?

    定义:表示随机试验各种结果的实值单值函数。是不是很晕,比文言文还难懂,其实简单的理解:随着随机试验的结果变化而变化的变量,叫做随机变量

    比如抛骰子实验,观察点数,设抛出的点数结果为X,则X有6种可能的结果,而且每次出现的点数,都是随机性的,那么这样的变量叫做随机变量。

    随机变量分为离散型随机变量与非离散型随机变量两种。

离散型:变量的取值个数是有限的,可数的。

    例如抛硬币,有正反两种可能;抛骰子有6中可能等,都是可数的。

非离散型:变量的取值个数无限,取值范围为全体实数。非离散型中可以分为连续性(绝大部分)和混合型

例如:长度、速度、重量、体积、温度、力量等。这些都有无限个值,无法列举。

发现没有,这些变量都是一种度量

离散概率分布

伯努利分布(Bernoulli Distribution)

    伯努利分布是描述只有两个可能结果的随机试验,如硬币的正反面。

如果投一枚硬币,正面为1,反面为0。概率质量函数为 P(x=1) =p, P(x=0)=1-p

二项分布(Binomial Distribution)

    描述多次独立伯努利试验的概率。也就是说在n次试验中正好得到k次成功的概率。

如果逆向看伯努利分布就是n=1的二项分布。

那么实验了n次,有k次成功,就意味着有n-k次失败。

成功的概率为p,失败的概率为1-p

注意这里是不管实验结果的顺序的,不论是第几次成功或失败都没影响,只管最终成功和失败的次数,就很自然的使用了排列组合里面的组合C。

二项分布的概率公式则描述为

图片

多项分布(Multinomial Distribution)

    是二项分布的推广,二项分布描述的是实验结果只有两种的分布。多项分布则是描述实验结果有多种可能的分布。例如骰子的6种可能。

某随机实验如果有k个可能结果A1、A2、…、Ak,分别将他们的出现次数记为随机变量X1、X2、…、Xk,它们的概率分布分别是p1,p2,…,pk,那么在n次采样的总结果中,A1出现n1次、A2出现n2次、…、Ak出现nk次的这种事件的出现概率P有下面公式:

图片

连续概率分布

正态分布(Normal Distribution)

    又称为高斯分布(Gaussian distribution),是统计学中最常见的一种分布,正态分布曲线两头低,中间高,左右对称,因图形像大钟,因此又称为钟形曲线。

图片

正态分布的密度函数

式中μ为均值;σ是标准差;π为圆周率≈3.1415926;e为自然常数≈2.71828

这个公式中主要关注均值 μ 和标准差 σ,均值 μ 决定分布度的偏度

图片

均值 μ决定了曲线横轴的位置,μ增大曲线向横轴右移;μ减小曲线向横轴左移。

图片

标准差σ决定曲线的宽度和高度,σ越大,曲线越宽越平坦(矮胖),表明数据越分散,反之亦然。

指数分布(Exponential Distribution)
 

    用于描述独立随机时间发生的时间间隔或间隔事件的概率分布,在可靠性分析和排队论中比较常见,其中在排队论中指数分布常用于描述服务时间。例如等待公交车进站的时间间隔。

图片

指数分布密度函数

图片

指数分布图

均匀分布(Uniform Distribution)

    均匀分布在区间内所有取值的概率都相等,因为图形是一个矩形,所以也叫矩形分布,均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值。密度函数非常简单 f(x) = 1/ (b-a)

图片

泊松分布(Poisson distribution)

    主要用于估计在特定时间段或空间中某事件发生的次数,例如一小时内到达店里的人数。满足以下两个性质,则水机变量服从泊松分布

  1.  在任意两个相等长度的区间上,事件发生的概率相等。

  2. 事件在某一区间上是否发生与事件在其他区间上是否发生是相互独立的。

    图片

k表示事件在一个区间发生k次的概率;λ表示事件在一个区间发生次数的数学期望或均值;其中λ越大越接近于正态分布,当λ=50时,可以认为泊松分布呈现正态分布了。

图片

而且泊松分布是由二项分布推导而来,当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧20,p≦0.05时,二项分布就可以用泊松公式近似的计算。

除此之外还有一些正态分布相关的分布

例如:

卡方分布(Chi-Square Distribution)用于描述多个相互独立标准正态分布的随机变量的平方和,有几个数就是服从自由度为几的卡方分布,自由度越大,越接近于正态分布。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1513350.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

「飞桨星河社区创作者激励计划」全新上线!丰富权益,等你领取~

为了助力更多的创作者实现在飞桨星河社区的成长,同时鼓励创作者们积极投入,记录创作者们的高光时刻,重磅推出**「创作者成长体系」,同时推出「每周精选&月度榜单」**活动,期待你一同加入精彩纷呈的AI学习与创作之旅…

学成在线_课程预览-视频播放测试_视频加载出错

问题 在进行课程预览界面的视频播放测试时界面提示视频加载出错。 如图所示JAVA特性讲解的第一小节视频加载出错。 查看课程计划会发现该小节已经进行了视频关联。 问题原因 此课程小节的关联视频在我们自己的minIO的桶中并不存在。所以前端从数据库中拿到的关联视频url是…

AI情报专刊来啦!《“AI换脸”威胁研究与安全策略》

目录 “AI换脸”常见的诈骗套路 1、伪造账号造谣传谣 2、冒充熟人进行诈骗 3、伪造身份申请银行贷款 4、“网络钓鱼”更加难以识别 5、冒充他人远程面试入职 6、冒名登录盗走银行余额 “AI换脸”的产业链 “AI换脸”使用到的技术 人脸识别和关键点检测 图像/视频合成技术 生成对…

【兔子机器人】修改GO、车轮电机ID(软件方法、硬件方法)以及修正VMC腿部初始化夹角

一、GO电机修改ID 1、硬件方法 利用上位机直接修改GO电机的id号: 打开调试助手,点击“调试”,查询电机,修改id号,即可。 但先将四个GO电机连接线拔掉,不然会将连接的电机一并修改。 利用24V电源给GO电机…

Redis命名设计

可读性和管理性 以项目名为前缀(防止key冲突),用冒号分隔,比如项目名:表名:id zh(知乎):news_data(新闻数据):2(主键id) zh:news_data:2 精简性 key的命名,尽量精简,key的名字长度对内存的占用不可忽视,我们来实际…

成都产业园排名出炉!金牛区这个园区成数字产业聚集地

近日,成都产业园排名榜单正式发布,可以看出金牛区成数字产业聚集地,其中,备受瞩目的国际数字影像产业园荣登榜首。这一排名不仅彰显了国际数字影像产业园在数字产业领域的卓越表现,更凸显了成都作为西部重要城市在科技…

Redis及其常用命令(二)

SortedSet类型 在此类型中,每个元素都有一个分数 key -> string value -> sorted([socre,member],[score,member]...) # 添加元素 zadd key score member # 遍历集合 zrange key start stop [withscores] #升序 zrevrange key start stop [withscores]#降序…

如何“使用Docker安装compose,在CentOS7”?

1、下载地址 Releases docker/compose GitHub 2、下载好,上传服务器 3、 4、拷贝到/usr/local/bin/docker-compose目录下 cp docker-compose-linux-x86_64 /usr/local/bin/docker-compose 5、变更权限 chmod x /usr/local/bin/docker-compose 6、启动 docker…

像SpringBoot一样使用Flask - 3.蓝图路由Blueprint

接上一篇文章《像SpringBoot一样使用Flask - 2.静态资源访问及模版》,我们看到测试的"controller"都写在了一起🤔 如何像Springboot一样划分出一个完整的controller,里面实现不同业务的包呢? 本篇引入Blueprint&#xf…

深入解析Condition的底层实现原理

一、原理概述 在AQS中,存在两个FIFO队列:同步队列和等待队列。等待队列是由Condition内部实现的,是一个虚拟的FIFO单向队列。 释义: AQS中tali和head主要构成了一个FIFO双向的同步队列,AQS中Condition构成了一个FIFO…

腾讯云轻量应用服务器地域如何选择?

腾讯云轻量应用服务器地域如何选择?地域就近选择,北方选北京地域、南方选广州地域,华东地区选上海地域。广州上海北京地域有什么区别?哪个好?区别就是城市地理位置不同,其他的差不多,不区分好坏…

gif动图怎么从视频中提取?一个方法操作简单

我们在日常上网时,会看到各种各样的gif动态图片。很多都是由当下大火的电影、电视剧中的画面制作的,这些gif动图非常的生动形象。相比视频、电影,gif动图的文件体积要小很多,方便传播。那么,如何从视频中提取gif动画呢…

短视频解析接口分发系统,附带系统搭建教程

搭建教程 宝塔面板:Nginx系统 php7.2 Mysql 5.6-5.7 伪静态Thinkphp 上传文件直接访问域名安装即可 解析接口推荐:ce.qsy.mobi 源码免费下载地址抄笔记

brew安装node和nvm切换和管理node版本

Homebrew是一款Mac OS平台下的软件包管理工具,拥有安装、卸载、更新、查看、搜索等很多实用的功能。简单的一条指令,就可以实现包管理,而不用你关心各种依赖和文件路径的情况,十分方便快捷。简单来说,Homebrew提供 App…

OPC UA 服务器的Web访问

基于Web 的应用非常普及,例如基于web 的SCADA ,物联网 Dashboard 等等,那么基于Web 的应用如何访问OPC UA 服务器呢?本博文讨论这方面的问题。 Web 的通信方式 Web 是我们通常讲的网站,它由浏览器,HTTP 服…

什么是工业数采网关?如何远程数采?

随着工业自动化的不断发展,数据采集与远程控制成为了生产过程中不可或缺的一环。而工业数采网关,作为连接工业设备与上位管理系统之间的桥梁,扮演着越来越重要的角色。HiWoo Box 作为一款优秀的工业数采网关产品,为 PLC、传感器、…

luatos框架中LVGL如何使用中文字体〈二〉编写脚本设置中文字体

本节内容,将和大家一同学习,在luatos环境中,使用lvgl库,一步步的编译固件、编写脚本,最终实现中文字体的显示。 芯片:AIR101 LCD屏:ST7789 上一节,我们一同学习了,硬件引…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:Text)

显示一段文本的组件。 说明: 该组件从API Version 7开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 子组件 可以包含Span和ImageSpan子组件。 接口 Text(content?: string | Resource, value?: TextOptions) 从API versi…

Python测试框架pytest(28)测试报告Allure - 动态生成标题、动态生成功能、报告添加用例失败截图

一、动态生成标题 默认 allure 报告上的测试用例标题不设置就是用例名称,其可读性不高;当结合 pytest.mark.parametrize 参数化完成数据驱动时,如标题写死,其可读性也不高。 那如果希望标题可以动态的生成,采取的方案…

大型文物三维扫描抄数服务3d建模造型设计逆向贴图等比例制作仿制

大型文物三维扫描数字化建模是一项前沿的技术,它运用高精度的扫描设备,将文物的三维形态精确地捕捉下来,再通过专业的建模软件,将这些数据转化为数字化的三维模型。这一技术的出现,不仅极大地提升了文物保护的效率和精…