【Python】Numpy分布函数总结

news2025/3/10 15:15:20

文章目录

    • 总表
    • 均匀分布和三角分布
    • 幂分布
    • 与正态分布相关的分布
    • 与Gamma相关的分布
    • 极值分布

总表

np.random中提供了一系列的分布函数,用以生成符合某种分布的随机数。下表中,如未作特殊说明,均有一个size参数,用以描述生成数组的尺寸。

这些分布函数会频繁的使用 Γ \Gamma Γ函数,其定义为

Γ ( x ) = ∫ 0 − ∞ t x − 1 d − t d t \Gamma(x)=\int_0^{-\infty}t^{x-1}d^{-t}\text dt Γ(x)=0tx1dtdt

x x x为整数时, Γ ( x ) = x ! \Gamma(x)=x! Γ(x)=x!

符号 ( n N ) \binom{n}{N} (Nn)为组合符号,用 Γ \Gamma Γ函数表示为

( n N ) = Γ ( N ) Γ ( N − n ) Γ ( n ) \binom{n}{N}=\frac{\Gamma(N)}{\Gamma(N-n)\Gamma(n)} (Nn)=Γ(Nn)Γ(n)Γ(N)

函数概率密度函数(PDF)备注
binomial(n, p) p ( N ) = ( n N ) p N ( 1 − p ) n − N p(N) = \binom{n}{N}p^N(1-p)^{n-N} p(N)=(Nn)pN(1p)nN二项分布
multinomial(n, pvals)多项分布
geometric§ f ( n ) = ( 1 − p ) n − 1 p f(n)=(1-p)^{n-1}p f(n)=(1p)n1p几何分布
negative_binomial(n, p) p ( N ) = Γ ( N + n ) N ! Γ ( n ) p n ( 1 − p ) N p(N)=\frac{\Gamma(N+n)}{N!\Gamma(n)}p^n(1-p)^N p(N)=N!Γ(n)Γ(N+n)pn(1p)N负二项分布
poisson([lam]) f ( k ) = λ k e − λ k ! f(k)=\frac{\lambda^ke^{-\lambda}}{k!} f(k)=k!λkeλ泊松分布
logseries§ p ( k ) = − p k k ln ⁡ ( 1 − p ) p(k)=\frac{-p^k}{k\ln(1-p)} p(k)=kln(1p)pk对数级数分布
gamma(shape[, scale]) p ( x ) = x k − 1 e − x / θ θ k Γ ( k ) p(x)=x^{k-1}\frac{e^{-x/\theta}}{\theta^k\Gamma(k)} p(x)=xk1θkΓ(k)ex/θ伽马分布
beta(a, b) Γ ( a + b ) Γ ( a ) Γ ( b ) x a − 1 ( 1 − x ) b − 1 \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)}x^{a-1}(1-x)^{b-1} Γ(a)Γ(b)Γ(a+b)xa1(1x)b1贝塔分布
dirichlet(alpha) p ( x ) = ∏ i = 1 k x i α i − 1 p(x)=\prod_{i=1}^kx_i^{\alpha_i-1} p(x)=i=1kxiαi1狄利克雷分布
logistic([loc, scale]) p ( x ) = ( x − μ ) / s s ( 1 + exp ⁡ [ − ( x − μ ) / s ] ) 2 p(x)=\frac{(x-\mu)/s}{s(1+\exp[-(x-\mu)/s])^2} p(x)=s(1+exp[(xμ)/s])2(xμ)/sLogistic分布
triangular(L, M, R)三角形分布
uniform([low, high]) p ( x ) = 1 b − a p(x)=\frac{1}{b-a} p(x)=ba1均匀分布
vonmises(mu, kappa) p ( x ) = exp ⁡ [ κ ( x − μ ) ] 2 π I 0 ( κ ) p(x)=\frac{\exp[{\kappa(x-\mu)}]}{2\pi I_0(\kappa)} p(x)=2πI0(κ)exp[κ(xμ)]von Mises分布
zipf(a) p ( k ) = k − a ζ ( a ) p(k)=\frac{k^{-a}}{\zeta(a)} p(k)=ζ(a)ka齐普夫分布
pareto(a) p ( x ) = m a x a p(x)=\frac{m^a}{x^{a}} p(x)=xama帕累托分布
power(a) p ( x ) = a x a − 1 p(x)=ax^{a-1} p(x)=axa1幂分布
gumbel([loc, scale]) exp ⁡ [ − z − e − z ] , z = x − μ λ \exp[{-z-e^{-z}}], z=\frac{x-\mu}{\lambda} exp[zez],z=λxμ耿贝尔分布
chisquare(df) ( 1 / 2 ) k / 2 Γ ( k / 2 ) x k / 2 − 1 e − x / 2 \frac{(1/2)^{k/2}}{\Gamma(k/2)}x^{k/2-1}e^{-x/2} Γ(k/2)(1/2)k/2xk/21ex/2卡方分布
f(dfnum, dfden)F分布
noncentral_chisquare非中心卡方分布
noncentral_f非中心F分布
hypergeometric p ( x ) = ( g x ) ( b n − x ) ( g + b n ) p(x)=\frac{\binom{g}{x}\binom{b}{n-x}}{\binom{g+b}{n}} p(x)=(ng+b)(xg)(nxb)超几何分布

loc一般在函数中为 μ \mu μ, scale λ \lambda λ k k k等。

I 0 I_0 I0为0阶Bessel函数。

上表中,有一些概率密度表达式过于复杂,故而未列入表中。

首先,numpy提供了五种标准分布

概率密度表达式
standard_cauchy()标准柯西分布 P ( x ) = 1 π ( 1 + x 2 ) P(x)=\frac{1}{\pi(1+x^2)} P(x)=π(1+x2)1
standard_exponential()标准指数分布 P ( x ) = e − x P(x)=e^{-x} P(x)=ex
standard_gamma(k)标准伽马分布 P ( x ) = x k − 1 e − x Γ ( k ) P(x)=x^{k-1}\frac{e^{-x}}{\Gamma(k)} P(x)=xk1Γ(k)ex
standard_normal()标准正态分布 P ( x ) = e − x 2 P(x) = e^{-x^2} P(x)=ex2
standard_t(df)标准学生分布

详情可见Numpy中提供的五种标准随机分布详解

均匀分布和三角分布

所谓均匀分布,就是在事件空间中,所有事件的概率都是相等的连续分布,是最简单的分布函数,在 ( a , b ) (a,b) (a,b)区间内,所有点差不多构成了一个矩形,所以均匀分布也叫矩形分布;和矩形分布相似,概率密度函数为三角形的分布,就是三角形分布。

Python均匀分布和三角形分布

幂分布

幂分布的形式是非常简单的,其概率密度函数为 p ( x ) = a x a − 1 p(x)=ax^{a-1} p(x)=axa1,在Python中,除了幂分布之外,还提供了另外两种幂分布,记帕累托分布和奇普夫分布。

帕累托在1906年提出了有关意大利社会财富分配的分配规律,即20%的人口掌握了80%的财富,这个规律后来被发现十分普遍,以至于约瑟夫·朱兰后来将其称为帕累托法则,也被成为八二法则。

美国学者Zipf在研究词频的时候发现,如果统计一篇较长文章中的词频,并将词频按照高低从前向后依次排列,将频次最高的词记为1、次高的词记为2,依次类推,最后使用频率最低的词为N。若用f表示频次,r表示等级序号,则fr是常数,此即Zipf定律。

Python幂分布

与正态分布相关的分布

正态分布,最早由棣莫弗在二项分布的渐近公式中得到,而真正奠定正态分布地位的,却是高斯对测量误差的研究。测量是人类与自然界交互中必不可少的环节,测量误差的普遍性,确立了正态分布作用范围的广泛性,或许正因如此,正态分布才又被称为Gauss分布。

Python生成正态分布的随机数

k k k个互相独立的随机变量 ξ 1 , ξ 2 , ⋯   , ξ k \xi_1, \xi_2,\cdots,\xi_k ξ1,ξ2,,ξk,均服从标准正态分布,则这k个随机变量的平方和构成一个新变量,新变量服从 χ 2 \chi^2 χ2分布。

Python卡方分布

与Gamma相关的分布

在我的印象中,二项分布貌似是高中学到的第一个分布,就算不是第一个,也是第一批。所以从理解上来说是不存在困难的,在 N N N次独立重复的伯努利试验中,设A在每次实验中发生的概率均为 p p p。则 N N N次试验后A发生 k k k次的概率分布,就是二项分布。

从二项分布到泊松分布

多项分布是对二项分布的一个自然的推广。

二项分布最常见的案例就是投硬币,那么投掷硬币可能有两个结果产生,所以谓之二项;如果把硬币改成骰子,由于骰子有6个面,相当于每次对应六个可能发生的结果,从而可以谓之六项分布。总而言之,把一个总体按照某种属性分成有限个类的时候,就会涉及到多项分布

Python生成多项分布随机数


Poisson分布指的是,单个事件在某一刻发生的概率。Gamma分布更进一步,指的是某个事件在某个时刻发生第 n n n次的概率。

【Python】Gamma分布详解

投硬币,硬币是正还是反,这属于两点分布的问题。

疯狂投硬币,正面出现的次数,服从二项分布

二项分布中,若特定时间内的伯努利试验次数趋于无穷大,那么在某一时刻发生某事件的概率,服从泊松分布

在某一时刻,发生第N次事件,其概率服从 Γ \Gamma Γ分布。

回到抛硬币的问题,如果硬币出现正反的概率是未知的,考虑到时间地点重力等因素的不同,硬币出现正面的概率甚至可能是不稳定的,换言之,硬币出现正面的概率,或许也是服从某种分布的,此即Beta分布

【Python】Beta分布详解

极值分布

X 1 , X 2 … , X n X_1,X_2\dots,X_n X1,X2,Xn为从总体 F F F中抽出的独立同分布样本,且

M = max ⁡ ( X 1 , … , X n ) , m = min ⁡ ( X 1 , … , X n ) M=\max(X_1,\dots,X_n), m=\min(X_1,\dots,X_n) M=max(X1,,Xn),m=min(X1,,Xn)

若存在 C n > 0 C_n>0 Cn>0 D n D_n Dn,使得 C n M + D n C_nM+D_n CnM+Dn按分布收敛于 G ( x ) G(x) G(x),则此 G ( x ) G(x) G(x)为极大值分布,同理可定义极小值分布。Fisher和Tippett证明了极值分布只有三种形式,分别是

I型 G 1 ( x ) = exp ⁡ ( − e − x ) G_1(x)=\exp(-e^{-x}) G1(x)=exp(ex)Gumbel分布
II型 G 2 ( x ) = exp ⁡ ( − x − α ) , x > 0 , α > 0 G_2(x)=\exp(-x^{-\alpha}), x>0, \alpha>0 G2(x)=exp(xα),x>0,α>0Fréchet分布
III型 G 3 ( x ) = exp ⁡ ( − ( − x ) α ) , x < 0 , α > 0 G_3(x)=\exp(-(-x)^\alpha), x<0, \alpha>0 G3(x)=exp((x)α),x<0,α>0Weibull分布

Numpy中的Gumbel分布和Logistic分布

Python威布尔分布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/116892.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【综合笔试题】难度 1.5/5,常规二叉树爆搜题

题目描述 这是 LeetCode 上的 95. 不同的二叉搜索树 II &#xff0c;难度为 中等。 Tag : 「树」、「二叉搜索树」、「BST」、「DFS」、「递归」、「爆搜」 给你一个整数 n&#xff0c;请你生成并返回所有由 n 个节点组成且节点值从 1 到 n 互不相同的不同 二叉搜索树 。可以…

2022出圈的ML研究:爆火的Stable Diffusion、通才智能体Gato,LeCun转推

这些机器学习领域的研究你都读过吗&#xff1f; 2022 年即将步入尾声。在这一年里&#xff0c;机器学习领域涌现出了大量有价值的论文&#xff0c;对机器学习社区产生了深远的影响。 今日&#xff0c;ML & NLP 研究者、Meta AI 技术产品营销经理、DAIR.AI 创始人 Elvis S.…

CSRF漏洞渗透与攻防(一)

目录 前言 什么是CSRF漏洞 CSRF实现流程 CSRF漏洞危害 XSS漏洞危害 CSRF与XSS区别 CSRF分类 GET型&#xff1a; POST型&#xff1a; CSRF漏洞案列模拟 CSRF常用Payload&#xff1a; CSRF漏洞挖掘 检测工具 CSRF漏洞防御 防御思路 我们该如何去防御CSRF漏洞…

LeetCode动态规划—打家劫舍从平板板到转圈圈(198、213)

打家劫舍平板板打家劫舍转圈圈打家劫舍&#xff08;进阶版&#xff09;平板板打家劫舍 转化子问题&#xff1a; 按顺序偷n间房子&#xff0c;就是考虑偷前n-1间房子还是偷前n-2间房子再偷第n间房子。 列出公式&#xff1a; res[n] max{ res[n-1] , 数组中最后一个数据res[n-…

企业信息化之源代码防泄密场景分析

场景描述 随着企业信息化发展迅速&#xff0c;越来越多的无形资产面临着被泄露&#xff0c;被盗取的&#xff0c;或员工无意导致的数据泄密风险。尤其是有源码开发的企业&#xff0c;源代码的安全更是重中之重&#xff0c;一旦泄密&#xff0c;有可能给企业带来不可估量的损失…

全程数字化的企业电子招标采购管理系统源码

全程数字化的采购管理 智能化平台化电子化内外协同 明理满足采购业务全程数字化&#xff0c; 实现供应商管理、采购需求、全网寻源、全网比价、电子招 投标、合同订单执行的全过程管理。 传统采购模式面临的挑战 如何以最合适的价格,找到最优的供应商,购买到最好的产品和服务?…

程序员必备网站,建议收藏!

俗话说的好&#xff0c;一个程序员&#xff0c;20%靠知识储备&#xff0c;80%靠网络搜索。 打开代码&#xff0c;打开Google&#xff0c;开始工作。 那么常用的写码软件&#xff0c;你知道几个呢&#xff1f; 下面我们来一起看一下常用的写码软件吧~ 建议收藏本文&#xff…

【算法】面试题 - 链表

链表相关面试题141. 环形链表问题&#xff1a;快慢指针为什么一定会相遇142. 环形链表 II问题&#xff1a;如何确认入口160. 相交链表237. 删除链表中的节点19. 删除链表的倒数第 N 个结点21. 合并两个有序链表23. 合并K个升序链表&#xff08;两种解法&#xff09;扩展&#x…

国产手机扬眉吐气,终于打击了苹果的嚣张气焰

苹果在9月份、10月份都取得了快速增长&#xff0c;而国产手机品牌持续下滑&#xff0c;但是11月份终于让国产手机捡回了主动权&#xff0c;11月份的数据显示有国产手机品牌的出货量大幅增长&#xff0c;而苹果的出货量却大幅下滑&#xff0c;国产手机成功反击了苹果。分析机构给…

Vue + SpreadJS 实现高性能数据展示与分析

Vue SpreadJS 实现高性能数据展示与分析 在前端开发领域&#xff0c;表格一直都是一个高频使用的组件&#xff0c;尤其是在中后台和数据分析场景下。但当一屏展示数据超过1000条数据记录时&#xff0c;会出现浏览器卡顿等问题&#xff0c;严重影响客户体验。为解决这些性能问…

Seay代码审计系统审计实战

今天继续给大家介绍渗透测试相关知识&#xff0c;本文主要内容是Seay代码审计系统审计实战。 免责声明&#xff1a; 本文所介绍的内容仅做学习交流使用&#xff0c;严禁利用文中技术进行非法行为&#xff0c;否则造成一切严重后果自负&#xff01; 再次强调&#xff1a;严禁对未…

【算法题解】5. 删除有序数组中的重复项 + 移动零

文章目录删除有序数组中的重复项题目解题思路代码实现复杂度分析移动零题目解题思路代码实现复杂度分析删除有序数组中的重复项 题目 给你一个 升序排列 的数组 nums &#xff0c;请你原地删除重复出现的元素&#xff0c;使每个元素只出现一次 &#xff0c;返回删除后数组的新…

Python 并发编程实战,用多线程、多进程、多协程加速程序运行

Python 并发编程实战&#xff0c;用多线程、多进程、多协程加速程序运行 文章目录Python 并发编程实战&#xff0c;用多线程、多进程、多协程加速程序运行1、什么是CPU密集型计算、IO密集型计算&#xff1f;2、多线程、多进程、多协程的对比3、怎么根据任务选择对应技术&#x…

达梦数据成功过会!信创浪潮中如何成就一家国产龙头?

‍‍数据智能产业创新服务媒体——聚焦数智 改变商业2022年12月22日&#xff0c;上海证券交易所科创板上市委员会发布《2022年第110次审议会议结果公告》&#xff0c;武汉达梦数据股份有限公司&#xff08;首发&#xff09;符合发行条件、上市条件和信息披露要求。该公告标志着…

5.4 迭代语句

文章目录while语句使用while循环传统for语句传统for循环的执行过程for语句头中的多重定义省略for语句头的某些部分范围for语句do while语句迭代语句通常称为循环,它重复执行操作直到满足某个条件才停下来。while和for语句在执行循环体之前检查条件&#xff0c;do while 语句先执…

MATLAB算法实战应用案例精讲-【连接分析】PageRank(补充篇)(附Python代码实现)

前言 PageRank算法在1998年4月举行的第七届国际万维网大会上由Sergey Brin和Larry Page提出。PageRank是通过计算页面链接的数量和质量来确定网站重要性的粗略估计。算法创立之初的目的是应用在Google的搜索引擎中,对网站进行排名。 随着国内外学者的深入研究,PageRank算法…

burpsuite靶场——SSRF

文章目录针对本地服务器的基本 SSRF针对另一个后端系统的基本 SSRFSSRF 与基于黑名单的输入过滤器基于白名单的输入过滤器的 SSRFSSRF 通过开放重定向漏洞绕过过滤器带外检测的盲 SSRF利用 Shellshock 的盲 SSRF针对本地服务器的基本 SSRF 在商品下查看货物库存情况时抓包 有st…

操作系统实验2:fork()系统调用

操作系统实验2:fork()系统调用 文章目录操作系统实验2:fork()系统调用Task1: fork的基本使用代码运行结果解释Task2: 深入理解fork创建的子进程与父进程的关系代码实验结果现象解释遇到的问题1.乌龙事件 vscode2.the troubles encountered in task1如何跑.sh文件编译链接遇到的…

SegeX Progress:MFC通用进度条

----哆啦刘小洋 原创&#xff0c;转载需说明出处 MFC高级通用进度条-目录1 简介2 进度条实现基本原理3 使用方法3 .1 简单情况3.2 两个前后独立的进度条3.3 实际应用的一般情况3.4 带子进度条4 其他4.1 使用限制4.2 其他全局宏&#xff08;函数&#xff09;4.3 当前进度条设置1…

技术开发107

技术开发107 业务内容&#xff1a; 汽车音响等汽车电子部件试制、电子设备部件试制、精密钣金试制精密钣金试制 公司简介&#xff1a; 代表&#xff1a;中山尚美 成立时间&#xff1a;1950年6月 资本金&#xff1a;1000万日元 员工数&#xff1a;15名 资格认证&#xff…