【初识扫盲】厚尾分布

news2025/1/16 2:42:05

厚尾分布(Fat-tailed distribution)是一种概率分布,其尾部比正态分布更“厚”,即尾部的概率密度更大,极端值出现的概率更高。

一、厚尾分布的特征

  1. 尾部概率大

    • 在正态分布中,极端值(如距离均值很远的值)出现的概率非常小。例如,对于一个标准正态分布(均值为0,标准差为1),数据落在距离均值3个标准差之外的概率约为0.27%。然而,在厚尾分布中,这种极端值出现的概率要大得多。以柯西分布(一种典型的厚尾分布)为例,它没有定义方差,其尾部的概率密度衰减速度比正态分布慢很多。在柯西分布中,数据落在距离“中心位置”(类似正态分布的均值)较远区域的概率显著高于正态分布。这就意味着在厚尾分布中,出现极端异常值的可能性更大。
  2. 峰度高

    • 峰度是衡量分布形状的一个指标,它反映了分布的尖峭程度和尾部的厚重程度。厚尾分布通常具有较高的峰度。正态分布的峰度为0(以它为基准),而厚尾分布的峰度大于0。高峰度意味着分布的中间部分(峰部)更尖,同时尾部更厚。例如,学生t分布(自由度较小时)是一种厚尾分布,当自由度较小时,它的峰度比正态分布高,这使得它在描述一些金融资产收益率等数据时,能更好地捕捉到极端波动的情况。
  3. 均值和方差的特性

    • 对于一些厚尾分布,其均值和方差可能不存在或者不具有实际意义。以柯西分布为例,它的均值和方差都是未定义的。这是因为其尾部太厚,极端值对均值和方差的计算影响过大,导致这些统计量无法收敛到一个有限的值。这与正态分布等轻尾分布不同,正态分布的均值和方差都是良好定义的,且具有实际的统计意义,可以很好地描述数据的集中趋势和离散程度。

二、厚尾分布的应用场景

  1. 金融领域
    • 在金融市场中,资产价格的波动往往不符合正态分布。例如,股票价格的收益率分布通常具有厚尾特征。这是因为股票市场会受到各种突发事件(如政治动荡、公司丑闻等)的影响,导致价格出现极端的上涨或下跌。厚尾分布能够更好地描述这种极端波动的情况。像学生t分布就被广泛用于金融风险建模,如在计算投资组合的风险价值(Value at Risk,VaR)时,使用厚尾分布可以更准确地估计极端市场情况下投资组合可能遭受的损失。
  2. 保险领域
    • 保险理赔金额的分布也常常是厚尾的。因为虽然大部分理赔金额可能比较小(如一些小额的财产损失),但是偶尔会出现一些巨额的理赔,如自然灾害导致的大规模财产损失。厚尾分布能够更合理地反映这种理赔金额分布的特点,帮助保险公司更准确地评估风险和制定保险费率。例如,帕累托分布是一种厚尾分布,它在描述大额保险理赔数据时效果很好,能够更好地捕捉到大额理赔出现的概率,从而为保险公司的风险管理和定价提供依据。
  3. 网络流量分析
    • 网络流量数据也呈现出厚尾分布的特性。大部分时间网络流量可能处于较低水平,但是偶尔会出现流量的突发高峰,如大型在线活动期间。厚尾分布可以用来建模这种网络流量的波动情况,有助于网络运营商更好地规划网络资源,应对可能出现的流量高峰,避免网络拥堵等问题。
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import t, norm

# 设置自由度
df = 3

# 生成x值,这里从-5到5,共100个点
x = np.linspace(-5, 5, 100)

# 计算学生t分布的概率密度函数值
y_t = t.pdf(x, df)

# 计算正态分布的概率密度函数值,均值为0,标准差为1
y_norm = norm.pdf(x, 0, 1)

# 绘制学生t分布图像
plt.plot(x, y_t, label=f"Student's t distribution (df={df})", color='blue')

# 绘制正态分布图像
plt.plot(x, y_norm, label="Normal distribution (mean=0, std=1)", color='red', linestyle='--')

# 添加标题和标签
plt.title("Comparison of Student's t Distribution and Normal Distribution")
plt.xlabel("x")
plt.ylabel("Probability Density")

# 添加图例
plt.legend()

# 显示图像
plt.show()

在这段代码中,我们增加了对正态分布的计算和绘制。使用scipy.stats中的norm模块来计算正态分布的概率密度函数值,这里设置正态分布的均值为0,标准差为1,这是标准正态分布的参数。

  • 图像对比分析
    • 尾部:在图像的两端(尾部),学生t分布(蓝色曲线)的概率密度明显高于正态分布(红色虚线)。这表明在学生t分布中,极端值(距离中心位置较远的值)出现的概率更大,这就是厚尾分布的典型特征。
    • 峰部:在图像的中间部分(峰部),学生t分布的峰值相对较低,而正态分布的峰值较高。这说明正态分布的数据更集中于均值附近,而学生t分布的数据分布相对更分散,这也是厚尾分布与轻尾分布在数据集中趋势描述上的差异。
    • 整体形状:从整体形状上看,学生t分布的曲线更“丰满”,尾部更“肥厚”,而正态分布的曲线更“瘦高”,尾部迅速衰减。这种形状差异直观地反映了两种分布在描述数据极端波动能力上的不同,厚尾分布更适合描述那些极端波动较为频繁的数据,如金融资产收益率等。

在这里插入图片描述

下面是一个绘制柯西分布和正态分布对比图的代码示例:

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import cauchy, norm

# 生成x值,这里从-10到10,共400个点
x = np.linspace(-10, 10, 400)

# 计算标准柯西分布的概率密度函数值
y_cauchy = cauchy.pdf(x, loc=0, scale=1)

# 计算标准正态分布的概率密度函数值
y_norm = norm.pdf(x, loc=0, scale=1)

# 绘制柯西分布图像
plt.plot(x, y_cauchy, label='Cauchy Distribution', color='blue')

# 绘制正态分布图像
plt.plot(x, y_norm, label='Normal Distribution', color='red', linestyle='--')

# 添加标题和标签
plt.title('Comparison of Cauchy and Normal Distributions')
plt.xlabel('x')
plt.ylabel('Probability Density')

# 添加图例
plt.legend()

# 显示图像
plt.show()

代码解释

  1. 导入库

    • numpy 用于生成数据点。
    • matplotlib.pyplot 用于绘图。
    • scipy.stats 中的 cauchynorm 模块分别用于计算柯西分布和正态分布的概率密度函数值。
  2. 生成x值

    • np.linspace(-10, 10, 400) 生成从-10到10的400个等间距的点,这些点将用于计算概率密度函数值。
  3. 计算概率密度函数值

    • cauchy.pdf(x, loc=0, scale=1) 计算标准柯西分布的概率密度函数值。
    • norm.pdf(x, loc=0, scale=1) 计算标准正态分布的概率密度函数值。
  4. 绘制图像

    • plt.plot(x, y_cauchy, label='Cauchy Distribution', color='blue') 绘制柯西分布的图像。
    • plt.plot(x, y_norm, label='Normal Distribution', color='red', linestyle='--') 绘制正态分布的图像,使用虚线表示。
  5. 添加标题和标签

    • plt.title('Comparison of Cauchy and Normal Distributions') 添加标题。
    • plt.xlabel('x')plt.ylabel('Probability Density') 分别添加x轴和y轴的标签。
  6. 添加图例

    • plt.legend() 添加图例,显示每条曲线的标签。
  7. 显示图像

    • plt.show() 显示图像。

图像对比分析

  • 尾部:柯西分布的尾部明显比正态分布的尾部更厚,这意味着柯西分布中极端值出现的概率更高。这使得柯西分布更适合描述那些极端波动较为频繁的数据,如金融资产收益率等。
  • 峰部:柯西分布的峰值相对较低,而正态分布的峰值较高。这表明正态分布的数据更集中于均值附近,而柯西分布的数据分布相对更分散。
  • 整体形状:柯西分布的曲线更“丰满”,尾部更“肥厚”,而正态分布的曲线更“瘦高”,尾部迅速衰减。

通过这种对比,可以更直观地理解厚尾分布(柯西分布)与轻尾分布(正态分布)的差异。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2277297.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

EFK采集k8s日志

在 Kubernetes 集群中,需要全面了解各个 pod 应用运行状态、故障排查和性能分析。但由于 Pod 是动态创建和销毁的,其日志分散且存储不持久,因此需要通过集中式日志采集方案,将日志收集到统一的平台并配置日志可视化分析和监控告警…

HTML5教程(中)

HTML5 浏览器支持 HTML5 浏览器支持 目前市面上的浏览器有很多版本,你可以让一些较早的浏览器(不支持HTML5)支持 HTML5。 HTML5 浏览器支持 现代的浏览器都支持 HTML5。 此外,所有浏览器,包括旧的和最新的&#xff…

OpenCV实现彩色图像的直方图均衡化

1、直方图均衡化 在OpenCV中,equalizeHist函数用于直方图均衡化(Histogram Equalization)。这是一种图像处理技术,旨在增强图像的对比度,特别是在图像的灰度值集中于某个范围时非常有用。通过调整图像的灰度分布&…

速通nvm安装配置全程无废话

速通nvm安装配置全程无废话 1、安装包 通过网盘分享的文件:nvm-setup-1.1.11.zip等2个文件 链接: https://pan.baidu.com/s/1nk7pAFhhnHXDIIYRJLFqNw 提取码: niw8 --来自百度网盘超级会员v3的分享2、下载安装 nvm安装路径:D:\dev\nvm nodejs路径&am…

JUC Java并发编程 高级 学习大纲 动员

目录 口诀 锁 阿里巴巴开发规范 字节面试题 面试题 1 面试题 2 鼓舞 口诀 高内聚低耦合前提下 封装思想 线程 -- 操作 -- 资源类 判断、干活、通知防止虚假唤醒 ,wait 方法要注意注意标志位 flag 可能是 volatile 的 锁 阿里巴巴开发规范 参考书 并发编程…

Unity 3D游戏开发从入门进阶到高级

本文精心整理了Unity3D游戏开发相关的学习资料,涵盖入门、进阶、性能优化、面试和书籍等多个维度,旨在为Unity开发者提供全方位、高含金量的学习指南.欢迎收藏。 学习社区 Unity3D开发者 这是一个专注于Unity引擎的开发者社区,汇聚了众多Un…

国内源快速在线安装qt5.15以上版本。(10min安装好)(图文教程)

参考文章:Qt6安装教程——国内源-CSDN博客 1、在国内源上下载qt在线安装工具 NJU Mirror 2、 将下载好的在线安装工具,放到C盘根目录, 2.1 打开windows Powershell(WinX),下边那个最好。 输入两条指令&a…

[0405].第05节:搭建Redis主从架构

Redis学习大纲 一、3主3从的集群配置: 1.1.集群规划 1.分片集群需要的节点数量较多,这里我们搭建一个最小的分片集群,包含3个master节点,每个master包含一个slave节点,结构如下: 2.每组是一主一从&#x…

数据结构(Java版)第八期:LinkedList与链表(三)

专栏:数据结构(Java版) 个人主页:手握风云 目录 一、链表中的经典面试题 1.1. 链表分割 1.2. 链表的回文结构 1.3. 相交链表 1.4. 环形链表 一、链表中的经典面试题 1.1. 链表分割 题目中要求不能改变原来的数据顺序,也就是如上图所示。…

flutter R库对图片资源进行自动管理

项目中对资源的使用是开发过程中再常见不过的一环。 一般我们在将资源导入到项目中后,会通过资源名称来访问。 但在很多情况下由于我们疏忽输入错了资源名称,从而导致资源无法访问。 所以,急需解决两个问题: 资源编译期可检查可方…

doc、pdf转markdown

国外的一个网站可以: Convert A File Word, PDF, JPG Online 这个网站免费的,算是非常厚道了,但是大文件上传多了之后会扛不住 国内的一个网站也不错: TextIn-AI智能文档处理-图像处理技术-大模型加速器-在线免费体验 https://…

计算机网络 (41)文件传送协议

前言 一、文件传送协议(FTP) 概述: FTP(File Transfer Protocol)是互联网上使用得最广泛的文件传送协议。FTP提供交互式的访问,允许客户指明文件的类型与格式(如指明是否使用ASCII码&#xff0…

软件测试 —— 自动化测试(Selenium)

软件测试 —— 自动化测试(Selenium) 什么是SeleniumPython安装Selenium1.安装webdirver-manager2.安装Selenium 写一个简单用例CSS_SELECTOR和XPATH浏览器快速定位页面元素浏览器的前进(forward),后退(bac…

python识别图片中指定颜色的图案并保存为图片

示例代码: def chuli(color):import cv2import numpy as np# 定义颜色名称到HSV阈值范围的映射color_thresholds {red: ([0, 100, 100], [10, 255, 255], [160, 100, 100], [180, 255, 255]),yellow: ([20, 100, 100], [30, 255, 255]),blue: ([90, 100, 100], [1…

流浪猫流浪狗领养PHP网站源码

源码介绍 流浪猫流浪狗领养PHP网站源码,适合做猫狗宠物类的发信息发布。当然其他信息发布也是可以的。 导入数据库,修改数据库配置/application/database.php 设置TP伪静态,设置运行目录, 后台:/abcd.php/dashboard?…

Chatper 4: Implementing a GPT model from Scratch To Generate Text

文章目录 4 Implementing a GPT model from Scratch To Generate Text4.1 Coding an LLM architecture4.2 Normalizing activations with layer normalization4.3 Implementing a feed forward network with GELU activations4.4 Adding shortcut connections4.5 Connecting at…

Linux:Makefile 以及实现第一个程序:进度条

1.Makefile初认识 (1)Makefile内部结构的基本认识 (2)开始使用宏替换的进阶版本 (3)多文件的最终版本 BIN:可执行程序的别名 SRC $(wildcart *.c):表示所有.c文件 OBJ $(SRC: .c .o):表示SRC下的所有.c…

Golang笔记——Interface类型

大家好,这里是Good Note,关注 公主号:Goodnote,专栏文章私信限时Free。本文详细介绍Golang的interface数据结构类型,包括基本实现和使用等。 文章目录 Go 语言中的 interface 详解接口定义实现接口空接口 interface{}示…

HBuilderX打包ios保姆式教程

1、登录苹果开发者后台并登录已认证开发者账号ID Sign In - Apple 2、创建标识符(App ID)、证书,描述文件 3、首先创建标识符,用于新建App应用 3-1、App的话直接选择第一个App IDs,点击右上角继续 3-2、选择App&#x…

【Vue】Vue组件--上

目录 一、组件基础 二、组件的嵌套关系 1. 基础架构 2. 嵌套 三、组件注册方式 1. 局部注册: 2. 全局注册: 四、组件传递数据 1. 基础架构 2. 传递多值 3. 动态传递数据 五、组件传递多种数据类型 1. Number 2. Array 3. Object 六、组…