优思学院|听说你想了解箱型图?教程在这里!

news2024/11/25 18:55:57

优思学院|听说你想了解箱型图?教程在这里!

箱形图是什么?

箱形图(也称为箱线图)使用箱体和线条来表示一个或多个组的数值数据分布。箱体的边界表示数据中间50%的范围,中央线标示中位数值。线从每个箱体延伸出来,捕捉其余数据的范围,在线条之外的点表示离群值。箱形图用途很广泛,在六西格玛项目中亦经经常会应用得到。

箱形图显示按月分组的每日下载量

上面的示例箱形图显示了一个虚构的数字应用程序的每日下载量,按月分组。从这个图中可以看到,下载量从一月每天大约75次逐渐增加到八月每天大约95次。十一月和十二月的中位下载量似乎略有下降。点显示了下载量异常的天数:六月有两天和十月有一天的下载量较低。相比于等效的折线图,箱形图提供了一个更清晰的数据总体趋势表示。

什么时候应该使用箱形图?

箱形图用于显示数值数据的分布,特别是当你想要在多个组之间进行比较时。它们提供了一个一目了然的宏观信息,展示了数据组的对称性、偏度、方差和离群值。很容易看到数据的主要部分在哪里,并进行不同组之间的比较。

另一方面,箱形图的简单,也限制了它所能显示的数据密度的能力。使用箱形图时,我们无法观察分布形状的详细信息,例如分布的模态(峰的数量)和偏度。

看看下图两个不同的直方图可以产生一个相同的箱形图。 这两个直方图背后的数据集生成了中间面板中的相同箱形图。

解释箱线图

箱形图的构造基于数据集的四分位数,即将数据集分成相等四部分的值。第一个四分位数(Q1)大于25%的数据且小于其余75%。第二个四分位数(Q2)位于中间,将数据分成两半。Q2也称为中位数。第三个四分位数(Q3)大于75%的数据且小于剩下的25%。在箱线图中,箱体的两端和中央线标示这三个四分位数的位置。

箱线图如何从数据集中得出。 Q3和Q1之间的距离称为四分位距(IQR),在确定从箱体延伸出来的须的长度时起着重要作用。每个须延伸到每个侧翼内距离箱体端点1.5倍IQR以内的最远数据点。任何超过该距离的数据点被视为离群值,并用点标记。还有其他定义须长度的方法,稍后会讨论。

当数据分布对称时,可以预期中位数位于箱体的正中间:Q1和Q2之间的距离应与Q2和Q3之间的距离相同。离群值应均匀分布在箱体的两侧。如果分布偏斜,则中位数不会在箱体中间,而是偏向一侧。你可能还会发现须的长度不平衡,一侧短且无离群值,另一侧有长尾且有更多离群值。

数据形状会影响箱线图的外观。 数据结构示例 箱形图可以从包含数据值和数据组列的表格生成 可视化工具通常能够从一列未汇总的原始数据生成箱形图;箱体端、须和离群值的统计信息在绘图过程中会自动计算。当需要为多个组绘制箱形图时,组通常由第二列表示,如上表所示。

使用箱形图的最佳实践

比较多个组

当需要在组之间进行分布比较时,箱形图效果最佳。它们在数据总结中非常紧凑,通过箱线标记的位置很容易比较组。

当你只有一个组的分布要绘制时,很难证明使用箱形图的合理性。箱形图只提供数据的高层摘要,无法显示数据分布形状的详细信息。只有一个组时,我们可以选择更详细的图表类型,如直方图或密度曲线。

考虑组的顺序

如果绘制箱形图的组没有固有的顺序,则应考虑按顺序排列它们,以突出模式和洞察。一个常见的排序方法是按中位数值排序。

按团队名称和中位数排序的箱形图并排比较

常见的箱形图选项

垂直和水平箱形图

如上文所述,箱形图可以对齐,使得箱体垂直放置(组在水平轴上)或水平放置(组垂直对齐)。当有很多组要绘制或组名较长时,水平排列可能是一种有用的格式。它还允许渲染长类别名称而无需旋转或截断。另一方面,当分组变量基于时间单位时,垂直排列可能是更自然的格式。

箱形图可以水平或垂直排列

可变箱宽和凹槽

某些可视化工具包括选项,将额外的统计信息编码到箱形图中。当收集的数据代表来自更大人群的样本观察时,这很有用。

凹槽用于显示数据代表样本时对中位数最可能的值的预期。当在组之间进行比较时,可以通过凹槽范围是否重叠来判断中位数之间的差异是否具有统计显著性。如果任何凹槽区域重叠,则我们不能说中位数之间的差异具有统计显著性;如果它们没有重叠,那么我们可以有较高的信心认为实际中位数不同。

箱形图中的凹槽表示中位数真值的不确定性。 此图表明,过程B生成的组件具有更好的(更高的)故障时间,但重叠的凹槽表明中位数差异不具有统计显著性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1892924.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

cadence symbol修改之一

cdaence virtuoso 复制cell,或者拷贝symbol之后,再次调用的时候,symbol还是跟随原来的cell名字 解决办法 打开对应的symbol 修改partName为 cellName

打造您的第一个私有智能助手

当前的大语言模型通常是基于公开的知识进行训练的,而我们的组织和个人用户希望能够获得有关自身私有知识的回答。为了满足这一需求,业界通常采用检索增强生成(RAG)或微调模型的方法。然而,这些技术对非专业人员来说门槛…

混元大模型加持,微信输入法开启AI问答新体验

在人工智能技术飞速发展的今天,微信作为全球最大的社交平台之一,一直在不断地探索和创新,以提供更智能、更便捷的用户体验。 最近,微信官方宣布了一个令人兴奋的消息:微信输入法正式上线了“一键AI问答”功能&#xf…

mac外接显示屏,切换程序坞和启动台在哪个屏幕显示,最实用教程

程序坞和启动项是同步的 首先,程序坞和展开启动项是同步出现在同一个屏幕的,所以只需要把程序坞“呼唤”到指定的显示器就行。 无需设置,动对了鼠标就行 无所谓哪个是主屏,设置中都没有切换程序坞位置的选项, 想要…

不知几DAY的Symfony---RCE复现

感谢红队大佬老流氓的供稿,此篇文章是针对Symfony框架的一个RCE漏洞复现 ​框架简介 Symfony是一个开源的PHP Web框架,它现在是许多知名 CMS 的核心组件,例如Drupal、Joomla!、eZPlatform(以前称为 eZPublish)或Bolt。…

植物大战僵尸融合版1.0下载(全部植物合体)

如果你是《植物大战僵尸》系列的忠实粉丝,那么有一个好消息:一款全新的改版游戏——《植物大战僵尸融合版》已经上线。这不仅仅是一次简单的更新,而是一次彻底的玩法革新。B站UP主蓝飘飘fly精心打造的这个版本,为玩家带来了前所未…

Java-数据结构

数据结构概述 常见的数据结构 栈 队列 数组 链表 二叉树 二叉查找树 平衡二叉树 红黑树 示例:

YOLO-letter box

最细致讲解yolov8模型推理完整代码--(前处理,后处理) - 博客-中国极客 (chinageek.org) 直接用resize,图片会变形,宽高比会不对 letterbox函数就是把图片弄到想要的大小,保持宽高比,然后少掉的部…

Tomcat服务部署安装

一、Tomcat基础 1.Tomcat简介 Tomcat服务器是一个免费的开放源代码的Web应用服务器,Tomcat虽然和Apache或者Nginx这些Web服务器一样,具有处理HTML页面的功能,然而由于其处理静态HTML的能力远不及Apache或者Nginx,所以Tomcat通常…

A*——AcWing 179. 八数码

A* 定义 A* 算法是一种在图形或地图中寻找最短路径的启发式搜索算法。它通过综合考虑起始节点到当前节点的实际代价和当前节点到目标节点的预估代价,来决定下一步的搜索方向。 运用情况 路径规划:如在地图导航中为车辆、行人规划最优路线。游戏开发&…

【附精彩文章合辑】佛光普照,智慧引领——记首个中文社区版Gemma-2的诞生,共筑和谐科技净土

阿弥陀佛,贫僧唐僧,自西天取经归来,虽已超脱尘世,然心系众生,尤是见科技日新月异,信息洪流浩渺无垠,心中不免生出几分感慨与期许。近日,闻讯首个中文社区版的Gemma-2即将面世&#x…

【Pyhton学习】常用标识符与关键字

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 1. 标识符与关键字2. 常用格式化输出符号3. 算数运算符4. 赋值运算符5. 比较运算符总结 1. 标识符与关键字 在Python…

桌面记笔记的软件:能加密的笔记app

在日常生活和工作中,很多人都有记笔记的习惯。无论是记录会议要点、学习心得,还是生活中的点滴灵感,笔记都是我们不可或缺的好帮手。然而,传统的纸笔记录方式逐渐不能满足现代人的需求,因为纸质笔记不易保存、查找困难…

动手学深度学习(Pytorch版)代码实践 -计算机视觉-39实战Kaggle比赛:狗的品种识别(ImageNet Dogs)

39实战Kaggle比赛:狗的品种识别(ImageNet Dogs) 比赛链接:Dog Breed Identification | Kaggle 1.导入包 import torch from torch import nn import collections import math import os import shutil import torchvision from…

nacos开启鉴权后,springboot注册失败

1.确认Nacos版本 我的Nacos版本是1.4.2 2.确认Nacos相关依赖的版本之间兼容&#xff0c;一下是我的一些pom.xml依赖 <!--父级项目的--><parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifa…

MySQL:MySQL总结

文章目录 MySQL思维导图基础实际在 Innodb 存储引擎中&#xff0c;会用一个特殊的记录来标识最后一条记录&#xff0c;该特殊的记录的名字叫 supremum pseudo-record &#xff0c;所以扫描第二行的时候&#xff0c;也就扫描到了这个特殊记录的时候&#xff0c;会对该主键索引加…

深化产教融合“桥梁”作用!蓝卓携手宁波4大院校共育数智人才

建强“三支队伍”赋能新质生产力&#xff0c;为进一步加强新时代教师队伍建设改革&#xff0c;促进人才培养能力和服务企业能力“双提升”&#xff0c;7月2日&#xff0c;“2024企业实践工业互联网职业教育师资培训班”在蓝卓顺利开班。 来自宁波城市职业技术学院、宁波职业技…

代理IP和VPN有什么区别?该怎么选择?

今天我们来聊聊很多人关心的一个问题——代理IP和VPN到底有什么区别&#xff1f;虽然它们听起来差不多&#xff0c;但其实有很大的不同。这篇文章&#xff0c;小编就带大家一起了解一下吧&#xff01; 什么是代理IP&#xff1f; 代理IP是一种通过代理服务器替换用户真实IP地址…

c进阶篇(四):内存函数

内存函数以字节为单位更改 1.memcpy memcpy 是 C/C 中的一个标准库函数&#xff0c;用于内存拷贝操作。它的原型通常定义在 <cstring> 头文件中&#xff0c;其作用是将一块内存中的数据复制到另一块内存中。 函数原型&#xff1a;void *memcpy(void *dest, const void…

UE5 修改项目名称 类的名称

修改类的名称 这里推荐使用Rider编辑器修改&#xff0c;它会给你遍历所有的引用&#xff0c;然后一次性修改&#xff0c;并自动添加DefaultEngine.ini。接下来&#xff0c;我将给大家演示如何实现。 我们在一个类的文件上面选择重构此 然后选择重命名 在弹框内修改为新的名称…