箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图,因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。通过箱形图我们可以观察数据是否有偏向性、是否对称、数据是否有异常值、数据分布是否太过密集等。
箱子的中间有一条线,代表了数据的中位数( Q2 )。箱子的上下底,分别是数据的上四分位数(Q3)和下四分位数(Q1),这意味着箱体包含了
50% 的数据。因此,箱子的高度在一定程度上反映了数据的波动程度。上下边缘则代表了该组数据的最大值和最小值。超出最大值和低于最小值的点,可以理解为数据中的“异常值”。
不论是统计分析作业还是各类论文数据的分析,箱形图都能很好地帮助大家分析比较数据分布情况。
今天,我们就以一组学生成绩数据为例,教大家如何在FineBI v6.0中通过简单的拖拉拽完成一个箱形图。
首先将excel数据集导入FineBI中。
确认后,创建分析主题,并命名为学生成绩箱线图。
新建分析主题后,点击下方【组件】进入图表,选择图表类型为【箱形图】,再将课程拖入横轴,分数拖入纵轴,学号拖入颗粒度,一个简单的箱形图就完成了。
接下来可以美化组件样式:将【课程】拖入颜色中,在组件样式中可以选择隐藏图例。
分析结论
- 从箱子的长度可以看出,创新技术应用成绩分布较为集中,而计算机基础课程成绩分布较为分散。
- 从中位数到上四分位和下四分位的距离可以看出,四门课中,创新技术应用课程成绩分布最为均匀,而市场营销和概率论课程成绩分布较不均匀,且市场营销课程高分多,概率论低分多。
- 从中位数的位置可以得出,计算机基础的总体情况较好,概率论课程成绩总体情况不太好,且原因从数据中也可以发现有5位同学考了40分以下。
思考题
- 已知FineBI可以自定义图表,可以选择不同图形属性的纵轴,那你知道如何在FineBI中显示箱形图的异常点吗?
关注【帆软校企合作】公众号来找答案哦!