箱型图/箱线图
箱型图(Box Plot),也称为盒须图或箱线图,是一种用于展示数据分布情况的统计图表。它通过展示数据的中位数、上下四分位数、最大值和最小值,可以直观地显示出数据的离散程度、偏态和异常值等信息。
箱型图主要有以下几个部分组成:
- 上边缘(Upper Whisker):数据的最大值,不包括异常值。
- 上四分位数(Upper Quartile):数据中位于上半部分的25%的值。
- 中位数(Median):数据中位于中间位置的50%的值。
- 下四分位数(Lower Quartile):数据中位于下半部分的25%的值。
- 下边缘(Lower Whisker):数据的最小值,不包括异常值。
- 异常值(Outliers):数据中的极端值或离群值。
箱型图可以提供以下几方面的信息:
- 数据的中位数和四分位数,可以用来描述数据的集中趋势。
- 数据的离散程度,可以通过上下四分位数的距离来判断数据的分散程度。
- 数据的偏态和异常值,可以通过上下边缘之外的点来观察是否存在离群值。
箱型图常用于比较不同组或不同时间点的数据分布情况,帮助分析人员发现数据中的规律、异常和趋势,并进行数据的比较和决策。
绘制命令
boxchart();
如果需要修改异常值(即离群值)的形式,使用MarkerStyle命令。
如果需要修改异常值的点大小,使用MarkerSize命令,例如:
b = boxchart(1*ones(size(err_box{i1}(:,1))),err_box{i1}(:,1),'MarkerStyle','.','JitterOutliers','on','MarkerSize',1);
如上代码表示在横坐标为1的地方,以err_box这个数据绘制箱型图,其中离群值用点来表示,点的大小为1。
上面还涉及到一个东西:JitterOutliers,这个选项设为“on”则表示离群值偏移。如下为偏移后的形式(箭头所示为离群值):
默认情况下离群值是不偏移的,即: