资料来源:用python学统计学,帮助文档
使用pd.dataframe.boxplot()函数绘制箱线图
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
df=pd.DataFrame({
'type':['A','A','A','A','A','A','A','A','A','A','B','B','B','B','B','B','B','B','B','B'],
'value':[2,3,3,4,4,4,4,5,5,6,5,6,6,7,7,7,7,8,8,9]
})
df.boxplot()
面介绍df.boxplot()函数中常用的几个重要参数(参数等号后为默认设置):
(1)column=None,就是需要绘制箱线图的数据列,默认是全部数据列。因为本例中只有一个数据列,所以跟第一张图一一样
df.boxplot(column='value')
(2)by=None,用于对数据列进行分组,示例如下:
df.boxplot(column='value',by='type')
(3)ax=None,用于指定坐标系,当利用matplotlib通时绘制多个图时使用,本文不涉及。
(4)fontsize=None,用于指定刻度标签的字体大小,下图设置字体大小为larger,注意与上图的数据标签的大小的区别。
df.boxplot(column='value',by='type',fontsize='large')
(5)rot: 'int' = 0,用于指定刻度标签的旋转角度,下图设置rot=90度
df.boxplot(column='value',by='type',rot=90)
(10)grid: 'bool' = True,设置网格线的有无。
df.boxplot(column='value',by='type',grid=False)