DataFrame.plot函数详解(五)
散点图和箱体图实例
1. scatter
DataFrame.plot.scatter(x, y, s=None, c=None, **kwargs)
c: 是每个点的颜色,可以是一个值,也可以是数组值
s: 是每个点的大小,可以是一个值,也可以是数组值
df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
[6.4, 3.2, 1], [5.9, 3.0, 2]],
columns=['length', 'width', 'species'])
ax1 = df.plot.scatter(x='length',
y='width',
c='Blue',marker='H',figsize=(3,3),fontsize=12,title='Scatter')
ax2 = df.plot.scatter(x='length',
y='width',
c='species',marker='H',figsize=(3,3),fontsize=12,title='Scatter',
colormap='viridis')
c是list ,通过colormap ,显示值的大小,Scatter可以表示三维数据。
ax2 = df.plot.scatter(x='length',
y='width',
s=df['species']*100,marker='H',figsize=(3,3),fontsize=12,title='Scatter')
s=df[‘species’]*100 ,由于值比较小,放大倍数,六边形的大小。
2. box
DataFrame.plot.box(by=None, **kwargs)
data = np.random.randn(25, 4)
df = pd.DataFrame(data, columns=list('ABCD'))
ax = df.plot.box(figsize=(3,3),title='Box')
age_list = [8, 10, 12, 14, 72, 74, 76, 78, 20, 25, 30, 35, 60, 85]
df = pd.DataFrame({"gender": list("MMMMMMMMFFFFFF"), "age": age_list})
ax = df.plot.box(column="age", by="gender", figsize=(3, 2))
by=“gender” ,按性别分类统计