seaborn.distplot(a=None, bins=None, hist=True,
kde=True, rug=False, fit=None, hist_kws=None,
kde_kws=None, rug_kws=None, fit_kws=None,
color=None, vertical=False, norm_hist=False,
axlabel=None, label=None, ax=None, x=None)
参数解释
a: 序列series、一维数组或者list,上面这个图就是用的list
bins:使用的规则,默认为空,如果不为空,则使用的是plt中的规则
hist:是否在图像中把hist画出来,默认为True
kde:一个bool类型的选项,是否使用高斯核函数做分布
rug:控制是否生成观测数值的小细条
fit:控制拟合的参数分布
hist_kws:使用方法与matplotlib.axes.Axes.hist().一致
kde_kws:使用的是参数kdeplot()(套娃)
rug_kws:
color:设置hist的颜色,这个是常用的
vertical:设置是否是垂直,如果为True,纵坐标为X,横坐标为Y
norm_list:是否显示hist的密度,如果为True,显示密度而不是直方图
axlabel:字符串或空,坐标轴的标签
label:legend标签
ax:限定坐标轴
原文链接:https://blog.csdn.net/weixin_45885232/article/details/124644018
和条形图的区别,条形图有空隙,直方图没有,条形图一般用于类别特征,直方图一般用于数字特征(连续型)
代码(单个)
fig, ax = plt.subplots(figsize=(8, 6))
ax = plt.subplot(1,2,1)
sns.distplot(data_train['V0'],rug=True,fit=stats.norm)
ax = plt.subplot(1,2,2)
res = stats.probplot(data_train["V0"],plot=plt)
plt.show()
、代码(多个)
def plot_dist(data):
column = data_train.columns.tolist()[:data.shape[1]]
fig, ax = plt.subplots(figsize=(12, 208))
for i in range(0,77,2):
ax = plt.subplot(13,6,i+1)
sns.distplot(data[column[i//2]], fit=stats.norm)
ax = plt.subplot(13,6,i+2)
res = stats.probplot(data[column[i//2]], plot=plt)
plt.show()
# plot_dist(data_train)