Seaborn中带核密度的直方图的绘制方法
seaborn中绘制直方图使用的是sns.histlot()函数:
sns.histplot(data,x,y,hue,weights,stat=‘count’,bins=‘auto’,binwidth,binrange,discrete,cumulative,common_bins,common_norm,multiple=‘layer’,element=‘bars’,fill,shrink=1,kde,kde_kws,line_kws,thresh=0,pthresh,pmax,cbar,cbar_ax,cbar_kws,palette,hue_order,hue_norm,color,log_scale,legend,ax,**kwargs,)
关键常用参数说明:
data:必需的参数,用于指定数据集。可以是一个Pandas的DataFrame、Numpy的数组、Python的列表或其他类似的数据结构。
x, y:可选参数,用于指定数据集中直方图的x轴和y轴数据。通常情况下,只需要指定x轴数据。
hue:可选参数,用于指定分类变量,根据该变量的不同取值,直方图的颜色会有所区分。
stat:可选参数,用于指定直方图的统计量。默认值为"count",表示计算每个箱体中的观测数量;可以设置为其他值,如"probability"、“density"等。
bins:可选参数,用于指定直方图的箱体数量。可以是一个整数,表示箱体的数量;也可以是一个序列,表示每个箱体的边界值。
binwidth:可选参数,用于指定直方图的箱体宽度。可以是一个整数或浮点数,表示箱体的宽度;也可以是一个字符串,表示使用自动计算的宽度。
binrange:可选参数,用于指定直方图的箱体范围。可以是一个元组,表示箱体的最小值和最大值;也可以是一个字符串,表示使用数据集的最小值和最大值。
cumulative:可选参数,用于指定是否绘制累积直方图。默认值为False,表示不绘制累积直方图;可以设置为True,表示绘制累积直方图。
kde:可选参数,用于指定是否绘制核密度估计曲线。默认值为False,表示不绘制核密度估计曲线;可以设置为True,表示绘制核密度估计曲线。
multiple:可选参数,用于指定是否绘制多个直方图。默认值为False,表示只绘制一个直方图;可以设置为True,表示绘制多个直方图。
element:可选参数,用于指定绘图元素的类型。默认值为"bars”,表示绘制柱状图;可以设置为其他值,如"step"、"poly"等。
shrink:可选参数,用于指定直方图的缩放因子。默认值为1,表示不缩放;可以设置为其他值,如0.5、0.8等。
ax:可选参数,用于指定绘图的坐标轴。如果没有指定,则会创建一个新的坐标轴。
**kwargs:用于传递其他绘图参数,例如图像的标题、标签、颜色等。
使用Seaborn绘制直方图的应用案例
股票开盘价、收盘价、最高价、最低价直方图可视化展示
在这个案例中,我们使用sns.histplot()方法绘制直方图,用以展示中国平安在2023年3月开盘价、收盘价、最高价、最低价的统计分布情况。
代码如下:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
# 设置为默认字体
plt.rcParams['font.family'] = 'SimHei'
# 显示负数
plt.rcParams['axes.unicode_minus'] = False
# 导入数据
df = pd.read_excel("2023年一季度A股日线行情.xlsx")
# 将日期列转化为日期格式
df["trade_date"] = df["trade_date"].astype("str").apply(lambda x:x[:4]+"-"+x[4:6]+"-"+x[6:])
# 将日期列转换为日期类型,并设置为索引列
df['trade_date'] = pd.to_datetime(df['trade_date'])
df.set_index('trade_date', inplace=True)
# 筛选2023年3月的行情数据
start_date = '2023-03-01'
end_date = '2023-03-31'
df = df.loc[start_date:end_date]
# 筛选出股票代码是"000001.SZ"平安的股票
df = df[df['ts_code'] == '000001.SZ']
# 绘制开盘价、收盘价、最高价、最低价的分价直方图
# 设置各个子图的标题
titles = ['开盘价', '收盘价', '最高价', '最低价']
# 设置各个子图的数据集
datas = ['open','close','high','low']
# 创建一个2x2的子图布局
fig, ax = plt.subplots(2, 2, figsize=(10, 10))
# 依次创建各个子图
for i in range(4):
sns.histplot(data=df, x=datas[i], kde=True, label = titles[i], ax=ax[i//2, i%2])
ax[i//2][i%2].set_title(titles[i])
ax[i//2][i%2].set_xlabel("Price")
ax[i//2][i%2].set_ylabel("Frequency")
# 调整子图之间的间距
plt.tight_layout()
# 显示图片
plt.show()
代码最终运行效果如下图所示: