续 Python——使用Seaborn钻石数据可视化分析(1)
目录
📈 4、非数值变量描述性统计分析
1️⃣ 柱状图——分析钻石切工的情况
📍 sns.countplot —— 绘制柱状图、条形图
2️⃣ 箱线图——分析不同切工的钻石的价格情况
📍 sns.barplot —— 不同分类变量之间的数值比较
⛓️ 5、相关性分析
一、不同变量之间的相关关系,如carat与depth变量和carat与price
📍 serborn.jointplot —— 绘制两个变量之间的联合分布
❓ 该函数的作用
❓ 绘制得到的图形如何看
二、不同变量之间的相关关系,如dept、table、price、x、y与z
编辑 📍 sns.pairplot —— 绘制数据集中所有数值列的成对关系图
❓ 该函数的作用
❓ 绘制得到的图形如何看
❓ 正态分布及偏态分布
📈 4、非数值变量描述性统计分析
1️⃣ 柱状图——分析钻石切工的情况
sns.countplot(x='cut',data=diamonds) # 画直方图
plt.tight_layout() # 自动调整子图参数
sns.countplot(y='color',data=diamonds) # 画条形图
sns.countplot(x='clarity',data=diamonds)
📍 sns.countplot —— 绘制柱状图、条形图
字段 | 数据类型 | 含义 |
x |
str or array or list | 表示要在x轴上显示的分类变量 |
y |
None or string, array, or list of strings/arrays |
通常,countplot 只需要一个变量(x),但如果你想要堆叠多个分类变量的计数,你可以使用 y 参数。这通常与 hue 参数一起使用。 |
hue |
string |
表示另一个分类变量,用于将 x 变量中的每个级别的数据分成不同的颜色 |
data |
DataFrame, array, or list of arrays |
通常是一个 pandas DataFrame,其中 x 和 hue 参数引用列名。如果 x 和 y 是一维数组或列表,则不需要这个参数 |
order |
list of strings |
指定 x 轴上的顺序。默认情况下,分类变量将按它们在数据中出现的顺序排序 |
hue_order |
list of strings |
当使用 hue 参数时,指定 hue 轴上的顺序 |
orient |
str | 控制条形的方向。"v" 表示垂直条形(默认值),"h" 表示水平条形 |