目录
🧾 1、数据集(部分数据)
✏️ 2、导入数据集与必要模块
1️⃣ 导入数据
📍 通过info函数查看所有列数据的类型信息
2️⃣ 导入Seaborn工具包
📍 set_context 设置图形绘制时的上下文参数
📍 set_style 设置绘图风格
📍 set_palette 设置图标全局颜色的调色板
📊 3、数值变量描述性统计分析
1️⃣ 首先来看数值变量的描述性统计信息:
📍 sns.boxplot 用于绘制箱线图
📍 代码说明
📍 结果说明
❓ 怎么看箱线图
🏷️ 相关概念:
⭕ 如何计算:
🧾 1、数据集(部分数据)
变量 | 说明 | 类型 | 示例 |
carat | 克拉重量 | float | 0.23 |
cut | 切工 | object | Idea |
color | 颜色 | object | E |
clarity | 纯净度 | object | VS1 |
depth | 钻石深度,“见图示” | float64 | 61.5 |
table | 钻石宽度,”见图示“ | float64 | 55.0 |
price | 价格 | int64 | 326 |
x | “如图2所示” | float64 | 3.95 |
y | “如图2所示” | float64 | 3.98 |
z | “如图2所示” | float64 | 2.43 |
✏️ 2、导入数据集与必要模块
1️⃣ 导入数据
# 1.导入相关的库
import pandas as pd
import numpy as np
# 2.导入数据
diamonds = pd.read_csv(r"C:/XXX/xxx/Desktop/数据分析与可视化/diamonds.csv")
# 3.查看数据的前5行信息
diamonds.head(5)
📍 通过info函数查看所有列数据的类型信息
# 查看所有列数据的类型信息
diamonds.info()
从上图可知,这些字段均没有空值,且能准确知道每个字段的数据类型
2️⃣ 导入Seaborn工具包
# 1.导入相关的库
import seaborn as sns
import matplotlib.pyplot as plt
# 2.notebook格式,放大横纵坐标标记,显示刻度,更容易看清
# set_context 会设置Matplotlib的默认参数
sns.set_context("notebook",font_scale=1)
sns.set_style('ticks')
# 3.配色使用Set2
sns.set_palette('Set2')
#