使用pyplot生成图形
from matplotlib import pyplot as plt
import pandas as pd
import seaborn as sns
import numpy as np
# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
sns.set_style({'font.sans-serif':['simhei', 'Arial']})
# 加载数据
hr = pd.read_csv('data/hr.csv', encoding='gbk')
data = hr.head(100)
# 使用Matplotlib库绘图
color_map = dict(zip(data['薪资'].unique(), ['b', 'y', 'r']))
for species, group in data.groupby('薪资'):
plt.scatter(group['每月平均工作小时数(小时)'],
group['满意度'],
color=color_map[species], alpha=0.4,
edgecolors=None, label=species)
plt.legend(frameon=True, title='薪资')
plt.xlabel('平均每个月工作时长(小时)')
plt.ylabel('满意度水平')
plt.title('满意度水平与平均每个月工作小时')
plt.show()
如图所示
使用seaborn生成图形
# 使用seaborn库绘图
sns.lmplot(x='每月平均工作小时数(小时)',y='满意度', data=data, hue='薪资', fit_reg=False, height=4)
plt.xlabel('平均每个月工作时长(小时)')
plt.ylabel('满意度水平')
plt.title('满意度水平与平均每个月工作小时')
plt.show()
也没有问题,如图2所示
出现报错
plt.rcParams['axes.unicode_minus'] = False
x = np.arange(1, 10, 2)
y1 = x + 1
y2 = x + 3
y3 = x + 5
# 绘制3条不同的直线
# 第1部分
plt.title('Matplotlib库的绘图风格')
plt.plot(x, y1)
plt.plot(x, y2)
plt.plot(x, y3)
plt.show()
显示正常。说明pyplot是没有太多参数讲究的。现在问题来了。现在用seabon来绘图。
# 使用seaborn库绘图
sns.set_style('darkgrid') # 全黑风格
sns.set_style({'font.sans-serif':['simhei', 'Arial']})
sns.lineplot(x, y1)
sns.lineplot(x, y2)
sns.lineplot(x, y3)
plt.title('seaborn库的绘图风格')
plt.show()
TypeError: lineplot() takes from 0 to 1 positional arguments but 2 were given
查找资料后发现,不可以省略x、y参数。更改后:
sns.lineplot(x=x, y=y1)
sns.lineplot(x=x, y=y2)
sns.lineplot(x=x, y=y3)
运行正常。