可视化时间趋势
现在你已经熟悉了编码环境,是时候学习如何制作自己的图表了!
在本教程中,您将学习足够的Python来创建专业外观的折线图。然后,在接下来的练习中,您将使用您的最新技能处理真实世界的数据集。
本课程数据集夸克网盘下载链接:https://pan.quark.cn/s/a235ac6b2616
提取码:1Ymk
使用的数据集为:spotify.csv
文章目录
- 1、Jupyter notebooks设置
- 2、选择一个数据集
- 3、加载数据
- 4、检查数据
- 5、数据可视化
- 6、绘制数据的子集
1、Jupyter notebooks设置
首先,我们开始设置编程环境。
In [1]:
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
print("Setup Complete")
Setup Complete
2、选择一个数据集
- 此教程的数据集跟踪了音乐流媒体服务Spotify上的全球每日播放量。我们关注2017年和2018年的五首热门歌曲:
- “Shape of You”,艾德·希兰(https://bit.ly/2tmbfXp)
- “Despacito”,路易斯·冯西(https://bit.ly/2vh7Uy6)
- “Something Just Like This”,The Chainsmokers和Coldplay(https://bit.ly/2OfSsKk)
- “HUMBLE.”,肯德里克·拉玛尔(https://bit.ly/2YlhPw4)
- “Unforgettable”,法国蒙塔纳(https://bit.ly/2oL7w8b)
请注意,出现的第一个日期是2017年1月6日,对应于Ed Sheeran的“The Shape of You”的发布日期。而且,使用该表,您可以看到“The Shape of You”在其发布当天在全球范围内被播放了12,287,078次。请注意,其他歌曲在第一行中缺少值,因为它们直到后来才发布!
3、加载数据
正如您在之前的教程中学到的,我们使用pd.read_csv
命令加载数据集。
In [2]:
# 文件路径
spotify_filepath = "../input/spotify.csv"
# 读取文件到变量 spotify_dat