需求:
利用Pandas 分析近100年圣诞节的星期分布,目的是知道圣诞节都在星期几,哪个星期多些。
思路:
-
用 pd.date_range 生成 100 年日期数据
-
筛选出12月25日的所有日期
-
将日期转换为星期几
-
统计重复值的数量
-
绘图
二、使用步骤
1.引入库
代码如下(示例):
import pandas as pd
2.读入数据
代码如下(示例):
(
# 生成100年时间序列
pd.Series(pd.date_range('1920', '2021'))
# 筛选 12月25日 的所有日期
.loc[lambda s: (s.dt.month==12) & (s.dt.day==25)]
.dt.day_of_week # 转为星期数
.add(1) # 由于0代表周一,对序列加1,符合日常认知
.value_counts() # 重复值计数
.sort_values() # 排序,星期从1-7
.plot
.bar() # 绘制柱状图
)
总结
以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。