Python酷库之旅-第三方库Pandas(070)

news2025/1/9 16:26:55

目录

一、用法精讲

281、pandas.Series.dt.daysinmonth属性

281-1、语法

281-2、参数

281-3、功能

281-4、返回值

281-5、说明

281-6、用法

281-6-1、数据准备

281-6-2、代码示例

281-6-3、结果输出

282、pandas.Series.dt.tz属性

282-1、语法

282-2、参数

282-3、功能

282-4、返回值

282-5、说明

282-6、用法

282-6-1、数据准备

282-6-2、代码示例

282-6-3、结果输出

283、pandas.Series.dt.freq属性

283-1、语法

283-2、参数

283-3、功能

283-4、返回值

283-5、说明

283-6、用法

283-6-1、数据准备

283-6-2、代码示例

283-6-3、结果输出

284、pandas.Series.dt.isocalendar属性

284-1、语法

284-2、参数

284-3、功能

284-4、返回值

284-5、说明

284-6、用法

284-6-1、数据准备

284-6-2、代码示例

284-6-3、结果输出

285、pandas.Series.dt.to_period方法

285-1、语法

285-2、参数

285-3、功能

285-4、返回值

285-5、说明

285-6、用法

285-6-1、数据准备

285-6-2、代码示例

285-6-3、结果输出

二、推荐阅读

1、Python筑基之旅

2、Python函数之旅

3、Python算法之旅

4、Python魔法之旅

5、博客个人主页

一、用法精讲

281、pandas.Series.dt.daysinmonth属性
281-1、语法
# 281、pandas.Series.dt.daysinmonth属性
pandas.Series.dt.daysinmonth
The number of days in the month.
281-2、参数

        无

281-3、功能

        用于返回一个包含每个日期对应月份的天数的序列,这在时间序列分析中尤其有用,比如需要计算每个月的总天数时,或在处理日期数据时,需要知道某个月有多少天来进行一些特定的操作或分析,具备同样功能的还有pandas.Series.dt.days_in_month属性。

281-4、返回值

        返回每个时间戳所对应月份的天数,其返回值是一个包含每个时间戳所在月份天数的整数系列(Series)。

281-5、说明

        使用场景:

281-5-1、财务分析:确定每个月的天数对月末结算、预算编制和财务预测非常重要。例如,财务团队需要知道每个月的天数以便准确计算月度预算和实际开销。

281-5-2、数据完整性检查:在处理时间序列数据时,例如销售数据或传感器数据,可以使用daysinmonth确认每个月的数据是否完整,如果某个月的数据少于应有天数,可能需要进一步调查和处理。

281-5-3、平均日值计算:在数据分析中,经常需要将月度数据转换为平均日值。例如,在分析气象数据时,需要计算每月的平均日气温或降雨量。

281-5-4、时间序列转换:在某些情况下,可能需要将时间序列数据从月度转换为季度或年度数据,在这种转换过程中,需要知道每个月的天数以进行适当的加权计算。

281-5-5、资源规划和调度:在项目管理和资源规划中,了解每个月的天数可以帮助更好地进行资源分配和调度。例如,在人员管理中,根据每个月的天数合理分配工作量。

281-5-6、时间序列模拟:在模拟时间序列数据时,可以根据每个月的天数生成更为真实和合理的数据。例如,模拟每日销售数据时,可以根据每个月的天数生成月度数据。

281-5-7、时间序列分析:在进行季节性和周期性分析时,每个月的天数是一个重要的参考因素。例如,在分析股票市场的月度回报率时,可以考虑每个月的天数来计算加权平均值。

281-6、用法
281-6-1、数据准备
281-6-2、代码示例
# 281、pandas.Series.dt.daysinmonth属性
# 281-1、财务分析-月末结算和预算编制
import pandas as pd
# 创建一个日期序列
date_series = pd.date_range(start='2023-01-01', end='2023-12-31', freq='MS')
# 假设每个月的开销(单位:美元)
monthly_expenses = pd.Series([3000, 2800, 3200, 3100, 2900, 2700, 3500, 3300, 3400, 3600, 3800, 3700], index=date_series)
# 计算每月的天数
days_in_month = date_series.daysinmonth
# 计算每月的平均日开销
daily_expenses = monthly_expenses / days_in_month
print(daily_expenses, end='\n\n')

# 281-2、数据完整性检查-验证数据完整性
import pandas as pd
# 假设一个日期序列和对应的数据
date_series = pd.date_range(start='2023-01-01', end='2023-12-31')
data = pd.Series(range(len(date_series)), index=date_series)
# 计算每个月的数据点
expected_days = date_series.to_series().dt.daysinmonth
actual_days = data.groupby(data.index.month).size()
# 检查是否有缺失的数据
missing_data = expected_days - actual_days
print(missing_data, end='\n\n')

# 281-3、平均日值计算-计算每月的平均日气温
import pandas as pd
# 创建一个日期序列
date_series = pd.date_range(start='2023-01-01', end='2023-12-31', freq='MS')
# 假设每个月的平均气温(单位:摄氏度)
monthly_temperature = pd.Series([2.5, 3.0, 5.5, 10.0, 15.0, 20.0, 25.0, 24.0, 20.0, 15.0, 8.0, 3.0], index=date_series)
# 计算每月的天数
days_in_month = date_series.daysinmonth
# 计算每月的平均日气温
average_daily_temperature = monthly_temperature / days_in_month
print(average_daily_temperature, end='\n\n')

# 281-4、时间序列转换-将月度数据转换为季度数据
import pandas as pd
# 创建一个日期序列
date_series = pd.date_range(start='2023-01-01', end='2023-12-31', freq='ME')
# 假设每个月的某项数据(单位:任意)
monthly_data = pd.Series([100, 120, 110, 130, 140, 150, 160, 170, 180, 190, 200, 210], index=date_series)
# 计算每月的天数
days_in_month = date_series.daysinmonth
# 将月度数据转换为季度数据
quarterly_data = monthly_data.resample('QE').sum() / date_series.to_series().dt.daysinmonth.groupby(pd.Grouper(freq='QE')).sum()
print(quarterly_data, end='\n\n')

# 281-5、资源规划和调度-根据每个月的天数规划人力资源
import pandas as pd
# 创建一个日期序列
date_series = pd.date_range(start='2023-01-01', end='2023-12-31', freq='ME')
# 假设总工作量(单位:小时)
total_workload = 1200
# 创建一个包含日期的Series
date_series = pd.Series(date_series)
# 计算每月的天数
days_in_month = date_series.dt.daysinmonth
# 根据每个月的天数规划人力资源
workload_per_day = total_workload / days_in_month.sum()
print(workload_per_day, end='\n\n')

# 281-6、时间序列模拟-生成模拟的每日销售数据
import pandas as pd
# 创建一个日期序列
date_series = pd.date_range(start='2023-01-01', end='2023-12-31', freq='ME')
# 假设每个月的销售数据(单位:任意)
monthly_sales = pd.Series([3000, 3200, 3100, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4100], index=date_series)
# 计算每月的天数
days_in_month = date_series.daysinmonth
# 生成模拟的每日销售数据
simulated_daily_sales = monthly_sales / days_in_month
print(simulated_daily_sales, end='\n\n')

# 281-7、时间序列分析-计算加权平均回报率
import pandas as pd
from pandas.tseries.offsets import MonthEnd
# 创建一个日期序列,表示每个月的月末
date_series = pd.date_range(start='2023-01-01', end='2023-12-31', freq=MonthEnd())
# 假设每个月的回报率(单位:百分比),注意这里转换为小数形式
monthly_return = pd.Series([0.02, 0.015, 0.025, 0.03, 0.028, 0.031, 0.029, 0.032, 0.035, 0.038, 0.04, 0.037],
                           index=date_series)
# 初始化一个列表来存储每个月的天数
days_in_month = []
# 计算每个月的天数
for i in range(len(date_series) - 1):
    start_date = date_series[i]
    end_date = date_series[i + 1]
    # 由于freq='ME',end_date实际上是下个月的月末,所以我们用end_date - MonthEnd()来获取本月最后一天
    last_day_of_month = end_date - MonthEnd(1)
    # 计算这个月有多少天
    days_in_month.append((last_day_of_month - start_date).days + 1)
# 转换为pandas Series以便进行索引和计算
days_in_month = pd.Series(days_in_month, index=date_series[:-1])  # 去掉最后一个月末的日期,因为它不包含数据
# 计算加权平均回报率
# 注意:我们需要将days_in_month向前移动一个月,以便与monthly_return的索引对齐
weighted_return = (monthly_return * days_in_month.shift(1)).sum() / days_in_month.sum()
# 由于我们使用了shift(1),所以第一个月的回报率没有被计算在内(因为没有前一个月的天数)
# 如果我们希望包含整个年份的回报率,我们可以选择忽略第一个月或者使用一个默认值
# 但在这里,我们假设数据是从第二个月开始有效的,或者简单地忽略这个细节
# 打印加权平均回报率
print(weighted_return)
281-6-3、结果输出
# 281、pandas.Series.dt.daysinmonth属性
# 281-1、财务分析-月末结算和预算编制
# 2023-01-01     96.774194
# 2023-02-01    100.000000
# 2023-03-01    103.225806
# 2023-04-01    103.333333
# 2023-05-01     93.548387
# 2023-06-01     90.000000
# 2023-07-01    112.903226
# 2023-08-01    106.451613
# 2023-09-01    113.333333
# 2023-10-01    116.129032
# 2023-11-01    126.666667
# 2023-12-01    119.354839
# Freq: MS, dtype: float64

# 281-2、数据完整性检查-验证数据完整性
# 2023-01-01 00:00:00   NaN
# 2023-01-02 00:00:00   NaN
# 2023-01-03 00:00:00   NaN
# 2023-01-04 00:00:00   NaN
# 2023-01-05 00:00:00   NaN
#                        ..
# 8                     NaN
# 9                     NaN
# 10                    NaN
# 11                    NaN
# 12                    NaN
# Length: 377, dtype: float64

# 281-3、平均日值计算-计算每月的平均日气温
# 2023-01-01    0.080645
# 2023-02-01    0.107143
# 2023-03-01    0.177419
# 2023-04-01    0.333333
# 2023-05-01    0.483871
# 2023-06-01    0.666667
# 2023-07-01    0.806452
# 2023-08-01    0.774194
# 2023-09-01    0.666667
# 2023-10-01    0.483871
# 2023-11-01    0.266667
# 2023-12-01    0.096774
# Freq: MS, dtype: float64

# 281-4、时间序列转换-将月度数据转换为季度数据
# 2023-03-31    3.666667
# 2023-06-30    4.615385
# 2023-09-30    5.543478
# 2023-12-31    6.521739
# Freq: QE-DEC, dtype: float64

# 281-5、资源规划和调度-根据每个月的天数规划人力资源
# 3.287671232876712

# 281-6、时间序列模拟-生成模拟的每日销售数据
# 2023-01-31     96.774194
# 2023-02-28    114.285714
# 2023-03-31    100.000000
# 2023-04-30    110.000000
# 2023-05-31    109.677419
# 2023-06-30    116.666667
# 2023-07-31    116.129032
# 2023-08-31    119.354839
# 2023-09-30    126.666667
# 2023-10-31    125.806452
# 2023-11-30    133.333333
# 2023-12-31    132.258065
# Freq: ME, dtype: float64

# 281-7、时间序列分析-计算加权平均回报率
# 0.027545454545454543
282、pandas.Series.dt.tz属性
282-1、语法
# 282、pandas.Series.dt.tz属性
pandas.Series.dt.tz
Return the timezone.

Returns:
datetime.tzinfo, pytz.tzinfo.BaseTZInfo, dateutil.tz.tz.tzfile, or None
Returns None when the array is tz-naive.
282-2、参数

        无

282-3、功能

        用于获取或设置pandas.Series对象中时间戳的时区信息。

282-4、返回值

        如果pandas.Series中的时间戳带有时区信息,则dt.tz返回pytz库中的tzinfo对象,表示时间戳的时区。例如,<UTC>表示协调世界时(UTC);如果pandas.Series中的时间戳没有时区信息,则dt.tz返回None。

282-5、说明

        无

282-6、用法
282-6-1、数据准备
282-6-2、代码示例
# 282、pandas.Series.dt.tz属性
import pandas as pd
# 创建一个带有UTC时区的时间戳Series对象
timestamps_with_tz = pd.Series(pd.date_range('2024-01-01', periods=3, freq='D', tz='UTC'))
# 获取时区信息
timezone_info = timestamps_with_tz.dt.tz
print(timezone_info)
# 创建一个没有时区的时间戳Series对象
timestamps_no_tz = pd.Series(pd.date_range('2024-01-01', periods=3, freq='D'))
# 获取时区信息
timezone_info_no_tz = timestamps_no_tz.dt.tz
print(timezone_info_no_tz)
282-6-3、结果输出
# 282、pandas.Series.dt.tz属性
# UTC
# None
283、pandas.Series.dt.freq属性
283-1、语法
# 283、pandas.Series.dt.freq属性
pandas.Series.dt.freq
283-2、参数

        无

283-3、功能

        用于返回时间序列数据的频率信息,它提供了时间序列索引的频率属性,可以帮助你确定数据的时间间隔,这对于时间序列数据的处理和分析非常重要,特别是在需要进行频率转换、重采样或预测等操作时。

283-4、返回值

         返回一个pandas.tseries.offsets.DateOffset对象,代表时间序列的频率。如果时间序列不规则(即没有固定频率),则返回None。

283-5、说明

        使用场景:

283-5-1、频率检测与验证:

283-5-1-1、检测时间序列的规律性:在处理时间序列数据时,了解数据的频率有助于确定其是否规律。例如,检测数据是否为日频、月频等,以便选择合适的分析方法。

283-5-1-2、验证数据的完整性:通过检测频率,可以识别数据中是否存在缺失值或异常点。例如,日频数据中可能存在缺少某几天的数据,通过dt.freq可以帮助发现这些问题。

283-5-2、重采样操作:

283-5-2-1、频率转换:在重采样操作中,需要将数据从一种频率转换为另一种频率,例如从日频转换为月频,dt.freq可以帮助确定当前数据的频率,从而选择合适的重采样规则。

283-5-2-2、聚合与降采样:在降采样时(例如,从分钟频率降到小时频率),了解原始数据的频率有助于正确地聚合数据。

283-5-3、时间序列的绘图:在时间序列的可视化中,频率信息可以帮助设置合适的时间刻度,使得图表更加清晰易读。例如,在月频数据的图表中,可以设置每个月为一个刻度。

283-5-4、异常检测:当时间序列数据不规则时,dt.freq会返回None,这种情况下,可以进一步分析数据的异常点或缺失值。

283-6、用法
283-6-1、数据准备
283-6-2、代码示例
# 283、pandas.Series.dt.freq属性
# 283-1、检测频率与验证数据完整性
import pandas as pd
# 创建一个日频率的时间序列数据
date_range = pd.date_range(start='2024-01-01', periods=10, freq='D')
data = pd.Series(range(10), index=date_range)
print("时间序列的频率:", data.index.freq)
# 检查是否有缺失日期
expected_dates = pd.date_range(start='2024-01-01', end='2024-01-10', freq='D')
missing_dates = expected_dates.difference(data.index)
if len(missing_dates) > 0:
    print("缺失的日期:", missing_dates)
else:
    print("没有缺失的日期", end='\n\n')

# 283-2、重采样操作
import pandas as pd
# 创建一个小时频率的时间序列数据
hourly_range = pd.date_range(start='2024-01-01', periods=24, freq='h')
hourly_data = pd.Series(range(24), index=hourly_range)
print("原始数据的频率:", hourly_data.index.freq)
# 将小时频率的数据重采样为日频
daily_data = hourly_data.resample('D').sum()
print("重采样后的频率:", daily_data.index.freq)
print(daily_data, end='\n\n')

# 283-3、时间序列的绘图
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
# 配置字体,确保中文字符正常显示
matplotlib.rcParams['font.sans-serif'] = ['Microsoft YaHei']
# 创建一个月频率的时间序列数据
date_range = pd.date_range(start='2023-01-01', periods=12, freq='ME')
data = pd.Series(range(12), index=date_range)
print("时间序列的频率:", data.index.freq)
# 绘制时间序列图
plt.figure(figsize=(10, 5))
plt.plot(data.index, data, marker='o')
plt.title('时间序列图')
plt.xlabel('日期')
plt.ylabel('值')
plt.grid(True)
plt.show()

# 283-4、异常检测
import pandas as pd
# 创建一个不规则的时间序列数据
irregular_range = pd.to_datetime(['2024-01-01', '2024-01-02', '2024-01-04'])
irregular_data = pd.Series([1, 2, 3], index=irregular_range)
print("不规则时间序列的频率:", irregular_data.index.freq)
# 检查不规则时间序列的缺失日期
expected_dates = pd.date_range(start='2024-01-01', end='2024-01-04', freq='D')
missing_dates = expected_dates.difference(irregular_data.index)
if len(missing_dates) > 0:
    print("缺失的日期:", missing_dates)
else:
    print("没有缺失的日期")
283-6-3、结果输出
# 283、pandas.Series.dt.freq属性
# 283-1、检测频率与验证数据完整性
# 时间序列的频率: <Day>
# 没有缺失的日期

# 283-2、重采样操作
# 原始数据的频率: <Hour>
# 重采样后的频率: <Day>
# 2024-01-01    276
# Freq: D, dtype: int64

# 283-3、时间序列的绘图
# 见图1

# 283-4、异常检测
# 时间序列的频率: <MonthEnd>
# 不规则时间序列的频率: None
# 缺失的日期: DatetimeIndex(['2024-01-03'], dtype='datetime64[ns]', freq='D')

图1:

 

284、pandas.Series.dt.isocalendar属性
284-1、语法
# 284、pandas.Series.dt.isocalendar属性
pandas.Series.dt.isocalendar()
Calculate year, week, and day according to the ISO 8601 standard.

Returns:
DataFrame
With columns year, week and day.
284-2、参数

        无

284-3、功能

        可以从日期时间对象中提取ISO年、ISO周和ISO星期几的信息。

284-4、返回值

        返回一个DataFrame,其中包含三列:year、week和day。

284-5、说明

        使用场景:

284-5-1、财务分析:在财务分析中,经常需要基于周、月或季度来汇总数据,使用ISO周数可以确保所有数据按照一致的周次进行汇总和分析。例如,比较每周的销售数据,分析季节性趋势。

284-5-2、周报和计划安排:ISO周数用于生成周报,确保每个报告周期的数据准确,特别是在计划和项目管理中。例如,生成项目进度周报、员工工作计划。

284-5-3、周期性数据分析:在时间序列分析中,识别和分析周期性趋势或季节性波动是常见任务,使用ISO周数有助于准确定位每周的数据点。例如,分析周度流量、评估季节性商品销售。

284-5-4、数据清理和对齐:在处理来自不同时间区域的数据时,使用ISO日历可以帮助标准化日期,以便更好地合并和对齐数据。例如,合并不同来源的时间序列数据。

284-5-5、国际化业务:ISO周数在国际化业务中尤其重要,因为它避免了由于不同地区采用不同的周定义(如周一或周日为一周开始)而产生的日期混淆。例如,跨国公司的全球报告系统。

284-6、用法
284-6-1、数据准备
284-6-2、代码示例
# 284、pandas.Series.dt.isocalendar属性
# 284-1、财务分析
import pandas as pd
# 创建一个销售数据DataFrame
data = {
    'date': pd.date_range('2024-07-01', periods=10, freq='D'),
    'sales': [100, 150, 200, 250, 300, 350, 400, 450, 500, 550]
}
df = pd.DataFrame(data)
# 提取ISO年和周数
df['iso_year'] = df['date'].dt.isocalendar().year
df['iso_week'] = df['date'].dt.isocalendar().week
# 按ISO周汇总销售数据
weekly_sales = df.groupby(['iso_year', 'iso_week'])['sales'].sum().reset_index()
print(weekly_sales, end='\n\n')

# 284-2、周报和计划安排
import pandas as pd
# 创建一个项目进度DataFrame
data = {
    'task': ['Task A', 'Task B', 'Task C', 'Task D'],
    'start_date': pd.to_datetime(['2024-01-02', '2024-01-05', '2024-01-08', '2024-01-11']),
    'end_date': pd.to_datetime(['2024-01-06', '2024-01-09', '2024-01-12', '2024-01-15'])
}
df = pd.DataFrame(data)
# 提取ISO年和周数
df['start_week'] = df['start_date'].dt.isocalendar().week
df['end_week'] = df['end_date'].dt.isocalendar().week
# 输出结果
print(df, end='\n\n')

# 284-3、周期性数据分析
import pandas as pd
import matplotlib.pyplot as plt
# 创建一个流量数据 DataFrame
data = {
    'date': pd.date_range('2024-07-01', periods=30, freq='D'),
    'traffic': [500, 600, 700, 800, 900, 1000, 1100,
                1200, 1300, 1400, 1500, 1600, 1700, 1800,
                1900, 2000, 2100, 2200, 2300, 2400, 2500,
                2600, 2700, 2800, 2900, 3000, 3100, 3200,
                3300, 3400]
}
df = pd.DataFrame(data)
# 提取ISO周数
df['iso_week'] = df['date'].dt.isocalendar().week
# 按周汇总流量数据
weekly_traffic = df.groupby('iso_week')['traffic'].sum()
# 绘制流量趋势图
plt.plot(weekly_traffic.index, weekly_traffic.values)
plt.xlabel('ISO Week')
plt.ylabel('Traffic')
plt.title('Weekly Traffic Analysis')
plt.grid(True)
plt.show()

# 284-4、数据清理和对齐
import pandas as pd
# 创建两个来源的数据
data1 = {
    'date': pd.to_datetime(['2024-01-01', '2024-01-02', '2024-01-03']),
    'value': [10, 20, 30]
}
data2 = {
    'date': pd.to_datetime(['2024-01-04', '2024-01-05', '2024-01-06']),
    'value': [40, 50, 60]
}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 提取ISO年和周数
df1['iso_week'] = df1['date'].dt.isocalendar().week
df2['iso_week'] = df2['date'].dt.isocalendar().week
# 合并数据
merged_data = pd.concat([df1, df2]).reset_index(drop=True)
# 输出结果
print(merged_data, end='\n\n')

# 284-5、国际化业务
import pandas as pd
# 创建一个国际化日期数据DataFrame
data = {
    'region': ['US', 'EU', 'Asia'],
    'date': pd.to_datetime(['2024-01-01', '2024-01-02', '2024-01-03'])
}
df = pd.DataFrame(data)
# 提取 ISO 年和周数
df['iso_week'] = df['date'].dt.isocalendar().week
# 输出结果
print(df)
284-6-3、结果输出
# 284、pandas.Series.dt.isocalendar属性
# 284-1、财务分析
#    iso_year  iso_week  sales
# 0      2024        27   1750
# 1      2024        28   1500

# 284-2、周报和计划安排
#      task start_date   end_date  start_week  end_week
# 0  Task A 2024-01-02 2024-01-06           1         1
# 1  Task B 2024-01-05 2024-01-09           1         2
# 2  Task C 2024-01-08 2024-01-12           2         2
# 3  Task D 2024-01-11 2024-01-15           2         3

# 284-3、周期性数据分析
# 见图2

# 284-4、数据清理和对齐
#         date  value  iso_week
# 0 2024-01-01     10         1
# 1 2024-01-02     20         1
# 2 2024-01-03     30         1
# 3 2024-01-04     40         1
# 4 2024-01-05     50         1
# 5 2024-01-06     60         1

# 284-5、国际化业务
#   region       date  iso_week
# 0     US 2024-01-01         1
# 1     EU 2024-01-02         1
# 2   Asia 2024-01-03         1

图2:

 

285、pandas.Series.dt.to_period方法
285-1、语法
# 285、pandas.Series.dt.to_period方法
pandas.Series.dt.to_period(*args, **kwargs)
Cast to PeriodArray/PeriodIndex at a particular frequency.

Converts DatetimeArray/Index to PeriodArray/PeriodIndex.

Parameters:
freq
str or Period, optional
One of pandas’ period aliases or an Period object. Will be inferred by default.

Returns:
PeriodArray/PeriodIndex
Raises:
ValueError
When converting a DatetimeArray/Index with non-regular values, so that a frequency cannot be inferred.
285-2、参数

285-2-1、*args(可选)其他位置参数,为后续扩展功能做预留。

285-2-2、**kwargs(可选)其他关键字参数,为后续扩展功能做预留。

285-3、功能

        将Series对象中的日期时间数据转换为周期数据,这对于时间序列分析非常有用,例如,按月、按季度或按年汇总数据;通过指定不同的频率,可以将日期时间数据转换为不同的周期类型。

285-4、返回值

        返回一个新的Series对象,其中包含Period对象,Period是一个表示时间段的对象,例如一个月、一季度或一年等。

285-5、说明

        使用场景:

285-5-1、数据汇总:将高频数据(如每日数据)汇总到较低频率的数据(如月度、季度或年度),以便于统计分析和报告。例如,将每日销售数据汇总为月度销售数据;将每小时的温度记录汇总为每月的平均温度。

285-5-2、时间序列分析:按不同周期对数据进行分析,观察和比较不同周期的趋势和变化。例如,比较不同季度的销售额增长趋势;分析年度的气候变化模式。

285-5-3、数据对齐:在处理多个时间序列时,确保数据对齐到同一周期,以便进行进一步的比较和分析。例如,将两个不同频率的时间序列(如每日和每周数据)对齐到同一周期(如每月)。

285-5-4、绘制周期图表:将时间序列数据按指定周期进行绘制,以便更直观地展示数据趋势和变化。例如,绘制每月的销售额变化图;绘制每季度的气温变化图。

285-5-5、数据过滤:按指定周期过滤数据,以便仅分析和处理特定时间段的数据。例如,过滤出特定月份的数据;只处理特定年份的数据。

285-6、用法
285-6-1、数据准备
285-6-2、代码示例
# 285、pandas.Series.dt.to_period方法
# 285-1、数据汇总
import pandas as pd
# 创建包含每日销售数据的Series
date_series = pd.Series([100, 200, 150, 300, 250], index=pd.date_range("2024-01-01", periods=5, freq="D"))
# 转换为月度周期
period_series_month = date_series.resample('ME').sum()
print(period_series_month, end='\n\n')

# 285-2、时间序列分析
import pandas as pd
# 创建包含每日销售数据的Series
date_series = pd.Series([100, 200, 150, 300, 250, 400, 350, 450, 500, 600], index=pd.date_range("2024-01-01", periods=10, freq="D"))
# 转换为季度周期
period_series_quarter = date_series.to_period('Q').groupby(level=0).sum()
print(period_series_quarter, end='\n\n')

# 285-3、数据对齐
import pandas as pd
# 创建包含每日销售数据的Series
date_series_daily = pd.Series([100, 200, 150, 300, 250], index=pd.date_range("2024-01-01", periods=5, freq="D"))
# 创建包含每周销售数据的Series
date_series_weekly = pd.Series([700, 800], index=pd.date_range("2024-01-01", periods=2, freq="W"))
# 转换为月度周期并对齐
period_series_daily_month = date_series_daily.to_period('M').groupby(level=0).sum()
period_series_weekly_month = date_series_weekly.to_period('M').groupby(level=0).sum()
aligned_series = period_series_daily_month.add(period_series_weekly_month, fill_value=0)
print(aligned_series, end='\n\n')

# 285-4、绘制周期图表
import matplotlib.pyplot as plt
# 创建包含每日销售数据的Series
date_series = pd.Series([100, 200, 150, 300, 250, 400, 350, 450, 500, 600], index=pd.date_range("2024-01-01", periods=10, freq="D"))
# 转换为月度周期
period_series_month = date_series.to_period('M').groupby(level=0).sum()
# 绘制图表
period_series_month.plot(kind='bar')
plt.title('Monthly Sales')
plt.xlabel('Month')
plt.ylabel('Sales')
plt.show()

# 285-5、数据过滤
import pandas as pd
# 创建包含每日销售数据的Series
date_series = pd.Series([100, 200, 150, 300, 250, 400, 350, 450, 500, 600], index=pd.date_range("2024-01-01", periods=10, freq="D"))
# 转换为月度周期
period_series_month = date_series.to_period('M')
# 过滤出2024年1月份的数据
filtered_series = period_series_month[period_series_month.index == '2024-01']
print(filtered_series)
285-6-3、结果输出
# 285、pandas.Series.dt.to_period方法
# 285-1、数据汇总
# 2024-01-31    1000
# Freq: ME, dtype: int64

# 285-2、时间序列分析
# 2024Q1    3300
# Freq: Q-DEC, dtype: int64

# 285-3、数据对齐
# 2024-01    2500
# Freq: M, dtype: int64

# 285-4、绘制周期图表
# 见图3

# 285-5、数据过滤
# 2024-01    100
# 2024-01    200
# 2024-01    150
# 2024-01    300
# 2024-01    250
# 2024-01    400
# 2024-01    350
# 2024-01    450
# 2024-01    500
# 2024-01    600
# Freq: M, dtype: int64

图3:

 

二、推荐阅读

1、Python筑基之旅
2、Python函数之旅
3、Python算法之旅
4、Python魔法之旅
5、博客个人主页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1987691.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AndroidStudio 两种Debug模式

第一种&#xff1a;直接运行Debug 第二种&#xff1a;运行 attach debugger to android process 优缺点&#xff1a; 第一种是需要把整个工程运行起来&#xff0c;耗时&#xff0c; 第二种是触发式调试&#xff0c;在出错的情况下&#xff0c;经过判断在出错的地方&#xff0c;…

Leetcode75-6 反转字符串中的单词

思路 1. 先把全部字符串反转 然后按空格分割字符串 最后输出即可 有一个问题就是 多个空格的情况 需要用正则表达式 参考文章【JAVA学习之字符串分割空格】_如何将字符串用不确定的空格分开-CSDN博客 分割多个空格时可以需要用到正则表达式。。 正则表达式\s表示匹配任何空白字…

乡村振兴旅游综合体建设方案

1. 乡村振兴旅游综合体概述 乡村振兴旅游综合体建设方案旨在通过现代信息技术的应用&#xff0c;如云计算、物联网、大数据等&#xff0c;实现旅游行业的智慧化升级。该方案涵盖了游客、旅游管理部门、商家等不同角色的需求&#xff0c;以期提升旅游体验&#xff0c;推动乡村振…

OpenCV专栏介绍

在当今人工智能和计算机视觉领域&#xff0c;OpenCV作为一个功能强大的开源库&#xff0c;已经成为实现各种视觉算法的基石。本“OpenCV”专栏致力于帮助读者深入理解并掌握OpenCV的使用&#xff0c;从而在计算机视觉项目中发挥关键作用。 专栏导读 随着技术的不断进步&#…

免费代理池是什么,如何使用代理IP进行网络爬虫?

互联网是一个庞大的数据集合体&#xff0c;网络信息资源丰富且繁杂&#xff0c;想要从中找到自己需要的信息要花费较多的时间。为了解决这个问题&#xff0c;网络爬虫技术应运而生&#xff0c;它的主要作用就是在海量的互联网信息中进行爬取&#xff0c;抓取有效信息并存储。然…

【原型模式】设计模式系列:高效克隆的艺术(深入解析)

文章目录 Java设计模式之原型模式详解1. 引言2. 原型模式概述2.1 定义与基本原理2.2 原型模式与其他模式的关系2.3 使用场景分析 3. Java中的Cloneable接口3.1 Cloneable接口简介3.2 Object类中的clone方法3.3 实现Cloneable接口的步骤3.4 克隆方法的重写示例 4. 深克隆与浅克隆…

Django-Oscar开发独立站/外贸商城教程与问题记录

​特别说明&#xff1a; 本博客为个人开发Django-Oscar时的经验总结&#xff0c;方便后期维护&#xff01;&#xff08;第一次这么认真的记录这种大型项目&#xff0c;打个广告吧&#xff1a;本人可接单算法程序开发&#xff0c;包含深度学习和图像相关……等相关&#xff09;…

秒懂C++之stack、queue、堆

目录 前言 一.stack常用接口 二.stack模拟实现 三.例题 3.1 最小栈 题目解析&#xff1a; 算法解析&#xff1a; 代码&#xff1a; 3.2 栈的压入、弹出序列 题目解析: 算法解析&#xff1a; 代码&#xff1a; 3.3 逆波兰表达式求值 题目解析&#xff1a; 算法解析…

【Web】从TFCCTF-FUNNY浅析PHPCGI命令行注入漏洞利用

目录 背景 CVE-2012-1823 发散利用 法一&#xff1a;读文件 法二&#xff1a;数据外带 背景 CVE-2012-1823 PHP-CGI远程代码执行漏洞&#xff08;CVE-2012-1823&#xff09;分析 | 离别歌 省流&#xff1a; 命令行参数不光可以通过#!/usr/local/bin/php-cgi -d include…

目标检测 | yolov4 原理和介绍

1. 简介 YOLOv4是一种高效且准确的目标检测模型&#xff0c;它在YOLOv3的基础上引入了多项改进&#xff0c;这些改进主要集中在网络结构的优化和训练技巧的更新上。以下是YOLOv4中的一些关键技术或模块&#xff0c;它们对提高目标检测性能起到了重要作用&#xff1a; CSPDarkne…

MATLAB基础应用精讲-【数模应用】配对样本Wilcoxon检验(附MATLAB、R语言和python代码实现)

目录 知识储备 常用的统计假设检验的方法 算法原理 什么是Wilcoxon符号秩检验? 何时使用Wilcoxon符号秩检验 适用条件 SPSS-符号秩检验 一统计理论 二实例分析 三拓展知识 SAS --配对样本Wilcoxon符号秩检验 SPSSAU 配对样本Wilcoxon检验案例 1、背景 2、理论 …

【C++指南】函数重载:多态性的基石

&#x1f493; 博客主页&#xff1a;倔强的石头的CSDN主页 &#x1f4dd;Gitee主页&#xff1a;倔强的石头的gitee主页 ⏩ 文章专栏&#xff1a;《C指南》 期待您的关注 目录 引言 一、函数重载的概念 二、函数重载的原理 三、函数重载的应用场景 四、函数重载的规则 五…

springboot整合libreoffice(两种方式,使用本地和远程的libreoffice);docker中同时部署应用和libreoffice

一、 背景 因为项目中需要使用word转pdf功能&#xff0c;因为转换速度原因&#xff0c;最后选用了libreoffice&#xff0c;原因及部署请参考 linux ubuntu环境安装libreoffice&#xff0c;word转pdf 远程调用的话可选docker部署&#xff0c;请看2.3.1 二、springboot整合libr…

AT指令处理框架

<AT框架>做什么 <AT框架>介绍 ATFrame 流程 开启AT流程: ATCommandRegister(CSQ,EXEXCMD,NULL); 发送消息队列xQueueSend(ATcmdQueue,(void *) &RegcommandInfo,(TickType_t)100) AT主流程 ATCommandSendScheduler 等待开启xQueueReceive(ATcmdQueue, (voi…

详细分析python下载文件的两种方式(附Demo)

目录 前言1. 接口方式2. Nginx 前言 基本项目的构建推荐阅读&#xff1a;构建Flask前后端不分离项目&#xff08;附Python Demo&#xff09; 对于Java的基本知识&#xff0c;推荐阅读&#xff1a; java框架 零基础从入门到精通的学习路线 附开源项目面经等&#xff08;超全&…

Unknown input format pdf Pandoc can convert to PDF, but not from PDF.解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

【Lua运行环境安装及配置】

首先在百度搜索“Lua菜鸟教程” 网址&#xff1a;Lua 教程 | 菜鸟教程 (runoob.com) 找到环境安装 点击Github下载地址&#xff0c;GitHub可以在正规上网下进入网址&#xff08;页面更新不出来多试几次&#xff09; 点击.exe安装 下载完成后进行安装 可自定义磁盘 项目文件很…

线程局部变量(ThreadLocal)

线程局部变量&#xff08;ThreadLocal&#xff09; 1、什么是ThreadLocal&#xff1f;2、基本用法3、注意事项 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 1、什么是ThreadLocal&#xff1f; ThreadLocal 是 Java 中用于实现线程局部变…

IEC 61850标准协议解读 1.建模讲解

IEC61850协议标准和之前的101、104协议最大的区分就是在模型这里&#xff0c;模型可以说是一个变电站里面的智能设备的定义&#xff0c;里面定义了网络连接信息、数据上报方式、设备访问控制点等&#xff0c;所以说在不同系统的对接过程中&#xff0c;有了这么一个基于标准定义…

sqliabs靶场练习

关卡 熟悉Mqsql相关命令Less-1Less-2Less-3Less-4Less-5Less-6Less-7Less-8Less-9Less-10 熟悉Mqsql相关命令 首先先熟悉一下Mysql的相关命令&#xff0c;可能在SQL注入的时候会用到。 1.查询服务器主机信息 HOSTNAME 主机名称 datadir——数据库路径 version_compile_os—…