Python酷库之旅-第三方库Pandas(071)

news2025/1/22 17:48:58

目录

一、用法精讲

286、pandas.Series.dt.to_pydatetime方法

286-1、语法

286-2、参数

286-3、功能

286-4、返回值

286-5、说明

286-6、用法

286-6-1、数据准备

286-6-2、代码示例

286-6-3、结果输出

287、pandas.Series.dt.tz_localize方法

287-1、语法

287-2、参数

287-3、功能

287-4、返回值

287-5、说明

287-6、用法

287-6-1、数据准备

287-6-2、代码示例

287-6-3、结果输出

288、pandas.Series.dt.tz_convert方法

288-1、语法

288-2、参数

288-3、功能

288-4、返回值

288-5、说明

288-6、用法

288-6-1、数据准备

288-6-2、代码示例

288-6-3、结果输出

289、pandas.Series.dt.normalize方法

289-1、语法

289-2、参数

289-3、功能

289-4、返回值

289-5、说明

289-6、用法

289-6-1、数据准备

289-6-2、代码示例

289-6-3、结果输出

290、pandas.Series.dt.strftime函数

290-1、语法

290-2、参数

290-2-1、年份相关格式

290-2-2、月份相关格式

290-2-3、日期相关格式

290-2-4、星期相关格式

290-2-5、年中的日期格式

290-2-6、时间相关格式

290-2-7、时区和时间差格式

290-2-8、日期与时间组合格式

290-2-9、其他格式

290-3、功能

290-4、返回值

290-5、说明

290-6、用法

290-6-1、数据准备

290-6-2、代码示例

290-6-3、结果输出

二、推荐阅读

1、Python筑基之旅

2、Python函数之旅

3、Python算法之旅

4、Python魔法之旅

5、博客个人主页

一、用法精讲

286、pandas.Series.dt.to_pydatetime方法
286-1、语法
# 286、pandas.Series.dt.to_pydatetime方法
pandas.Series.dt.to_pydatetime()
Return the data as an array of datetime.datetime objects.

Deprecated since version 2.1.0: The current behavior of dt.to_pydatetime is deprecated. In a future version this will return a Series containing python datetime objects instead of a ndarray.

Timezone information is retained if present.

Warning

Python’s datetime uses microsecond resolution, which is lower than pandas (nanosecond). The values are truncated.

Returns:
numpy.ndarray
Object dtype array containing native Python datetime objects.
286-2、参数

        无

286-3、功能

        将pandas.Series中的日期时间类型值(如Timestamp对象)转换为Python原生的datetime对象数组,该方法在以下几种情况下特别有用:

286-3-1、与其他库的兼容性:有些库或函数只接受Python原生的datetime对象,而不接受pandas.Timestamp对象,这时可以使用该方法进行转换。

286-3-2、日期时间处理:在进行日期时间运算或处理时,有时需要使用Python的内置日期时间处理功能,该方法可以简化这种转换过程。

286-3-3、数据传递:当需要将数据传递给仅支持Python原生datetime对象的外部系统或接口时,可以使用此方法进行转换。

286-4、返回值

        返回一个numpy.ndarray,其中包含与原Series中的每个元素对应的datetime.datetime对象。换句话说,返回的数组中的每个元素都是原Series中Timestamp对象的Python原生datetime对象版本。

286-5、说明

        使用场景:

286-5-1、与其他库或函数的兼容性:许多库(如matplotlib、seaborn)和函数需要使用Python原生的datetime对象,而不是pandas的Timestamp对象。在这种情况下,可以使用to_pydatetime方法进行转换,从而确保兼容性。例如,在绘制时间序列图时,某些图形库可能只接受datetime对象。

286-5-2、日期时间处理:有时需要利用Python的内置日期时间处理功能来进行复杂的日期时间运算或处理,这些操作可能在datetime对象上更容易实现,因此可以先将pandas.Timestamp对象转换为datetime对象。例如,使用datetime的方法和属性(如weekday()、replace()等)进行特定的日期操作。

286-5-3、数据传递:当需要将数据传递给仅支持Python原生datetime对象的外部系统或接口时,可以使用该方法进行转换。例如,某些API或数据库接口只接受datetime对象,使用to_pydatetime方法可以确保数据格式的正确性。

286-5-4、调试和数据检查:在调试和数据检查过程中,有时需要查看或打印日期时间值的具体内容,使用datetime对象进行检查可能更直观,因为datetime对象的字符串表示形式比Timestamp对象更易读。

286-5-5、处理缺失数据:在处理缺失日期时间数据时,转换为datetime对象可以更方便地使用Python的原生方法进行处理。例如,可以利用datetime的min和max属性来处理缺失值。

286-6、用法
286-6-1、数据准备
286-6-2、代码示例
# 286、pandas.Series.dt.to_pydatetime方法
# 286-1、使用matplotlib绘制时间序列图
import pandas as pd
import matplotlib.pyplot as plt
# 创建包含日期时间值的Series
date_series = pd.Series(pd.date_range('2024-05-01', periods=10, freq='D'))
# 转换为Python datetime对象
dates = date_series.dt.to_pydatetime()
# 使用matplotlib绘制时间序列图
plt.plot(dates, range(10))
plt.xlabel('Date')
plt.ylabel('Value')
plt.title('Time Series Plot')
# 让x轴的标签斜着显示
plt.xticks(rotation=45)
plt.show()

# 286-2、使用原生datetime方法进行日期处理
import pandas as pd
# 创建包含日期时间值的Series
date_series = pd.Series(pd.date_range('2024-07-01', periods=5, freq='D'))
# 转换为Python datetime对象
dates = date_series.dt.to_pydatetime()
# 计算每个日期是星期几
weekdays = [date.weekday() for date in dates]
print(weekdays, end='\n\n')

# 286-3、将数据传递给支持datetime的接口
import pandas as pd
# 创建包含日期时间值的Series
date_series = pd.Series(pd.date_range('2024-08-01', periods=5, freq='D'))
# 转换为Python datetime对象
dates = date_series.dt.to_pydatetime()
# 假设有一个只接受datetime对象的函数
def process_dates(dates):
    for date in dates:
        print(f"Processing date: {date}")

# 286-4、处理缺失数据
import pandas as pd
from datetime import datetime
# 创建包含日期时间值和缺失值的Series
date_series = pd.Series([pd.Timestamp('2024-01-01'), pd.NaT, pd.Timestamp('2024-01-03')])
# 转换为Python datetime对象,并处理缺失值
dates = date_series.dt.to_pydatetime()
dates = [date if date is not pd.NaT else datetime.min for date in dates]
print(dates, end='\n\n')

# 286-5、与其他库兼容性
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# 创建包含日期时间值的DataFrame
df = pd.DataFrame({
    'date': pd.date_range('2024-07-01', periods=10, freq='D'),
    'value': range(10)
})
# 转换日期列为Python datetime对象
df['date'] = df['date'].dt.to_pydatetime()
# 使用 seaborn 绘制时间序列图
sns.lineplot(x='date', y='value', data=df)
plt.xlabel('Date')
plt.ylabel('Value')
plt.title('Time Series Plot with Seaborn')
# 让x轴的标签斜着显示
plt.xticks(rotation=45)
plt.show()
286-6-3、结果输出
# 286、pandas.Series.dt.to_pydatetime方法
# 286-1、使用matplotlib绘制时间序列图
# 见图1

# 286-2、使用原生datetime方法进行日期处理
# [0, 1, 2, 3, 4]

# 286-3、将数据传递给支持datetime的接口
# Processing date: 2024-08-01 00:00:00
# Processing date: 2024-08-02 00:00:00
# Processing date: 2024-08-03 00:00:00
# Processing date: 2024-08-04 00:00:00
# Processing date: 2024-08-05 00:00:00

# 286-4、处理缺失数据
# [datetime.datetime(2024, 1, 1, 0, 0), datetime.datetime(1, 1, 1, 0, 0), datetime.datetime(2024, 1, 3, 0, 0)]

# 286-5、与其他库兼容性
# 见图2

图1:

 

图2:

 

287、pandas.Series.dt.tz_localize方法
287-1、语法
# 287、pandas.Series.dt.tz_localize方法
pandas.Series.dt.tz_localize(*args, **kwargs)
Localize tz-naive Datetime Array/Index to tz-aware Datetime Array/Index.

This method takes a time zone (tz) naive Datetime Array/Index object and makes this time zone aware. It does not move the time to another time zone.

This method can also be used to do the inverse – to create a time zone unaware object from an aware object. To that end, pass tz=None.

Parameters:
tz
str, pytz.timezone, dateutil.tz.tzfile, datetime.tzinfo or None
Time zone to convert timestamps to. Passing None will remove the time zone information preserving local time.

ambiguous
‘infer’, ‘NaT’, bool array, default ‘raise’
When clocks moved backward due to DST, ambiguous times may arise. For example in Central European Time (UTC+01), when going from 03:00 DST to 02:00 non-DST, 02:30:00 local time occurs both at 00:30:00 UTC and at 01:30:00 UTC. In such a situation, the ambiguous parameter dictates how ambiguous times should be handled.

‘infer’ will attempt to infer fall dst-transition hours based on order

bool-ndarray where True signifies a DST time, False signifies a non-DST time (note that this flag is only applicable for ambiguous times)

‘NaT’ will return NaT where there are ambiguous times

‘raise’ will raise an AmbiguousTimeError if there are ambiguous times.

nonexistent
‘shift_forward’, ‘shift_backward, ‘NaT’, timedelta, default ‘raise’
A nonexistent time does not exist in a particular timezone where clocks moved forward due to DST.

‘shift_forward’ will shift the nonexistent time forward to the closest existing time

‘shift_backward’ will shift the nonexistent time backward to the closest existing time

‘NaT’ will return NaT where there are nonexistent times

timedelta objects will shift nonexistent times by the timedelta

‘raise’ will raise an NonExistentTimeError if there are nonexistent times.

Returns:
Same type as self
Array/Index converted to the specified time zone.

Raises:
TypeError
If the Datetime Array/Index is tz-aware and tz is not None.
287-2、参数

287-2-1、*args(可选)其他位置参数,为后续扩展功能做预留。

287-2-2、**kwargs(可选)其他关键字参数,具体包括以下参数:

287-2-2-1、tz(可选,默认值为None)字符串或pytz.timezone对象,指定要设置的时区,当传入None时,会移除现有的时区信息。

287-2-2-2、axis(可选,默认值为0)整数或字符串,指定应用于行还是列。

287-2-2-3、level(可选,默认值为0)整数或名称,在MultiIndex场景下,指定要本地化的索引级别。

287-2-2-4、copy(可选,默认值为True)布尔值,是否返回一个新的对象,如果为True,返回一个新的对象;如果为False,在原对象上进行操作。

287-2-2-5、ambiguous(可选,默认值为'raise')字符串或布尔型ndarray,处理夏令时(DST)变化期间的模糊时间,选项有:

  • 'raise':在模糊时间时引发错误(默认)。
  • 'NaT':将模糊时间标记为NaT。
  • 'shift_forward':将模糊时间移到DST结束后的时间。
  • 'shift_backward':将模糊时间移到DST开始前的时间。
  • 布尔型ndarray:明确标记每个时间是否为DST(True为DST)。

287-2-2-6、nonexistent(可选,默认值为'raise')字符串,处理夏令时变化期间不存在的时间,选项有:

  • 'raise':在不存在的时间时引发错误(默认)。
  • 'NaT':将不存在的时间标记为NaT。
  • 'shift_forward':将不存在的时间移到DST结束后的时间。
  • 'shift_backward':将不存在的时间移到DST开始前的时间。
287-3、功能

        将一个时间序列(datetime Series)本地化到指定的时区(timezone)。具体来说,它可以将一个“天真时间”(naive datetime,即没有时区信息的时间)或已有时区信息的时间序列转换为具有指定时区的时间序列。

287-4、返回值

        返回一个新的时间序列,这个序列中的每个时间点都包含了指定的时区信息,返回的时间序列类型为pandas.Series,其元素为pandas.Timestamp对象,这些对象具有时区信息。

287-5、说明

        无

287-6、用法
287-6-1、数据准备
287-6-2、代码示例
# 287、pandas.Series.dt.tz_localize方法
# 287-1、时区本地化
import pandas as pd
# 创建没有时区信息的时间序列
naive_series = pd.Series(pd.date_range('2024-08-01', periods=3, freq='D'))
# 打印原始数据
print("原始时间序列:")
print(naive_series)
# 将时间序列本地化到UTC时区
localized_series = naive_series.dt.tz_localize('UTC')
# 打印本地化后的时间序列
print("本地化到UTC时区后的时间序列:")
print(localized_series, end='\n\n')

# 287-2、数据一致性
import pandas as pd
# 创建两个不同的时间序列,分别在不同的时区
series1 = pd.Series(pd.date_range('2024-08-01', periods=3, freq='D', tz='UTC'))
series2 = pd.Series(pd.date_range('2024-08-01', periods=3, freq='D', tz='Asia/Kolkata'))
# 打印原始数据
print("不同来源的时间序列:")
print("Series 1(UTC):")
print(series1)
print("Series 2(Asia/Kolkata):")
print(series2)
# 将所有数据转换到UTC时区
series2 = series2.dt.tz_convert('UTC')
# 打印转换后的时间序列
print("转换到UTC时区后的时间序列:")
print(series2, end='\n\n')

# 287-3、夏令时处理
import pandas as pd
# 创建一个包含夏令时变化的时间序列
dst_series = pd.Series(pd.date_range('2024-03-13 01:00', periods=3, freq='h'))
# 打印原始数据
print("包含夏令时变化的原始时间序列:")
print(dst_series)
# 处理夏令时模糊时间
localized_dst_series = dst_series.dt.tz_localize('US/Eastern', ambiguous='shift_forward')
# 打印处理后的时间序列
print("处理夏令时模糊时间后的时间序列(shift_forward):")
print(localized_dst_series)
# 处理夏令时不存在的时间
localized_nonexistent_series = dst_series.dt.tz_localize('US/Eastern', nonexistent='shift_forward')
# 打印处理后的时间序列
print("处理夏令时不存在时间后的时间序列(shift_forward):")
print(localized_nonexistent_series, end='\n\n')

# 287-4、数据转换和展示
import pandas as pd
# 创建在UTC时区的时间序列
utc_series = pd.Series(pd.date_range('2024-08-01', periods=3, freq='D', tz='UTC'))
# 打印原始数据
print("UTC时区的原始时间序列:")
print(utc_series)
# 转换到用户所在的时区(America/New_York)
user_tz_series = utc_series.dt.tz_convert('America/New_York')
# 打印转换后的时间序列
print("转换到用户所在时区(America/New_York)后的时间序列:")
print(user_tz_series, end='\n\n')

# 287-5、数据存储和传输
import pandas as pd
# 创建没有时区信息的时间序列
naive_series = pd.Series(pd.date_range('2024-08-01', periods=3, freq='D'))
# 将时间序列本地化到UTC时区用于存储
store_series = naive_series.dt.tz_localize('UTC')
# 打印存储的时间序列
print("本地化到UTC时区以存储的时间序列:")
print(store_series)
# 读取数据后转换到本地时区(Asia/Shanghai)
local_series = store_series.dt.tz_convert('Asia/Shanghai')
# 打印转换后的时间序列
print("转换到本地时区(Asia/Shanghai)后的时间序列:")
print(local_series)
287-6-3、结果输出
# 287、pandas.Series.dt.tz_localize方法
# 287-1、时区本地化
# 原始时间序列:
# 0   2024-08-01
# 1   2024-08-02
# 2   2024-08-03
# dtype: datetime64[ns]
# 本地化到UTC时区后的时间序列:
# 0   2024-08-01 00:00:00+00:00
# 1   2024-08-02 00:00:00+00:00
# 2   2024-08-03 00:00:00+00:00
# dtype: datetime64[ns, UTC]

# 287-2、数据一致性
# 不同来源的时间序列:
# Series 1(UTC):
# 0   2024-08-01 00:00:00+00:00
# 1   2024-08-02 00:00:00+00:00
# 2   2024-08-03 00:00:00+00:00
# dtype: datetime64[ns, UTC]
# Series 2(Asia/Kolkata):
# 0   2024-08-01 00:00:00+05:30
# 1   2024-08-02 00:00:00+05:30
# 2   2024-08-03 00:00:00+05:30
# dtype: datetime64[ns, Asia/Kolkata]
# 转换到UTC时区后的时间序列:
# 0   2024-07-31 18:30:00+00:00
# 1   2024-08-01 18:30:00+00:00
# 2   2024-08-02 18:30:00+00:00
# dtype: datetime64[ns, UTC]

# 287-3、夏令时处理
# 包含夏令时变化的原始时间序列:
# 0   2024-03-13 01:00:00
# 1   2024-03-13 02:00:00
# 2   2024-03-13 03:00:00
# dtype: datetime64[ns]
# 处理夏令时模糊时间后的时间序列(shift_forward):
# 0   2024-03-13 01:00:00-04:00
# 1   2024-03-13 02:00:00-04:00
# 2   2024-03-13 03:00:00-04:00
# dtype: datetime64[ns, US/Eastern]
# 处理夏令时不存在时间后的时间序列(shift_forward):
# 0   2024-03-13 01:00:00-04:00
# 1   2024-03-13 02:00:00-04:00
# 2   2024-03-13 03:00:00-04:00
# dtype: datetime64[ns, US/Eastern]

# 287-4、数据转换和展示
# UTC时区的原始时间序列:
# 0   2024-08-01 00:00:00+00:00
# 1   2024-08-02 00:00:00+00:00
# 2   2024-08-03 00:00:00+00:00
# dtype: datetime64[ns, UTC]
# 转换到用户所在时区(America/New_York)后的时间序列:
# 0   2024-07-31 20:00:00-04:00
# 1   2024-08-01 20:00:00-04:00
# 2   2024-08-02 20:00:00-04:00
# dtype: datetime64[ns, America/New_York]

# 287-5、数据存储和传输
# 本地化到UTC时区以存储的时间序列:
# 0   2024-08-01 00:00:00+00:00
# 1   2024-08-02 00:00:00+00:00
# 2   2024-08-03 00:00:00+00:00
# dtype: datetime64[ns, UTC]
# 转换到本地时区(Asia/Shanghai)后的时间序列:
# 0   2024-08-01 08:00:00+08:00
# 1   2024-08-02 08:00:00+08:00
# 2   2024-08-03 08:00:00+08:00
# dtype: datetime64[ns, Asia/Shanghai]
288、pandas.Series.dt.tz_convert方法
288-1、语法
# 288、pandas.Series.dt.tz_convert方法
pandas.Series.dt.tz_convert(*args, **kwargs)
Convert tz-aware Datetime Array/Index from one time zone to another.

Parameters:
tz
str, pytz.timezone, dateutil.tz.tzfile, datetime.tzinfo or None
Time zone for time. Corresponding timestamps would be converted to this time zone of the Datetime Array/Index. A tz of None will convert to UTC and remove the timezone information.

Returns:
Array or Index
Raises:
TypeError
If Datetime Array/Index is tz-naive.
288-2、参数

288-2-1、tz(必须)指定目标时区,可以是字符串(例如'US/Eastern','Europe/London'),也可以是pytz或者dateutil.tz模块中的时区对象。

288-2-2、axis(可选,默认值为0)在Series对象上无效,仅用于DataFrame对象。

288-2-3、level(可选,默认值为None)如果索引中有多级索引,则可以指定要转换时区的级别,此参数在Series中通常不使用。

288-2-4、copy(可选,默认值为True)是否复制底层数据,如果设置为False,则会就地修改现有数据,而不是创建数据的副本。

288-3、功能

        用于将datetime数据从一种时区转换到另一种时区的方法。

288-4、返回值

        返回值是一个新的pandas.Series对象,包含转换到目标时区的时间戳。

288-5、说明

        使用场景:

288-5-1、数据标准化和统一:在处理来自不同时区的数据时,使用该方法可以将所有时间戳转换到同一时区,方便后续的数据分析和比较。

288-5-2、时间序列分析:在进行时间序列分析时,确保所有时间戳在同一时区可以避免因时区差异引起的误差,尤其是在计算统计量或绘制图表时。

288-5-3、日志文件处理:在分析服务器日志文件时,不同服务器可能位于不同的时区,通过该方法将时间戳统一转换到同一时区,可以更容易地进行统一分析和排查问题。

288-5-4、金融数据分析:金融市场的数据常常涉及多个时区,例如纽约(EST)、伦敦(GMT)和东京(JST),使用该方法可以将数据转换到交易时区,从而准确分析交易行为。

288-5-5、多时区日程安排:在处理跨时区的会议和日程安排时,可以使用该方法将所有时间戳转换到参与者的本地时区,确保时间安排准确无误。

288-6、用法
288-6-1、数据准备
288-6-2、代码示例
# 288、pandas.Series.dt.tz_convert方法
# 288-1、数据标准化和统一
import pandas as pd
# 创建包含不同时区的时间序列数据
data = {
    'datetime': ['2024-01-01 09:30:00', '2024-01-01 13:00:00', '2024-01-01 18:00:00'],
    'price': [100, 102, 105]
}
df = pd.DataFrame(data)
df['datetime'] = pd.to_datetime(df['datetime'])
# 假设这些时间戳来自不同的时区
df['datetime'] = df['datetime'].dt.tz_localize('US/Eastern')
# 将时间戳转换为UTC
df['datetime_utc'] = df['datetime'].dt.tz_convert('UTC')
print(df, end='\n\n')

# 288-2、时间序列分析
import pandas as pd
# 创建时间序列数据
data = {
    'datetime': ['2024-01-01 09:30:00', '2024-01-01 10:00:00', '2024-01-01 15:00:00'],
    'price': [100, 102, 105]
}
df = pd.DataFrame(data)
df['datetime'] = pd.to_datetime(df['datetime'])
# 假设这些时间戳是纽约时间(Eastern Time)
df['datetime'] = df['datetime'].dt.tz_localize('US/Eastern')
# 将时间戳转换为伦敦时间(GMT)
df['datetime_gmt'] = df['datetime'].dt.tz_convert('Europe/London')
print(df, end='\n\n')

# 288-3、日志文件处理
import pandas as pd
# 创建日志数据
data = {
    'timestamp': ['2024-01-01 01:00:00', '2024-01-01 04:00:00', '2024-01-01 07:00:00'],
    'event': ['start', 'process', 'end']
}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 假设这些时间戳是UTC
df['timestamp'] = df['timestamp'].dt.tz_localize('UTC')
# 将时间戳转换为服务器本地时间(假设为美国太平洋时间)
df['timestamp_pacific'] = df['timestamp'].dt.tz_convert('US/Pacific')
print(df, end='\n\n')

# 288-4、金融数据分析
import pandas as pd
# 创建金融市场数据
data = {
    'trade_time': ['2024-01-01 09:30:00', '2024-01-01 10:00:00', '2024-01-01 15:00:00'],
    'price': [100, 102, 105]
}
df = pd.DataFrame(data)
df['trade_time'] = pd.to_datetime(df['trade_time'])
# 假设这些时间戳是东京时间(JST)
df['trade_time'] = df['trade_time'].dt.tz_localize('Asia/Tokyo')
# 将时间戳转换为纽约时间(Eastern Time)
df['trade_time_eastern'] = df['trade_time'].dt.tz_convert('US/Eastern')
print(df, end='\n\n')

# 288-5、多时区日程安排
import pandas as pd
# 创建会议安排数据
data = {
    'meeting_time': ['2024-01-01 10:00:00', '2024-01-01 14:00:00', '2024-01-01 20:00:00'],
    'agenda': ['Project Update', 'Team Meeting', 'Client Call']
}
df = pd.DataFrame(data)
df['meeting_time'] = pd.to_datetime(df['meeting_time'])
# 假设这些时间戳是伦敦时间(GMT)
df['meeting_time'] = df['meeting_time'].dt.tz_localize('Europe/London')
# 将时间戳转换为参与者的本地时区(假设为印度标准时间 IST)
df['meeting_time_ist'] = df['meeting_time'].dt.tz_convert('Asia/Kolkata')
print(df, end='\n\n')

# 288-6、股票价格时间序列可视化
import pandas as pd
import matplotlib.pyplot as plt
# 创建包含不同时区的时间序列数据
data = {
    'datetime': ['2024-01-01 09:30:00', '2024-01-01 13:00:00', '2024-01-01 18:00:00'],
    'price': [100, 102, 105]
}
df = pd.DataFrame(data)
df['datetime'] = pd.to_datetime(df['datetime'])
# 假设这些时间戳来自不同的时区
df['datetime'] = df['datetime'].dt.tz_localize('US/Eastern')
# 将时间戳转换为 UTC
df['datetime_utc'] = df['datetime'].dt.tz_convert('UTC')
# 绘制时间序列图
plt.figure(figsize=(10, 6))
plt.plot(df['datetime_utc'], df['price'], marker='o', linestyle='-', color='b')
plt.title('Stock Prices Over Time (UTC)')
plt.xlabel('Time (UTC)')
plt.ylabel('Price')
plt.grid(True)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
288-6-3、结果输出
# 288、pandas.Series.dt.tz_convert方法
# 288-1、数据标准化和统一
#                    datetime  price              datetime_utc
# 0 2024-01-01 09:30:00-05:00    100 2024-01-01 14:30:00+00:00
# 1 2024-01-01 13:00:00-05:00    102 2024-01-01 18:00:00+00:00
# 2 2024-01-01 18:00:00-05:00    105 2024-01-01 23:00:00+00:00

# 288-2、时间序列分析
#                    datetime  price              datetime_gmt
# 0 2024-01-01 09:30:00-05:00    100 2024-01-01 14:30:00+00:00
# 1 2024-01-01 10:00:00-05:00    102 2024-01-01 15:00:00+00:00
# 2 2024-01-01 15:00:00-05:00    105 2024-01-01 20:00:00+00:00

# 288-3、日志文件处理
#                   timestamp    event         timestamp_pacific
# 0 2024-01-01 01:00:00+00:00    start 2023-12-31 17:00:00-08:00
# 1 2024-01-01 04:00:00+00:00  process 2023-12-31 20:00:00-08:00
# 2 2024-01-01 07:00:00+00:00      end 2023-12-31 23:00:00-08:00

# 288-4、金融数据分析
#                  trade_time  price        trade_time_eastern
# 0 2024-01-01 09:30:00+09:00    100 2023-12-31 19:30:00-05:00
# 1 2024-01-01 10:00:00+09:00    102 2023-12-31 20:00:00-05:00
# 2 2024-01-01 15:00:00+09:00    105 2024-01-01 01:00:00-05:00

# 288-5、多时区日程安排
#                meeting_time          agenda          meeting_time_ist
# 0 2024-01-01 10:00:00+00:00  Project Update 2024-01-01 15:30:00+05:30
# 1 2024-01-01 14:00:00+00:00    Team Meeting 2024-01-01 19:30:00+05:30
# 2 2024-01-01 20:00:00+00:00     Client Call 2024-01-02 01:30:00+05:30

# 288-6、股票价格时间序列可视化
# 见图3

图3:

 

289、pandas.Series.dt.normalize方法
289-1、语法
# 289、pandas.Series.dt.normalize方法
pandas.Series.dt.normalize(*args, **kwargs)
Convert times to midnight.

The time component of the date-time is converted to midnight i.e. 00:00:00. This is useful in cases, when the time does not matter. Length is unaltered. The timezones are unaffected.

This method is available on Series with datetime values under the .dt accessor, and directly on Datetime Array/Index.

Returns:
DatetimeArray, DatetimeIndex or Series
The same type as the original data. Series will have the same name and index. DatetimeIndex will have the same name.
289-2、参数

289-2-1、*args(可选)其他位置参数,为后续扩展功能做预留。

289-2-2、**kwargs(可选)其他关键字参数,为后续扩展功能做预留。

289-3、功能

        用于将带有时间信息的时间戳序列转换为只有日期的时间戳,即将所有时间部分设为午夜 (00:00:00),但保留时区信息(如果有的话)。

289-4、返回值

        返回一个新的pandas.Series对象,其中每个时间戳的时间部分被归零,只保留日期部分。

289-5、说明

        使用场景:

289-5-1、数据聚合:当需要对数据按天进行聚合时,该方法可以将时间部分归零,使得不同时间的记录可以被归类到同一天进行统计。

289-5-2、时间序列对齐:在对齐两个不同时间戳的时间序列时,如果只关心日期部分,可以使用该方法将它们对齐到同一天。

289-5-3、数据筛选:当需要筛选出某一天的所有记录时,可以先将时间部分归零,然后根据日期进行筛选。

289-5-4、可视化:在进行时间序列数据的可视化时,有时只需要按天显示数据,可以使用该方法将时间部分去掉。

289-5-5、数据清洗:在数据清洗过程中,可能需要统一数据的时间部分,例如去除错误或不一致的时间信息,只保留日期部分。

289-6、用法
289-6-1、数据准备
289-6-2、代码示例
# 289、pandas.Series.dt.normalize方法
# 289-1、数据聚合
import pandas as pd
# 示例数据
data = {'timestamp': ['2024-01-01 09:30:00', '2024-01-01 15:45:00', '2024-01-02 10:00:00'],
        'value': [10, 20, 30]}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 将时间归零
df['date'] = df['timestamp'].dt.normalize()
# 按日期聚合
daily_sum = df.groupby('date')['value'].sum()
print(daily_sum, end='\n\n')

# 289-2、时间序列对齐
import pandas as pd
# 创建两个时间序列
series1 = pd.Series([1, 2, 3], index=pd.date_range('2024-01-01 09:00', periods=3, freq='h'))
series2 = pd.Series([4, 5, 6], index=pd.date_range('2024-01-01 10:00', periods=3, freq='h'))
# 将时间归零
series1.index = series1.index.normalize()
series2.index = series2.index.normalize()
# 对齐操作
aligned_series = series1 + series2
print(aligned_series, end='\n\n')

# 289-3、数据筛选
import pandas as pd
# 示例数据
data = {'timestamp': ['2024-01-01 09:30:00', '2024-01-01 15:45:00', '2024-01-02 10:00:00'],
        'value': [10, 20, 30]}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 将时间归零
df['date'] = df['timestamp'].dt.normalize()
# 筛选特定日期的记录
specific_date_records = df[df['date'] == '2024-01-01']
print(specific_date_records, end='\n\n')

# 289-4、可视化
import pandas as pd
import matplotlib.pyplot as plt
# 示例数据
data = {'timestamp': pd.date_range('2024-01-01', periods=100, freq='h'),
        'value': range(100)}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 将时间归零
df['date'] = df['timestamp'].dt.normalize()
# 按日期聚合
daily_data = df.groupby('date')['value'].mean()
# 可视化
daily_data.plot(kind='bar', color='purple')
plt.xticks(rotation=15)
plt.show()

# 289-5、数据清洗
import pandas as pd
# 示例数据
data = {'timestamp': ['2024-01-01 09:30:00', '2024-01-01 15:45:00', '2024-01-02 10:00:00'],
        'value': [10, 20, 30]}
df = pd.DataFrame(data)
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 将时间归零,清洗数据
df['timestamp'] = df['timestamp'].dt.normalize()
print(df)
289-6-3、结果输出
# 289、pandas.Series.dt.normalize方法
# 289-1、数据聚合
# date
# 2024-01-01    30
# 2024-01-02    30
# Name: value, dtype: int64

# 289-2、时间序列对齐
# 2024-01-01    5
# 2024-01-01    7
# 2024-01-01    9
# dtype: int64

# 289-3、数据筛选
#             timestamp  value       date
# 0 2024-01-01 09:30:00     10 2024-01-01
# 1 2024-01-01 15:45:00     20 2024-01-01

# 289-4、可视化
# 见图4

# 289-5、数据清洗
#    timestamp  value
# 0 2024-01-01     10
# 1 2024-01-01     20
# 2 2024-01-02     30

图4:

 

290、pandas.Series.dt.strftime函数
290-1、语法
# 290、pandas.Series.dt.strftime函数
pandas.Series.dt.strftime(*args, **kwargs)
Convert to Index using specified date_format.

Return an Index of formatted strings specified by date_format, which supports the same string format as the python standard library. Details of the string format can be found in python string format doc.

Formats supported by the C strftime API but not by the python string format doc (such as “%R”, “%r”) are not officially supported and should be preferably replaced with their supported equivalents (such as “%H:%M”, “%I:%M:%S %p”).

Note that PeriodIndex support additional directives, detailed in Period.strftime.

Parameters:
date_format
str
Date format string (e.g. “%Y-%m-%d”).

Returns:
ndarray[object]
NumPy ndarray of formatted strings.
290-2、参数

        format(必须)指定datetime对象应表示为字符串的格式,格式代码类似于Python内置的datetime.strftime函数,格式代码详情如下:

290-2-1、年份相关格式
  • %Y: 带世纪的年份,十进制数(例如,2024)
  • %y: 不带世纪的年份,十进制数(例如,24)
290-2-2、月份相关格式
  • %m:月份,零填充的十进制数(例如,08)
  • %B:完整的月份名称(例如,August)
  • %b: 缩写的月份名称(例如,Aug)
  • %h: 与%b相同(例如,Aug)
290-2-3、日期相关格式
  • %d: 一个月中的第几天,零填充的十进制数(例如,07)
  • %e: 一个月中的第几天,不填充零(例如,7)
290-2-4、星期相关格式
  • %A完整的星期名称(例如,Wednesday)
  • %a缩写的星期名称(例如,Wed)
  • %w星期中的第几天,数字表示,星期天为0(例如,3)
  • %u: 星期中的第几天,数字表示,星期一为1(例如,3)
290-2-5、年中的日期格式
  • %j: 一年中的第几天,零填充的十进制数(例如,219)
290-2-6、时间相关格式
  • %H:小时(24小时制),零填充的十进制数(例如,14)
  • %I小时(12小时制),零填充的十进制数(例如,02)
  • %pAM或PM指示符
  • %M分钟,零填充的十进制数(例如,30)
  • %S秒,零填充的十进制数(例如,59)
  • %f微秒,零填充的十进制数(例如,000000)
290-2-7、时区和时间差格式
  • %zUTC偏移的时差(例如,+0000)
  • %Z 时区名称(例如,UTC)
290-2-8、日期与时间组合格式
  • %c日期和时间的完整字符串表示(例如,Wed Aug 07 14:30:59 2024)
  • %x日期的字符串表示(例如,08/07/24)
  • %X时间的字符串表示(例如,14:30:59)
290-2-9、其他格式
  • %%:字符"%"本身
290-3、功能

        用于将pandas系列中的datetime对象转换为格式化的字符串,该函数在需要以特定格式表示日期和时间信息用于报告或展示时特别有用。

290-4、返回值

        返回一个新的pandas系列,其中包含根据指定格式表示的格式化日期和时间值的字符串。

290-5、说明

        使用场景:

290-5-1、日志记录:在记录日志时,需要精确记录事件发生的时间,通过strftime可以将时间戳格式化为标准化的日志记录格式。

290-5-2、数据导出:在导出数据时,通常需要将日期和时间格式化为可读性强且标准化的形式,以便在Excel或其他工具中查看。

290-5-3、Web应用展示:在Web应用中,需要将后台的日期时间数据转换为用户友好的格式进行展示。

290-5-4、文件命名:在创建文件时,可以使用当前时间作为文件名的一部分,以避免命名冲突。

290-5-5、用户输入解析:在处理用户输入的日期时间时,需要将字符串解析为日期对象进行计算或比较,同时也需要将结果格式化为用户可读的形式。

290-5-6、自动化报告:在生成自动化报告时,通常需要在报告中包含生成时间,以便追踪报告的生成日期。

290-6、用法
290-6-1、数据准备
290-6-2、代码示例
# 290、pandas.Series.dt.strftime函数
# 290-1、日志记录
import logging
from datetime import datetime
logging.basicConfig(level=logging.INFO)
now = datetime.now()
formatted_time = now.strftime('%Y-%m-%d %H:%M:%S')
logging.info(f'Event occurred at {formatted_time}')

# 290-2、数据导出
import pandas as pd
data = {'timestamp': pd.to_datetime(['2024-08-07 14:30:59', '2024-12-25 09:15:00'])}
df = pd.DataFrame(data)
df['formatted_date'] = df['timestamp'].dt.strftime('%Y-%m-%d %H:%M:%S')
df.to_csv('exported_data.csv', index=False)

# 290-3、Web应用展示
from flask import Flask, render_template_string
from datetime import datetime
app = Flask(__name__)
@app.route('/')
def index():
    now = datetime.now()
    formatted_time = now.strftime('%Y-%m-%d %H:%M:%S')
    return render_template_string('<p>Current time: {{ time }}</p>', time=formatted_time)
if __name__ == '__main__':
    app.run()

# 290-4、文件命名
from datetime import datetime
now = datetime.now()
formatted_time = now.strftime('%Y%m%d_%H%M%S')
filename = f'backup_{formatted_time}.zip'
print(filename)

# 290-5、用户输入解析
from datetime import datetime
user_input = '2024-08-07 14:30:59'
parsed_date = datetime.strptime(user_input, '%Y-%m-%d %H:%M:%S')
formatted_date = parsed_date.strftime('%B %d, %Y at %I:%M %p')
print(formatted_date)

# 290-6、自动化报告
from datetime import datetime
now = datetime.now()
formatted_time = now.strftime('%Y-%m-%d %H:%M:%S')
report_content = f'Report generated on {formatted_time}\n...'
with open('report.txt', 'w') as file:
    file.write(report_content)
290-6-3、结果输出
# 290、pandas.Series.dt.strftime函数
# 输出结果类似于:
# INFO:root:Event occurred at 2024-08-07 21:10:26
# INFO:numexpr.utils:NumExpr defaulting to 4 threads.
#  * Serving Flask app 'test1'
#  * Debug mode: off
# INFO:werkzeug:WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.
#  * Running on http://127.0.0.1:5000
# INFO:werkzeug:Press CTRL+C to quit
# backup_20240807_211032.zip
# August 07, 2024 at 02:30 PM

二、推荐阅读

1、Python筑基之旅
2、Python函数之旅
3、Python算法之旅
4、Python魔法之旅
5、博客个人主页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1990990.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Selenium 自动化测试最佳实践

1 编码前的准备工作与基本指导思想 测试一个网站就是针对该网站测试场景的一次项目开发&#xff0c;所以项目开发中的理念与思想可以借鉴过来。接到测试需求后&#xff0c;不要一开始就陷入按钮、字段、下拉框等页面元素怎么操作的技术细节当中&#xff0c;而要站在最终用户的…

《MySQL数据库》 可视化工具的使用—/—<3>

一、如何使用可视化工具navicat 1、点击左上角的连接中的MySQL 输入主机地址连接虚拟机&#xff0c;找到自己虚拟机中的ip地址输入即可&#xff0c;连接名随意修改 然后点击测试连接&#xff0c;连接成功即可点击确定 2、新建库 直接鼠标右击连接名称ahao001&#xff0c;点击…

react学习笔记:7

预览&#xff1a;&#xff08;fetch发送请求、SPA、连续解构赋值、消息订阅、react router路由第三方库&#xff09; 1、连续解构赋值 总结&#xff1a; 1、连续解构赋值的写法&#xff1a;对象包对象&#xff0c;第二个解构的value一定也是在{}内部的写法 2、消息订阅发布 …

SwiftUI 中 TabView 视图导航栏上按钮丢失问题的解决

问题现象 在某些情况下,SwiftUI 中 TabView 子视图中导航栏上的 ToolbarItem 会消失不见。 如上图所示:在子视图的 Kick Off 导航栏按钮被按下并回退到 TabView 中的主视图之后,其右上角的按钮竟然“神奇”的消失了!该如何解决它呢? 在本篇博文中,您将学到以下内容 问题…

【二分查找】3143. 正方形中的最多点数

本文涉及的基础知识点 C二分查找 LeetCode3143. 正方形中的最多点数 给你一个二维数组 points 和一个字符串 s &#xff0c;其中 points[i] 表示第 i 个点的坐标&#xff0c;s[i] 表示第 i 个点的 标签 。 如果一个正方形的中心在 (0, 0) &#xff0c;所有边都平行于坐标轴&…

大数据-Big Data

GPT-4o (OpenAI) 大数据&#xff08;Big Data&#xff09;指的是无法使用传统方法和工具在合理的时间内处理和分析的大规模数据集。大数据通常具有以下几种特征&#xff0c;也称为5V特征&#xff1a; 1. Volume&#xff08;数据量&#xff09;&#xff1a;大数据涉及到大量的信…

深度学习常用语句for param in params问题:为什么修改param之后,params对应元素也随之改变?

def sgd(params, lr, batch_size): #save"""小批量随机梯度下降"""with torch.no_grad():for param in params:param - lr * param.grad / batch_sizeparam.grad.zero_()sgd([w, b], lr, batch_size) 上述代码中&#xff0c;param遍历params的…

深度学习--------------Kaggle房价预测

目录 下载和缓存数据集访问和读取数据集总代码 数据预处理训练K折交叉验证模型选择总代码提交你的Kaggle预测提交Kaggle 下载和缓存数据集 import hashlib import os import tarfile import zipfile import requests# download传递的参数分别是数据集的名称、缓存文件夹的路径…

LabVIEW液压传动系统

开发了一种高效的液压传动系统&#xff0c;其特点在于采用LabVIEW软件与先进的硬件配合&#xff0c;实现能量的有效回收。此系统主要应用于工业机械中&#xff0c;如工程机械和船机械等&#xff0c;通过优化液压泵和马达的测试台设计&#xff0c;显著提高系统的能效和操作性能。…

华为OD机试 - 最长子字符串的长度(二) (Java 2024 D卷 100分)

华为OD机试 2024D卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&#xff08;D卷C卷A卷B卷&#xff09;》。 刷的越多&#xff0c;抽中的概率越大&#xff0c;私信哪吒&#xff0c;备注华为OD&#xff0c;加入华…

为什么要推荐R语言?欢迎订阅专栏《R 探索临床数据科学》

统计分析的强大支持&#xff1a; R语言最初是为统计分析而设计的&#xff0c;至今仍然在这方面保持领先地位。无论是基础统计、回归分析、时间序列分析还是高级统计建模&#xff0c;R都能提供丰富的函数和包&#xff0c;帮助我们轻松实现各种统计分析&#xff0c;很简单的代码就…

搭建个人博客需要做哪些事

文章目录 前言搭建步骤站点服务器站点域名注册域名ICP 备案公安备案域名解析 博客图床图床是什么图床搭建 博客站点搭建建站工具本地搭建博客部署 站点运营百度收录百度统计 总结 前言 花了几天时间&#xff0c;搭建了一个个人博客&#xff0c;也算是完成了年初立的一个flag&a…

VSCODE调试程序

1、打开 2、具体测试过程 &#xff08;1&#xff09;把路径改成真正执行的程序的绝对路径&#xff08;${workspaceFolder}这个代表就是项目根目录&#xff09; &#xff08;2&#xff09;然后先注释preLauchTask。 &#xff08;3&#xff09;重新编译一下文件&#xff0c;make…

全新神经网络:Kolmogorov-Arnold网络更具解释性,有望为物理学家提供新假设

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

FDE Solver 的 enabled 选项是不开放的

FDE Solver 的 enabled 选项是不开放的 正文正文 在 Mode 工程文件中,只能添加一个 FDE Solver,并且,不同于结构组件,对于结构组件,我们通常可以使用如下脚本将其设置为不启用状态。 比如,我们这里有一个三角型结构。 我们通过如下脚本设置其为不启用状态后, CAD 显示…

准确度与精密度:差异和示例

准确度与精密度&#xff1a;差异和示例 文章目录 一、说明二、准确性的定义三、精度的定义四、飞镖板上的准确度与精确度五、如何记住准确度与精确度六、如何测试准确度和精密度 一、说明 当您依赖数据得出结论时&#xff0c;准确度和精确度是测量的关键属性。这两个概念都适…

Git合并多笔提交为一笔

Git合并多笔提交为一笔 1. 背景 在实际项目开发中&#xff0c;我们会基于生产分支拉出很多需求分支&#xff0c;在需求分支开发完成后再将代码合到生产分支&#xff0c;但随着提交次数越来越多&#xff0c;我们在合到生产分支的时候就得一笔一笔的入库&#xff0c;特别麻烦&a…

day14-测试自动化之Selenium的元素操作、浏览器操作等

一、元素操作 1.1.为什么要学习操作元素的方法&#xff1f; 1).需要让脚本模拟用户给指定元素输入值 2).需要让脚本模拟人为删除元素的内容 3).需要让脚本模拟点击操作 1.2.元素常用操作方法 1).click&#xff08;&#xff09;点击方法 2).send_keys(value) 输入方法 3).clear(…

手表运动报告生成以及手机展示

一.运动报告组成部分 一般一份运动健康的报告包括以下信息&#xff1a; 1.运动轨迹区。2.报告数据区。(运动总体概览&#xff0c;如距离&#xff0c;时长&#xff0c;训练表现等)3.曲线图表区。(心率曲线&#xff0c;海拔曲线&#xff0c;速度&#xff0c;配速曲线) 二.组成部…

PHP + Laravel + RabbitMQ + Redis 实现消息队列 (三) 消费队列在RabbitMQ和redis中的发布和订阅

发布订阅&#xff08;Pub/Sub&#xff09; 对于消息队列传统的模式来说&#xff0c;一个消费者消费一条消息&#xff0c;这条消息被消费之后就不会再次被其它的消费者消费。但是在发布订阅模式中&#xff0c;一条消息是可以被多个消费者消费的&#xff0c;这些消费者其实相当于…