《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)

news2024/11/27 2:39:41

在这里插入图片描述

文章目录

  • 6.1 时间序列数据基础
    • 6.1.1 基础知识
    • 6.1.2 重点案例:股票市场分析
    • 6.1.3 拓展案例一:温度变化分析
    • 6.1.4 拓展案例二:电商平台日销售额分析
  • 6.2 日期与时间功能
    • 6.2.1 基础知识
    • 6.2.2 重点案例:活动日志分析
    • 6.2.3 拓展案例一:工作日计算
    • 6.2.4 拓展案例二:股票市场交易日数据重采样
  • 6.3 时间序列的高级应用
    • 6.3.1 基础知识
    • 6.3.2 重点案例:金融市场趋势分析
    • 6.3.3 拓展案例一:能源消耗季节性分析
    • 6.3.4 拓展案例二:零售销售的扩展窗口分析

6.1 时间序列数据基础

时间序列数据是在连续时间点或者时间段上收集的数据点,常用于分析趋势、做出预测等。

6.1.1 基础知识

  1. 时间戳和时间间隔: 时间戳代表某一具体的瞬间,而时间间隔则表示一段时间。
  2. 解析时间数据: 通常需要将字符串格式的时间数据转换成 Python 的 datetime 对象以便处理。
  3. 设置时间索引: 在 Pandas 中,将时间数据设置为 DataFrame 的索引可以方便地进行时间序列分析。

6.1.2 重点案例:股票市场分析

假设你有一份股票市场的历史数据,包含日期和当日的收盘价,你需要分析股价随时间的变化趋势。

数据准备

import pandas as pd

# 示例股票市场数据
stock_data = {
    'date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
    'close_price': [100, 105, 103, 108]
}
stock_df = pd.DataFrame(stock_data)

处理时间序列数据

# 将字符串日期转换为 datetime 对象
stock_df['date'] = pd.to_datetime(stock_df['date'])

# 将日期设置为索引
stock_df.set_index('date', inplace=True)

6.1.3 拓展案例一:温度变化分析

假设你有一份每日温度记录数据,需要分析温度随时间的变化。

数据准备

# 示例温度记录数据
temperature_data = {
    'date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
    'temperature': [22, 23, 21, 24]
}
temperature_df = pd.DataFrame(temperature_data)

处理时间序列数据

# 将字符串日期转换为 datetime 对象并设置为索引
temperature_df['date'] = pd.to_datetime(temperature_df['date'])
temperature_df.set_index('date', inplace=True)

6.1.4 拓展案例二:电商平台日销售额分析

分析一份电商平台每日销售额数据,观察销售额随时间的变化。

数据准备

# 示例电商平台销售数据
sales_data = {
    'date': ['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04'],
    'daily_sales': [2000, 3000, 2500, 3200]
}
sales_df = pd.DataFrame(sales_data)

处理时间序列数据

# 将日期转换为 datetime 对象并设置为索引
sales_df['date'] = pd.to_datetime(sales_df['date'])
sales_df.set_index('date', inplace=True)

通过这些案例,我们展示了如何处理和分析时间序列数据。从股市趋势分析到温度变化观察,再到电商销售额的时间分析,掌握时间序列数据的基础操作是进行这些分析的关键。

在这里插入图片描述


6.2 日期与时间功能

在时间序列分析中,处理和操作日期与时间是常见的需求。Pandas 提供了丰富的日期与时间功能,使得这些操作变得简单。

6.2.1 基础知识

  1. Datetime 类型: Pandas 使用 datetime64 类型来处理日期和时间。可以使用 pd.to_datetime() 将字符串转换成 datetime64 类型。
  2. 时间索引: 设置时间索引后,可以使用时间索引来选择、过滤和重采样数据。
  3. 时间偏移和频率: Pandas 允许使用时间偏移和频率来进行日期计算,如加减天数、找到下一个月的开始等。

6.2.2 重点案例:活动日志分析

假设你有一份网站的活动日志,记录了每次活动的日期和时间,你需要分析特定时间段内的活动。

数据准备

import pandas as pd

# 示例活动日志数据
log_data = {
    'timestamp': ['2023-01-01 12:00', '2023-01-01 12:30', '2023-01-02 13:00', '2023-01-02 14:00'],
    'activity': ['login', 'view', 'purchase', 'logout']
}
log_df = pd.DataFrame(log_data)

处理时间序列数据

# 将字符串转换为 datetime 对象
log_df['timestamp'] = pd.to_datetime(log_df['timestamp'])

# 设置时间索引
log_df.set_index('timestamp', inplace=True)

# 选择特定日期的活动
activities_on_first = log_df['2023-01-01']

6.2.3 拓展案例一:工作日计算

计算一个时间范围内的工作日总数。

数据准备

# 定义一个时间范围
date_range = pd.date_range(start='2023-01-01', end='2023-01-31')

计算工作日

# 计算工作日
workdays = date_range.to_series().map(lambda x: 0 if x.weekday() >= 5 else 1).sum()

6.2.4 拓展案例二:股票市场交易日数据重采样

假设你有一份股票市场的日交易数据,需要按周计算平均交易量。

数据准备

# 示例股票市场交易数据
trade_data = {
    'date': pd.date_range(start='2023-01-01', periods=30),
    'volume': pd.np.random.randint(1000, 5000, size=30)
}
trade_df = pd.DataFrame(trade_data).set_index('date')

重采样计算周平均交易量

# 按周重采样并计算平均交易量
weekly_avg_volume = trade_df.resample('W').mean()

通过这些案例,我们展示了如何利用 Pandas 的日期与时间功能进行分析,从处理具体的活动日志到计算工作日总数,再到重采样股票市场交易数据。掌握这些技巧,你可以更灵活地处理时间序列数据,提取有价值的时间维度信息。

在这里插入图片描述


6.3 时间序列的高级应用

探索时间序列数据的高级应用可以帮助我们深入理解数据的时间维度,从而做出更准确的分析和预测。

6.3.1 基础知识

  1. 时间序列缺失数据处理: 时间序列数据可能会有缺失值,处理方法包括填充和插值。
  2. 重采样和频率转换: 通过改变时间序列的频率(如从日到月),可以更好地分析趋势。
  3. 滚动窗口和扩展窗口操作: 滚动窗口(rolling window)操作允许我们计算如移动平均等统计量,扩展窗口(expanding window)则从时间序列起点累积到当前点。

6.3.2 重点案例:金融市场趋势分析

假设你有一份金融市场的每日股价数据,需要分析股价的移动平均趋势。

数据准备

import pandas as pd
import numpy as np

# 示例股价数据
date_range = pd.date_range(start='2023-01-01', periods=90)
stock_prices = np.random.normal(100, 10, size=90).cumsum()
stock_df = pd.DataFrame({'price': stock_prices}, index=date_range)

处理时间序列数据

# 计算7日移动平均
stock_df['7_day_avg'] = stock_df['price'].rolling(window=7).mean()

# 计算30日移动平均
stock_df['30_day_avg'] = stock_df['price'].rolling(window=30).mean()

6.3.3 拓展案例一:能源消耗季节性分析

分析一份每小时记录的能源消耗数据,观察消耗量的季节性变化。

数据准备

# 示例能源消耗数据
hours_in_year = pd.date_range(start='2023-01-01', periods=8760, freq='H')
energy_consumption = np.random.normal(50, 15, size=8760).cumsum()
energy_df = pd.DataFrame({'consumption': energy_consumption}, index=hours_in_year)

季节性分析

# 按月重采样计算平均能源消耗
monthly_avg_consumption = energy_df.resample('M').mean()

6.3.4 拓展案例二:零售销售的扩展窗口分析

假设你有一份零售商每日销售额的数据,需要分析自年初以来销售额的累计总和。

数据准备

# 示例零售销售数据
days_in_year = pd.date_range(start='2023-01-01', periods=365)
daily_sales = np.random.randint(1000, 5000, size=365)
sales_df = pd.DataFrame({'sales': daily_sales}, index=days_in_year)

扩展窗口分析

# 计算累计销售额
sales_df['cumulative_sales'] = sales_df['sales'].expanding().sum()

通过这些案例,我们展示了时间序列数据分析的高级应用,包括处理缺失数据、重采样、以及滚动和扩展窗口操作。这些技巧可以帮助我们深入理解数据的时间维度,从而做出更准确的分析和预测。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1425997.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

最全整理!37 个 Python Web 开发框架总结!

大家好,用了 2 周的时间整理了 Python 中所有的网站开发库(下文简称:Web 框架),供大家学习参考。 Q:Web 框架到底是什么? A:Web 框架主要用于网站开发。开发者在基于 Web 框架实现…

【数据结构(C语言)】树、二叉树详解

目录 文章目录 前言 一、树的概念及结构 1.1 树的概念 1.2 树的相关概念 1.3 树的表示 1.4 树在实际中的运用 二、二叉树的概念及结构 2.1 二叉树的概念 2.2 二叉树的基本形态 ​编辑2.3 特殊的二叉树 2.4 二叉树的性质 2.5 二叉树的存储结构 三、二叉树的顺序结…

Java编程练习之类的封装2

1.封装一个股票(Stock)类,大盘名称为上证A股,前一日的收盘点是2844.70点,设置新的当前值如2910.02点,控制台既要显示以上信息,又要显示涨跌幅度以及点数变化的百分比。运行效果如下:…

SketchBook 2022下载安装教程,保姆级教程,操作简单,小白也能轻松搞定,附安装包和工具

前言 Autodesk SketchBook是一款新一代的自然画图软件,软件界面新颖动人,功能强大,仿手绘效果逼真,笔刷工具分为铅笔,毛笔,马克笔,制图笔,水彩笔,油画笔,喷枪…

Offer必备算法_前缀和_牛客+力扣OJ题详解(由易到难)

目录 前缀和算法介绍 一维前缀和 二维前缀和 ①牛客DP34 【模板】前缀和 解析代码 ②牛客DP35 【模板】二维前缀和 解析代码 ③力扣724. 寻找数组的中心下标 解析代码 ④力扣238. 除自身以外数组的乘积 解析代码 ⑤力扣560. 和为 K 的子数组 解析代码 ⑥力扣974. …

2024美国大学生数学建模竞赛A-F题完整思路+配套代码数据+后续高质量参考论文更新

The Mathematical Contest in Modeling (MCM) The Interdisciplinary Contest in Modeling (ICM) 24美赛【完整每问手把手详细思路可修改50页多种思路版本word版保奖论文】配套升级求解代码可视化图表 美赛A-F题完整版获取见文末 下文包含:2024美国大学生数学建模…

代码随想录 Leetcode110.平衡二叉树

题目: 代码(首刷看解析 2024年1月30日): class Solution { public:int depth(TreeNode* root) {if (root nullptr) return 0;int leftHeight depth(root->left);if (leftHeight -1) return -1;int rightHeight depth(root->right)…

Java List的合并与切分

在Java开发中经常遇到list结构数据的处理,如List的合并或拆分,记录下来,方便备查。 一、List 合并 两个list数据的合并处理,可使用Java8 新特性的stream流,根据实际需要遍历取值。 1、定义 UserInfo 对象 订单的相…

LeetCode: 189.轮转数组

本篇目标了解,翻转数组的经典解法, 189. 轮转数组 - 力扣(LeetCode) 目录 基本方法概述: 1,翻转做法,推荐时O(n),空(1) 2&#x…

Windows IIS服务如何配置并制作web站点结合内网穿透实现公网访问

文章目录 1. 安装IIS必要WebDav组件2. 客户端测试3. cpolar内网穿透3.1 打开Web-UI管理界面3.2 创建隧道3.3 查看在线隧道列表3.4 浏览器访问测试 4. 安装Raidrive客户端4.1 连接WebDav服务器4.2 连接成功4.2 连接成功总结: 自己用Windows Server搭建了家用NAS主机&…

【Linux C | I/O模型】IO复用 | select、pselect函数详解(看完就会用了)

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀 🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C、数据结构、音视频🍭 🤣本文内容🤣&a…

Unity 模板方法模式(实例详解)

文章目录 简介示例1:游戏关卡流程示例2:测试试卷类示例3:游戏场景构建流程示例4:游戏动画序列示例5:游戏对象初始化过程 简介 Unity中的模板方法模式是一种行为设计模式,它在父类中定义了一个算法的框架&a…

关键字const

1.定义常量 const int a; 2.定义常量指针 1.不可以通过常量指针来修改其指向的内容。 2.不能把常量指针赋值给非常量指针,反过来可以。 3.函数参量为常函数指针时,可以避免函数内部不小心改变指针所指地方的内容。

【2024美国大学生数学建模竞赛】2024美赛C题 问题分析、数学模型、实现代码、完整论文

【2023美国大学生数学建模竞赛】2024美赛C题 问题分析、数学模型、实现代码、完整论文 引言 题目将于2024年2月2日6:00发布。我们团队将会在8点前准时更新问题分析,逐步更新数学模型和实现代码,最后发布完整的论文。 更新进展: (…

elementui 开始结束时间可以选择同一天不同时间段

先在main.js中导入 import moment from moment <el-row><el-col :span"12"><el-form-item label"考试开始时间" prop"startTime"><el-date-picker v-model"shiJuanXinXiForm.startTime" style"width: 100…

7款免费的Midjourney平替平台

AI艺术生成器正在改变设计和内容的制作方式。像Midjourney这样的工具已经将困难的想法转化为令人惊叹的视觉效果&#xff0c;改变了创造力的运作方式。但是&#xff0c;AI艺术涵盖了许多风格和需求。这就是Midjourney替代方案变得重要的原因&#xff08;特别是免费的替代方案&a…

基于springboot+vue的阿博图书馆管理系统(前后端分离)

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容&#xff1a;毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 项目背景…

神经网络回归案例(python

目录 1.代码&#xff1a;2.效果&#xff1a;小结&#xff1a; 1.代码&#xff1a; import numpy as np import tensorflow as tf# 自变量和目标值 X np.array([[1, 2, 3, 4, 5, 6]]) # 自变量需要是二维数组形式 Y np.array([4531.575371])# 转换为TensorFlow张量 X tf.co…

python遍历目录的两种方法

我们有时想直接查看文件夹里的所有文件&#xff0c;但使用正常的方法太麻烦了&#xff0c;于是我开发出了两个python程序&#xff0c;可以遍历目录 第一种 不知大家还是否记得&#xff0c;我之前在我的处理文件程序里写过这个功能 python处理文件程序 这个程序只需要os、time…

【智慧工业】东胜物联定位与跟踪解决方案,为方案商提供蓝牙网关、信标等物联网智能硬件设备

利用东胜物联的蓝牙网关我们的合作伙伴在德国的建筑工地成功实施了基于物联网蓝牙的员工出勤和跟踪管理解决方案&#xff0c;该解决方案简化了员工时间表并增强了工作流程&#xff0c;为经理和主管提供了更多时间来专注于项目洞察&#xff0c;并提高了员工的效率、绩效和生产力…