用Python实现时间序列模型实战——Day1:时间序列的基本概念

news2024/12/26 19:52:43

一、学习内容

1. 时间序列数据的定义与特点

定义

  • 时间序列数据是一组按时间顺序排列的观测值。时间序列的每个观测值都与特定时间点相关联。例如,气温每天的记录、股票每日的收盘价等。

特点

  • 时间依赖性:时间序列数据的一个基本特点是当前数据点可能依赖于之前的一个或多个数据点。这种依赖性可以用来进行预测。
  • 趋势:数据可能表现出随时间的长期上升或下降趋势。例如,随着经济发展,GDP 一般会显示上升趋势。
  • 季节性:数据在特定时间周期内反复出现的模式。季节性常见于许多现实世界的数据中,如每年的某些月份销售额上升。
  • 周期性:周期性波动与季节性相似,但周期更长且可能不固定,如经济周期。
  • 随机性:数据中难以解释的波动,可以被视为噪声,可能由随机因素引起。

2. 时间序列的类型

平稳时间序列

  • 平稳性是时间序列分析中的一个重要概念。一个时间序列被称为平稳的,如果它的统计性质(如均值、方差、自相关)随着时间保持恒定。平稳时间序列没有趋势和季节性,其波动性是恒定的。
  • 判断方法
    • 自相关函数 (ACF) 和偏自相关函数 (PACF) 的图可以帮助判断时间序列的平稳性。
    • 平稳性检验:如 ADF(Augmented Dickey-Fuller)检验。

非平稳时间序列

  • 非平稳时间序列的统计性质随着时间变化,例如,序列中存在明显的趋势、季节性或周期性。对于非平稳时间序列,常常需要通过差分、去趋势、去季节性等方法将其转化为平稳序列。

3. 基本术语

  • 趋势:数据在较长时间范围内的总体变化方向。例如,社会总消费水平随时间上升。
  • 季节性:在特定周期内数据表现出的反复波动模式,通常与自然或人为的季节性因素有关。例如,零售业的销售额在节假日期间会显著增加。
  • 周期性:类似于季节性,但周期性波动的周期较长,且可能不固定。例如,经济周期的波动通常不定期发生。
  • 随机性:难以解释的波动,通常来源于不可预测的外部因素。

4. 时间序列的可视化与初步分析

可视化的重要性

  • 可视化是时间序列分析的第一步,通过图表,我们可以直观地观察到数据的趋势、季节性、周期性和随机性。

如何进行可视化

  • 使用 pandasmatplotlib 进行可视化,可以帮助我们识别时间序列中的模式并初步分析其结构。

二、实战案例

1. 数据加载与初步查看

import pandas as pd
import matplotlib.pyplot as plt

# 加载时间序列数据集
url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv"
data = pd.read_csv(url, parse_dates=['Month'], index_col='Month')

# 查看数据前几行
print("数据集的前几行:")
print(data.head())

运行结果:

数据集的前几行:
            Passengers
Month                 
1949-01-01         112
1949-02-01         118
1949-03-01         132
1949-04-01         129
1949-05-01         121

 程序解释:

  • 使用 pandas.read_csv 方法加载航空乘客数据集,并将 Month 列解析为日期格式并设为索引。然后使用 data.head() 查看前几行数据,以确认数据加载成功。
  • 该数据集记录了 1949 年 1 月至 1960 年 12 月的航空公司乘客数量。

2. 时间序列的初步可视化

# 绘制时间序列图
plt.figure(figsize=(12, 6))
plt.plot(data['Passengers'], color='blue', linewidth=2)
plt.title('Monthly Number of Airline Passengers (1949-1960)')
plt.xlabel('Date')
plt.ylabel('Number of Passengers')
plt.grid(True)
plt.show()

运行结果:

f94318d941d24bb0ad6c02d9b8603847.png

  程序解释:

  • 通过 matplotlibplot 函数绘制时间序列图,观察乘客数量随时间的变化。
  • 这一步帮助我们初步观察数据的趋势、季节性和随机波动。

3. 数据的描述性统计

# 检查数据的描述统计
print("\n数据的描述统计:")
print(data.describe())

 运行结果:

数据的描述统计:
       Passengers
count  144.000000
mean   280.298611
std    119.966317
min    104.000000
25%    180.000000
50%    265.500000
75%    360.500000
max    622.000000

程序解释: 

  • 使用 describe() 函数查看数据的描述性统计信息,如均值、标准差、最小值、最大值等,帮助我们了解数据的分布情况。

4. 年度趋势的可视化

# 可视化各个年份的数据趋势
data['Year'] = data.index.year
plt.figure(figsize=(12, 6))
for year in data['Year'].unique():
    yearly_data = data[data['Year'] == year]
    plt.plot(yearly_data.index.month, yearly_data['Passengers'], label=str(year))

plt.title('Yearly Trends in Airline Passengers')
plt.xlabel('Month')
plt.ylabel('Number of Passengers')
plt.legend()
plt.grid(True)
plt.show()

 运行结果:

3af80dcd794f44a3a1d8d163e37008e0.png

程序解释: 

  • 将数据按年份进行分割,并绘制每年的月度乘客数量趋势。这样可以直观地比较每一年之间的季节性变化和年度增长趋势。

三、结果分析

1. 趋势

  • 从时间序列图可以看出,航空乘客数量呈现出明显的上升趋势。这意味着随着时间的推移,航空旅行变得越来越普及。

2. 季节性

  • 在每年的乘客数量中,可以清晰地观察到季节性波动。例如,乘客数量在年中某些月份(如夏季)达到峰值,而在冬季通常会有下降。这表明航空旅行具有明显的季节性。

3. 随机性

  • 尽管存在趋势和季节性,但数据中也包含了一些随机波动,这可能是由于外部因素或数据本身的随机性导致的。

4. 年度分析

  • 年度趋势图显示,不同年份的乘客数量趋势基本一致,但随着时间推移,各年份的乘客数量逐渐增加。这种逐年增长的趋势反映了航空行业的扩展和经济的发展。

通过这些详细的分析和可视化,我们能够更好地理解时间序列数据的基本特征。这为后续更深入的时间序列分析和建模奠定了坚实的基础。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2080466.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ssm基于微信小程序的食堂窗口自助点餐系统源码调试讲解

1. 环境搭建 JDK 1.8:确保您的系统已安装JDK 1.8,并配置好环境变量。JDK 1.8 是目前很多Java项目仍在使用的稳定版本,适用于SSM框架。Tomcat 7:安装并配置Tomcat 7作为您的Web服务器。Tomcat 7 支持Servlet 3.0和JSP 2.2&#xf…

黑马JavaWeb开发笔记07——Ajax、Axios请求、前后端分离开发介绍、Yapi详细配置步骤

文章目录 前言一、Ajax1. 概述2. 作用3. 同步异步4. 原生Ajax请求(了解即可)5. Axios(重点)5.1 基本使用5.2 Axios别名(简化书写) 二、前后端分离开发1. 介绍1.1 前后台混合开发1.2 前后台分离开发方式&…

使用 OpenCV 组合和缩放多张图像

在图像处理领域,我们经常需要将多张小图像组合成一张大图。例如,将多张图像按一定布局排列在一起,或者创建一个缩略图画廊。在这篇博客中,我将向你展示如何使用 Python 的 OpenCV 库来完成这一任务。 代码 下面是一段完整的 Pyt…

计算物理精解【2】

文章目录 矢量运动矢量基础定义计算方法示例 矢量的分量二维空间中的矢量分量三维空间中的矢量分量分量的计算示例 参考文献 矢量运动 矢量 基础 矢量的分量是该矢量在相应轴上的投影。 a x a c o o s Q , a y a s i n Q a_xacoosQ,a_yasinQ ax​acoosQ,ay​asinQ求解矢…

【书生大模型实战营(暑假场)】进阶任务三 LMDeploy 量化部署实践闯关任务

进阶任务三 LMDeploy 量化部署实践闯关任务 任务文档视频 1 大模型部署基本知识 1.1 LMDeploy部署模型 定义 在软件工程中,部署通常指的是将开发完毕的软件投入使用的过程。在人工智能领域,模型部署是实现深度学习算法落地应用的关键步骤。简单来说…

智能科技的浪潮:AI、ML、DL和CV的探索之旅

智能科技的浪潮:AI、ML、DL和CV的探索之旅 前言人工智能:智能科技的基石从专用到通用:AI的分类与演进机器学习:数据中的智慧算法的力量:经典与创新深度学习:解锁复杂性之门神经网络的深度:基础与…

Python网络爬虫模拟登录与验证解析

内容导读 使用Selenium模拟登录 使用Cookies登录网站 模拟表单登录网站 爬虫识别简单的验证码 实例解析 一、使用Selenium模拟登录 1、为什么要模拟登录 在互联网上存在大量需要登录才能访问的网站,要爬取这些网站,就需要学习爬虫的模拟登录。对…

Webpack中的自定义 loader 的简单实现

1.loader简单介绍 webpack 中 loader 是用于对模块的源代码进行转换(处理)的插件。例如 webpack 中常见的loader, css-loader、babel-loader。 2.自定义 loader 关于 loader: loader本质上是一个导出为函数的JavaScript模块&am…

故障诊断 | 基于小波时频图与Swin Transformer的轴承故障诊断方法(PyTorch)

文章目录 文章概述程序设计参考资料文章概述 基于小波时频图与Swin Transformer的轴承故障诊断方法 针对用传统的故障诊断方法难以对非线性非平稳的柴油机故障信号进行准确高效诊断的问题, 提出基于小波时频图与Swin Transformer的故障诊断方法。该方法可以有效结合小波时频分…

Qt (11)【Qt窗口 —— 对话框 | Qt内置对话框简介】

阅读导航 引言一、对话框1. 对话框的分类(1)模态对话框(2)非模态对话框 二、Qt内置对话框 引言 在上一篇文章中,我们深入探讨了Qt框架中窗口的基本构建块,它们共同构成了Qt应用程序中用户界面(…

RACL: Adversarially Robust Neural Architectures

RACL: 对抗鲁棒网络架构 论文链接:https://arxiv.org/abs/2009.00902v2 Abstract 深度神经网络(DNN)容易受到对抗性攻击。现有的方法致力于开发各种鲁棒训练策略或正则化来更新神经网络的权值。但除了权重之外,网络中的整体结构和信息流是由网络架构明…

文件.硬盘.IO

一.文件 (1)文件本身是包含多种意义的,这里我简单的说明一下文件的意义。 (2) 狭义上的文件:我们在硬盘中的文件。文件夹(目录)中存放的是文件。 (3) 广义…

云端集中管控边缘服务:利用 EMQX ECP 在 K8s 上快速部署 NeuronEX

随着物联网、边缘计算技术的发展,实现边缘服务的快速部署对于分布式计算环境至关重要。它不仅可以显著降低延迟、节省带宽资源、增强数据的安全性和隐私保护,同时还能改善用户体验,支持动态变化的工作负载需求,提供更高的灵活性和…

【启明智显分享】智能音箱AI大模型一站式解决方案重塑人机交互体验,2个月高效落地

2010年左右,智能系统接入音箱市场,智能音箱行业在中国市场兴起。但大潮激荡,阿里、小米、百度三大巨头凭借自身强大的资本、技术、粉丝群强势入局,形成三足鼎立态势。经过几年快速普及,智能音箱整体渗透率极高&#xf…

数据结构(6.4_1)——最小生成树

生成树 连通图的生成树是包含图中全部顶点的一个极小连通子图(边要尽可能的少,但要保持连通) 若图中顶点数为n,则它的生成树含有n-1条边。对生成树而言,若砍去它的一条边,则会变成非连通图,若加上一条边则会形成一个…

【MySQL 13】视图 (带思维导图)

文章目录 🌈 一、视图的基本概念🌈 二、视图的基本操作⭐ 1. 创建视图⭐ 2. 修改视图⭐ 3. 修改基表⭐ 4. 删除视图 🌈 三、视图的限制规则 🌈 一、视图的基本概念 视图是一种虚拟存在的表,将查询结果以表结构的方式保…

Sigmoid 函数及其导数推导

Sigmoid 函数及其导数推导 1. 了解 Sigmoid 函数 Sigmoid 函数是神经网络中常用的激活函数,因其平滑的S形曲线和将输入压缩至 (0, 1) 的特性,在神经网络的激活函数中扮演着重要角色。其定义如下: σ ( x ) 1 1 e − x \sigma(x) \frac{1…

GUI编程03:3种布局管理器

本节内容视频链接:https://www.bilibili.com/video/BV1DJ411B75F?p5&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5https://www.bilibili.com/video/BV1DJ411B75F?p5&vd_sourceb5775c3a4ea16a5306db9c7c1c1486b5 1.FlowLayout 流式布局 代码:…

34. 二叉树中和为某一值的路径

comments: true difficulty: 中等 edit_url: https://github.com/doocs/leetcode/edit/main/lcof/%E9%9D%A2%E8%AF%95%E9%A2%9834.%20%E4%BA%8C%E5%8F%89%E6%A0%91%E4%B8%AD%E5%92%8C%E4%B8%BA%E6%9F%90%E4%B8%80%E5%80%BC%E7%9A%84%E8%B7%AF%E5%BE%84/README.md 面试题 34. 二…

关于Linux(CentOS 7)中的用户sudo命令

📝用户提权 测试非root用户的权限浏览该文件 测试非root用户的权限 当我们在当前用户使用sudo命令时,提示使用vimer用户的密码,非root。这是为什么呢? 因为这里系统提示需要用户的密码,则认为vimer用户是受信任的。 输…