一、时间序列的相关概念
定义:时间序列是按时间顺序排列的一系列观测值,通常以固定间隔(如秒、天、年)记录。而时间序列分析是一种研究按时间顺序排列的数据点的统计方法,发现趋势、季节性波动、周期性和异常等模式,常用于预测未来走势。
一些相关概念:
-
趋势:数据在长期表现出的上升、下降或平稳的倾向(如GDP增长)。
-
季节性:固定周期内的重复波动(如冰淇淋销量夏季升高),周期固定(如月、季度)。
-
周期性:非固定周期的波动(如经济周期),通常跨度较长。
-
随机噪声:无法解释的随机波动,通常假设为白噪声。
-
平稳性:平稳时间序列的统计特性(如均值、方差和自相关结构)不随时间发生变化。通常情况下,很多时间序列数据并非天然平稳,需要通过差分、对数变换等方法使其平稳化,以便采用各种建模方法。严格平稳,整个概率分布不随时间变化;弱平稳,均值和自协方差函数不随时间变化。
常见的时间序列模型:
-
自回归模型(AR)
利用序列自身的过去值来解释当前值。例如,AR(1) 模型表示当前值与前一时刻的值之间存在一定的线性关系。 -
移动平均模型(MA)
通过过去误差项的线性组合来描述当前值,强调随机冲击的积累效应。 -
自回归移动平均模型(ARMA)
结合了AR和MA两种模型的特点,适用于平稳时间序列的建模。 -
自回归积分移动平均模型(ARIMA)
对非平稳序列进行差分处理后,再使用ARMA模型建模。ARIMA模型适用于趋势明显的非平稳序列。 -
季节性ARIMA模型(SARIMA)
在ARIMA模型的基础上,进一步考虑季节性成分,适用于具有明显季节性波动的序列。 -
指数平滑方法
包括简单指数平滑、霍尔特线性趋势法、霍尔特-温特斯季节性模型等,主要用于平滑时间序列和短期预测。
分类:在时间序列分析领域,根据分析的侧重点和方法,可以大致分为“描述性时序分析”和“统计时序分析”
二、描述性时序分析
目标:通过可视化和基础统计量,直观地揭示时间序列的特征和模式,不涉及模型假设或预测。
核心方法:
- 可视化:绘制时序图(时间趋势)、季节图(季节性)、自相关图(ACF/PACF)等。
- 统计量:计算均值、方差、移动平均、趋势成分、季节成分等。
- 分解法:将序列拆分为趋势(Trend)、季节和残差部分(如加法或乘法模型)。
- 平稳性初探:通过图形或简单统计量(如滚动均值/方差)判断数据是否平稳。
特点:
- 直观易懂,适合数据探索和初步理解。
- 非参数方法,不依赖数学模型假设。
三、统计时序分析
目标:基于统计模型对时间序列建模,进行预测、因果推断或假设检验,强调数学严谨性。
核心方法:
-
模型构建:ARIMA(自回归积分滑动平均)、SARIMA(季节性ARIMA)、状态空间模型(如卡尔曼滤波)、GARCH(波动率建模)等。
-
参数估计:最大似然估计(MLE)、贝叶斯推断等。
-
假设检验:单位根检验(ADF检验)、白噪声检验(Ljung-Box)等。
-
预测:生成点预测和置信区间(如ARIMA预测未来销售额)。
特点:
-
依赖模型假设(如平稳性、线性关系)。
-
可量化不确定性,提供统计推断支持。
四、描述性时序分析、统计时序分析的主要区别
描述性时序分析 | 统计时序分析 | |
---|---|---|
目标 | 描述数据特征(趋势、季节、异常) | 建模与预测,量化不确定性 |
方法 | 可视化、简单统计量、分解法 | 参数模型、假设检验、概率推断 |
复杂度 | 低(非参数) | 高(依赖数学模型和假设) |
输出 | 图表、统计摘要 | 模型参数、预测值、置信区间 |
应用阶段 | 数据探索、预处理阶段 | 建模、预测、因果分析阶段 |
# 文章如有错误欢迎大家指正。我们下期见!