【MATLAB第89期】基于MATLAB的差分自回归滑动平均模型ARIMA时间序列预测模型含预测未来
往期文章
【MATLAB第82期】基于MATLAB的季节性差分自回归滑动平均模型SARIMA时间序列预测模型含预测未来
一、模型介绍
1、模型简介
差分自回归移动平均模型(Autoregressive Integrated Moving Average Model, ARIMA),又称为差分自回归移动平均模型,是时间序列预测常用的分析方法之一,常应用于不包含趋势和季节性的单变量数据的预测。
2、模型参数
ARIMA结构参数有七个:(p,d,q)
1、非季节性差分数
d:代表时序数据需要进行几阶差分化,才是稳定的,也叫Integrated项。使用ARIMA模型要求数据平稳。ARIMA的差分项有两个,非季节性差分通常在0~3之间。确定非季节性差分数d从0至3循环,平稳后停止,当检验模型参数时d=0时数据已经平稳。
2、确定ARIMA模型阶数
这个步骤中需要确定的阶数有2个:AR阶数p,MA阶数q。用基于AICBIC准则的方法定阶。
p:代表预测模型中采用的时序数据本身的滞后数(lags) ,也叫做AR/Auto-Regressive项。p通常在0~3之间,通过循环可得p=2时,AICBIC值最小。
q:代表预测模型中采用的预测误差的滞后数(lags),也叫做MA/Moving Average项。q通常在0~3之间,通过循环可得q=3时,AICBIC值最小。
3、残差检测
为了确保确定的阶数合适,还需要进行残差检验。残差即原始信号减掉模型拟合出的信号后的残余信号。如果残差是随机正态分布的、不自相关的,这说明残差是一段白噪声信号,也就说明有用的信号已经都被提取到模型中了
上图为残差检验的结果图。Standardized Residuals是查看残差是否接近正态分布,理想的残差要接近正态分布;ACF和PACF检验残差的自相关和偏自相关,理想的结果应该在图中不存在超出蓝线的点;最后一张QQ图是检验残差是否接近正太分布的,理想的结果中蓝点应该靠近红线。
除了上述图像检验方法,还可以通过Durbin-Watson对相关性进行检验:
Durbin-Watson 统计是计量经济学分析中最常用的自相关度量,该值接近2,则可以认为序列不存在一阶相关性。
运算结果为1.99,这个值越接近2越说明残差不存在一阶相关性。
上述检验可以证明,残差接近正态分布,且相互独立,可以认为ARIMA建模符合要求。
二、预测效果对比
表 ARIMA训练集和测试集预测结果评价指标
样本 RMSE MSE MAE R2
训练集 5.8556 34.2885 3.6008 0.87792
测试集 7.0661 49.9298 4.074 0.86357
表 SARIMA训练集和测试集预测结果评价指标
样本 RMSE MSE MAE R2
训练集 2.101 4.4143 0.88828 0.93821
测试集 1.6282 2.6511 1.1039 0.97196
从评价指标数值表的角度看,SARIMA相比ARIMA在销量预测上有较高的精度,测试所得的误差值较小,能深入挖掘长时间序列数据的深层规律。SARIMA对周期性波动性的挖掘较为深入。
三、部分代码展示
close all
clear all
%% 1.加载数据
xall= importdata('经营数据2.xlsx');%导入数据
time=xall.textdata;%时间数据
xnum = datenum(time(2:end,1)); % 将日期转为数值
data= xall.data(:,2);% 时间序列数据
data1=data;
step = 12;
%% 2.d从0至3循环,平稳后停止
for d = 0:3
dY = diff(data)%对原数据进行差分运算
if(getStatAdfKpss(dY)) %数据平稳
disp(['非季节性差分数为',num2str(d)]);
break;
end
end
%% 3.确定阶数ARlags,MALags
max_ar = 3; %ARlags上限
max_ma = 3; %MALags上限
id=1;
[STD1, EstMdl1, canshu] = find_pdq_arima(id,max_ar,max_ma);
四、代码获取
1.阅读首页置顶文章
2.关注CSDN
3.根据自动回复消息,回复“89期”以及相应指令,即可获取对应下载方式。