【时间序列数据挖掘】ARIMA模型

news2024/11/28 12:31:57

目录

0、前言

一、移动平均模型MA

二、自回归模型AR

三、自回归移动平均模型ARMA

四、自回归移动平均模型ARIMA

【总结】


0、前言

传统时间序列分析模型:

 

ARIMA模型是一个非常灵活的模型,对于时间序列的好多特征都能够进行描述,比如说平稳性特征,季节性特征,趋势性特征。

ARIMA模型可以通过非常成熟的统计方法,比如说极大似然估计,矩估计,贝叶斯估计或者其他一些估计方法得到估计,所以是一个非常好用的工具。

ARIMA模型分成了三部分:AR,I,MA,相当于三个模块的组合。

大家比如说,如果拿到一个时间序列,最想干什么。

如果是一个股票数据,最关心的当然是需要能够知道时刻t~t+h的收益是什么样子的,即期望,

还有方差,作为一个投资者,比如预期我能赚1000万。如果方差是500,那我应该要好好考虑一下我有没有足够的把握能够控制住这个方差,赚到这个1000万。方差不确定性,就能够帮我们甄别做一件事情的风险有多大。

平稳时间序列一个随机现象的统计特征不随时间变化而改变的随机过程。

非平稳时间序列: 时间序列自身的随机过程的统计特征随时间改变。

 

一、移动平均模型MA

样本 自相关函数(autocorrelation function,ACF):

 展现t时刻和t-k时刻时间序列的关联性

样本 偏自相关函数(partial autocorrelation function,PACF) : 在给定了 的条件下, 𝑦t 与滞后 𝑘 期时间序列之间的条件相关

 差分:将不平稳的时间序列变平稳。

MA(q):假设一个时间序列由噪音(误差项)以及这些噪音的滞后阶按照不同权重组合起来。

MA(q)是说,yt是和误差项以及误差项的历史阶受影响的。

二、自回归模型AR

 一般的P阶自回归模型 AR:

 如果随机扰动项是一个白噪声( ut=εt ),则称为一个纯AR(p)过程,记为:

自回归模型AR(p):假设今天的股票收益仅依赖于前天的股票收益,或者是依赖于前p天的股票收益,除此之外不依赖。那么前p天影响到了今天的股票收益。

自回归模型首先需要确定一个阶数p,表示用几期的历史值来预测当前值。

但是,自回归模型有很多的限制:

(1)自回归模型是用自身的数据进行预测;

(2)时间序列数据必须具有平稳性;

(3)自回归只适用于预测与自身前期相关的现象(时间序列的自相关性);

三、自回归移动平均模型ARMA

可以这样理解,如果你经营一个餐馆,今天餐馆的收益和昨天的收益有关系,同时还受市场上发售的消费券的影响(假设消费券是一个随机数的话)。因为我不知道市场发了多少消费券,所以假定消费券是一个随机数。

那么你会发现,那么餐馆的经营既和过去一段时间的业绩有关系,又和消费券的随机数有关系。

那么这两个东西全部综合起来,我们把它叫做自回归移动平均模型ARMA,既有自回归模型AR,又有移动平均模型MA。

ARMA本质上是一个线性模型,但是它非常灵活,它能够帮助我们描述很多不同的场景。由于它是一个递归的形式,可以通过递归的形式来预测yt-1,yt-2,yt-3,所以ARMA模型是一个非常非常有效的基准的时间序列检测工具。

四、自回归移动平均模型ARIMA

现在,我们想想这个“I”是什么东西,“I”是一个差分项。

也就是说任何一个时间序列,你拿到之后,你需要想一想它是不是平稳的。如果不是平稳的,那么我们需要进行差分,即d=1,yt-yt-1就是差分之后的形式。

这里的p是自回归模型AR的参数,q是移动平均模型MA的参数,d是指d阶差分。

因为差分后的时间序列往往有更好的平稳性,那么差分后的时间序列就可以更好的用ARMA模型来建模。

ARIMA(p,d,q):假设今天的股票收益不仅依赖于前p天的股票收益,同时还与消费券有关。

除了差分, 比如说还有box jenkins,是一个比较主观的工具。但是它对于较长的时间序列不是很好用,然后呢还有一些检验上的唯一都很难被处理。

box jenkins:通过查看acf和pcf来识别这个时间序列是不是平稳的。

【总结】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/512832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

5.11黄金最新行情走势分析及多空交易策略

近期有哪些消息面影响黄金走势?本周黄金多空该如何研判? ​黄金消息面解析:北京时间周三(5月10日)20:30,美国劳工部公布4月通胀报告,整体与核心CPI年率都走低,支持美联储6月份保持利率不变。数据显示&…

RabbitMQ详解(一):Linux安装

消息队列概念 消息队列是在消息的传输过程中保存消息的容器。队列的主要目的是提供路由并保证消息的传递;如果发送消息时接收者不可用,消息队列会保留消息,直到可以成功地传递它。 常见的消息队列 RabbitMQ 基于AMQP(高级消息队列协议)基础上…

不要轻易放弃丢失的U盘文件夹数据,这里有按文件夹恢复数据的技巧

U盘,全名叫USB闪存盘,是一种便携式的存储设备,是一种可以插入到电脑等电子设备上进行数据传输和存储的硬件设备。U盘的使用方便、速度高、存储容量大、稳定性高,因此被广泛用于数据备份、文档传输、音频视频存储等方面。但是使用过…

easyrecovery免费版2023最新电脑数据恢复软件

通常,许多人会将工作或生活中的数据存储在我们的计算机上。很多时候,由于我们的误操作或其他一些问题,很容易错误地删除一些文件和数据。特别是,一些计算机故障总是会导致数据丢失,这是非常麻烦的。当需要重新安装系统…

【TA100】5 纹理的秘密

1 是什么? 2 为什么使用纹理 3 纹理管线 纹理投影 展开UV到UV坐标系 模型坐标> uv坐标 > 乘分辨率(256 256) > 颜色采样 4 纹理模式 重复,镜像重复,边界拉伸,填充颜色 5 采样模式 它决定了当纹理由于变换而产生拉伸时&a…

go小技巧(易错点)集锦

目录 len的魔力评论区大佬解答答案详解 结构体是否相等答案解析:结构体比较规则举例 常量的编译我的答案标准答案内存四区概念: new关键字答案 iota的魔力结果解析可跳过的值定义在一行中间插队 小结iota详解iota 原理iota 规则依赖 const按行计数多个io…

云数据库技术沙龙|多云多源下的数据复制技术解读-NineData

摘要:随着数据智能时代的到来,多云多源架构下的数据管理是企业必备的基础设施,我们认为数据存取、数据集成与分发、数据安全与数据质量是基础,也是走向多云多源架构的起点。本议题介绍云原生的多云多源数据管理NineData&#xff0…

PlSql存储过程基础

目录儿 常用指令1. 什么是PLSQL语言2. PLSQL程序结构2.1 第一个程序 HelloWord:2.2 执行程序2.2.1 在工具中执行2.2.2 在sqlplus客户端中执行(命令行) 3. 变量3.1 普通变量3.2 引用型变量3.3 记录型变量 4. 流程控制4.1 条件分支4.2 循环 5. 游标5.1 定义5.2 语法5.3 游标的属性…

或许你需要这套uni-app打包android与ios流程

1、hbuilder每个账户的每日云打包有上限次数限制,超出次数要么换账户要么换成本地打包(uni-app提供了足够多云端的打包次数) 2、android打包,也就是apk包 优先搞明白两个需求: 、android包名是否为默认值,如果是默认值&#xf…

基于轻量化深度学习网络的工业环境小目标缺陷检测

源自:控制与决策 作者:叶卓勋 刘妹琴 张森林 摘 要 工业环境下表面缺陷检测是质量管理的重要一环, 具有重要的研究价值.通用检测网络(如YOLOv4)已被证实在多种数据集检测方面是有效的, 但是在工业环境的缺陷检测仍需要解决两个问题: 一是缺陷实例在…

【接口测试】

【接口测试】 1、分层测试理论: UI测试(测试成本最高,发现BUG时间最晚) 接口测试 单元测试 2、协议分析工具 1)网络监听 TcpDump Wireshark 2)协议客户端工具 curl、postman 3)代理Pr…

phpstorm+phpstusy配置xdebug

真心觉得配置好麻烦呀 phpstorm版本: php版本用的7.3.4nts phpstudy版本:8.1.3 先下载xdebug,我用的是php_xdebug-3.1.6-7.3-vc15-nts-x86_64,phpstudy自带的那个xdebug我配置完不起作用 把下完的xdebug放到php下etc目录里,并改名为php_x…

C语言小项目之三子棋

💓博主CSDN主页:杭电码农-NEO💓   ⏩专栏分类:C语言学习分享⏪   🚚代码仓库:NEO的学习日记🚚   🌹关注我🫵带你学习更多C语言知识   🔝🔝 三子棋 1. 前言📕2. 思…

【英】考虑多能负荷不确定性的区域综合能源系统鲁棒规划(MatlabPython代码)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

寅家科技完成近亿元B1轮融资,加速高阶智能驾驶布局

近日,寅家科技宣布完成近亿元人民币B1轮融资,本轮融资由东方富海、深创投、深圳高新投联合投资,所募资金主要用于公司高阶智能驾驶技术产品的研发迭代,以及智能驾驶产品量产、海外市场开拓,从而进一步提升核心产品的市…

Solow模型推导模拟

Solow模型推导模拟 文章目录 Solow模型推导模拟[toc]1 Solow模型推导2 Solow模型模拟 1 Solow模型推导 在存在资本折旧、技术进步和人口增长条件下,有效劳动人均资本为 k ˙ ( t ) K ˙ ( t ) A ( t ) L ( t ) − K ( t ) [ A ( t ) L ( t ) ] 2 [ A ( t ) L ˙ …

腾讯云网站备案流程步骤、备案审核通过时间详细说明

腾讯云网站备案流程先填写基础信息、主体信息和网站信息,然后提交备案后等待腾讯云初审,初审通过后进行短信核验,最后等待各省管局审核,前面腾讯云初审时间1到2天左右,最长时间是等待管局审核时间,网站备案…

css新手引导实现方式总结

新手引导功能一般都是用一个半透明的黑色进行遮罩,蒙层上方对界面进行高亮,旁边配以弹窗进行讲解,样式如下 但是由于交互不同,实现方案也不一样,下面就针对不用的交互,总结了不同的实现方法(下文…

路由和寻址的区别

如果说传输层协议,除了 TCP/UDP,我们还可以有其他选择,比如 Google 开发的 QUIC 协议,帮助在传输层支持 HTTP 3.0 传输。但是在网络层,IP 协议几乎一统天下。IP 协议目前主要有两个版本 IPv4 和 IPv6。 根据 Google 统…

开发者一定要知道的 API 管理五大趋势

API First 大势所趋,APIaaS(API 作为服务)也将受到越来越多企业和组织的选择,研发团队对 API 研发管理工具的要求也水涨船高。 API 在今天的数字化世界中扮演着至关重要的角色,随着云计算、物联网、微服务尤其是 AI 等…