收藏|多指标时序预测方式及时序特征工程总结

news2024/11/18 13:53:43

背景

现如今,随着企业业务系统越来越复杂,单指标时间序列预测已不能满足大部分企业需求。在复杂的系统内,如果采用单一的指标进行时间序列预测,由于各个指标相互作用的关系,因此会因为漏掉部分指标因素导致出现预测精确度下降的情况。基于以上背景,多指标时间序列预测出现了。多指标时间序列预测可以将目标值涉及到的所有因素均考虑在内,因此提高了预测的准确性。

时间序列概念

时间序列是一组按照时间发生先后顺序进行排列的数据点序列。具有以下特点:

  • 通常一组时间序列的时间间隔为一恒定值;

  • 往往具有有意义的可探究的特征,如趋势性、周期性等;

  • 时间序列会包含一定程度的噪音,即随机特征。

在这里插入图片描述

预测的基本任务

单指标时序预测任务是给定某一个指标的历史变化情况,预测其在未来一段时间内的变化。多指标时序预测任务则是给定某几个指标的历史变化情况,预测其在未来一段时间内的变化。多指标时序预测任务与单指标时序预测任务的区别在于几个指标之间不一定相互独立,而是存在某种影响。

在这里插入图片描述

评价指标

下图为时间序列模型常用评价指。在使用过程中,需根据实际的数据特征和指标特性进行选择。

在这里插入图片描述

预测方式

示例:假设一个时间序列为 [1,2,3,4,5,6,7,8,9,10,X,Y,Z],通过 [1,2,3,4,5,6,7,8,9,10] 预测 [X,Y,Z]。

  • 单步预测

    单步预测是用 [8,9,10] 预测 [X]。即通过过去三个时间戳的值 [8,9,10] 来预测未来一个时间点的值,该模型也叫三阶滞后模型。

  • 直接多步预测

    直接多步预测是先通过 [8,9,10] 预测 [X],同样的方法通过 [8,9,10] 预测 [Y] 和 [Z]。该方式的缺点是预测多少个时间点的值就需要构建多少个模型,因此计算的时间和空间复杂度均非常高。

    • model1:[1,2,3,4,5,6,7,8,9],[X]
      
    • model2:[1,2,3,4,5,6,7,8,9],[Y]
      
    • model3:[1,2,3,4,5,6,7,8,9],[Z]
      
  • 递归多步预测

    递归多步预测是通过 [8,9,10] 预测 [X],随后根据预测到的 [X] 加 [9,10] 预测 [Y]。该方式由于是通过预测得到的值再次预测,因此会造成误差累计的情况,从而预测结果的精准度会持续下降。

    • [8,9,10] 得到 prediction(X);
      
    • [9,10,prediction(x)],然后 prediction(y),依次类推。
      
  • 混合模型

    混合模型集合了直接多步预测和递归多步预测的优点。通过 [8,9,10] 预测 [X],随后根据预测到的 [X] 加 [8,9,10] 预测 [Y]。

    • [8,9,10] 预测 [X],
      
    • [8,9,10,pre(X)] 预测 [Y]
      
  • 多输出预测

    多输出预测是通过 [8,9,10] 直接一次性将 [X,Y,Z] 预测出来。

    • [8,9,10] 预测 [X,Y,Z]
      

时序特征工程

经调研,时序特征工程应从时间戳衍生特征、时序值衍生特征、属性变量衍生特征以及特殊周期性构造四方面着手。

时间戳衍生

时间戳衍生出来的变量包含时间特征、布尔特征、时间差特征三大类。

时间特征: 包含年、季度、月、周、天(一年、一月、一周的第几天)、小时、分钟等。

在这里插入图片描述

布尔特征: 包含是否年初/年末、是否月初/月末、是否周末、是否节假日、是否特殊日期、是否早上/中午/晚上等。

在这里插入图片描述

时间差特征: 包含距离年初/年末的天数、距离月初/月末的天数、距离周末的天数、距离节假日的天数以及距离特殊日期的天数等。

在这里插入图片描述

时序值衍生

时序值衍生出来的变量包含滞后特征、滑动窗口统计、扩展窗口统计三大类型。

滑动窗口统计: 时间序列的一个重要特性就是当前或未来预测值与历史值是息息相关的,通过滑动窗口构造窗口统计量则可以解决数值之前这种强相互关系的问题。

扩展窗口统计: 扩展窗口用来统计的数据是整个序列全部的数据,统计值可以是平均数、中位数、标准差、最大值、最小值等,这种特征一般是用在多序列建模,比如不同的股票价格,可能会有着不同的内在属性,在预测的时候用这个特征作为区分也是一种方式。

在这里插入图片描述

滞后特征: 滞后特征是一种特殊的滑动窗口。如下图所示,若需预测2012/10/2/ 15:00 的值 [5584],假设时间窗口长度为3,则可以使用 [5026,4918,5181] 进行预测。如果将 y 向下移动一个时间窗口,构造多个时间特征,则可以看出下图竖列的蓝色框可以变成横向的蓝色框,此时如需预测下图黄色框问号处的值,必定采用的是 [4918,5181,5584]。

在这里插入图片描述

属性变量衍生的特征

连续变量衍生

一个序列可能会伴有多个连续变量的特征,比如说对于股票数据,除了收盘价,可能还会有成交量、开盘价等伴随的特征,对于销量数据,可能还会伴随有价格的特征。对于这种连续变量,可以直接作为一个特征,也可以像之前时序值衍生的特征那样做处理,或者也可以与先前的数据做差值,比如t时刻的价格减去t-1时刻的价格。

类别变量衍生

对于类别型变量,如果类别比较少,一般在机器学习里做的处理是one-hot encoding,但是如果类别一多,那么生成的特征是会很多的,容易造成维度灾难,但是也不能随便用label encoding,因为很多时候类别是不反应顺序的,如果给他编码成1、2、3、4、5,对于一些树模型来说,在分裂节点的时候可不管这些是类别型还是连续型,通通当作连续型来处理,这是有先后顺序的,肯定不能这么做。所以就有这么一种方式,就是和y做特征交互,比如预测销量,有一个特征是产品类别,那么就可以统计下这个产品类别下的销量均值、标准差等,这种其实也算是上面扩展窗口统计的一种。

特殊周期性变化

时间序列是有周期性的,比如一天、一周或是一年。由于 sin 与 cos 函数均只能体现半周期性,故时间序列的周期性需通过构造 sin 与 cos 函数作为两列特征来提前全周期性。

在这里插入图片描述

时间序列整体预测流程

下图为时间序列整体预测流程图。左边蓝色框为特征工程,当获取到原始数据时,需先判断是否考虑时间戳信息,是否考虑星期信息,是否考虑周末信息等。随后与人工输入的节假日信息矩阵形成特征矩阵A。此时,所有的时间戳信息均已考虑完整,但是仍缺少了时间序列本身的滞后特性。此时,随红色箭头达到下图右侧,判断是否考虑时间序列滞后特性,判断完毕后,形成全新组合B,随后将组合B输入进模型,通过连续递归计算最终数值。

在这里插入图片描述

开源项目推荐

云智慧已开源数据可视化编排平台 FlyFish 。通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现符合自己业务需求的炫酷可视化大屏。 同时,飞鱼也提供了灵活的拓展能力,支持组件开发、自定义函数与全局事件等配置, 面向复杂需求场景能够保证高效开发与交付。

如果喜欢我们的项目,请不要忘记点击下方代码仓库地址,在 GitHub / Gitee 仓库上点个 Star,我们需要您的鼓励与支持。此外,即刻参与 FlyFish 项目贡献成为 FlyFish Contributor 的同时更有万元现金等你来拿。

GitHub 地址: https://github.com/CloudWise-OpenSource/FlyFish

Gitee 地址: https://gitee.com/CloudWise/fly-fish

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/11465.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

进程间的通信 - 剪切板

剪切板是系统维护管理的一块内存区域,本机的所有进程都可以访问。当一个进程复制数据时,先将数据放在该内存区,当另一个进程粘贴时,则是从该内存区块取出数据 剪切板操作: 其实在剪切板中也就那几个API在使用&#x…

tf模型落地安卓之旧事重提

之前将tf模型落地安卓了,其实就是clone一下官方的代码,然后配置下环境就打包了,没啥技术含量,现在再看,问题就在环境配置了。 1,Unable to start the daemon process. Q Group 277356808 The project use…

西安某1000M3浮顶油罐设计(成品油库1000m³油罐设计与制造工艺)

目 录 1 浮顶油罐及其发展概况 2 2 设计方案 3 2.1 各种设计方法 3 2.2 各种方法优缺点比较 3 2.3 油罐的基础 4 3 罐壁设计 5 3.1 罐壁的强度计算 5 3.2 浮顶油罐的风力稳定计算 6 3.3 浮顶油罐的抗震计算 9 3.4 罐壁结构 14 4 罐底设计 18 4.1 罐底结构设计 18 4.2 罐底的应…

【离散数学】第三章 测试

1.单选题 A&#xff1d;{1,2,3},A上关系R{<1,2>,<2,2>,<2,3>,<3,3>}&#xff0c;则t(R) A. {<1,2>,<2,2>,<2,3>,<3,3>} B. {<1,2>,<1,3>,<2,2>,<2,3>,<3,3>} C. {<1,1>,<2,2>,<…

【面试宝典】Spring Boot 系列面试题

1、什么是 Spring Boot? 多年来&#xff0c;随着新功能的增加&#xff0c;spring 变得越来越复杂。如果必须启动一个新的 Spring 项目&#xff0c;我们必须添 加构建路径或添加 Maven 依赖关系&#xff0c;配置应用程序服务器&#xff0c;添加 spring 配置。 因此&#xff0c…

Vue(九)——页面路由(1)

目录 路由的简介 路由基本使用 几个注意点 嵌套&#xff08;多级&#xff09;路由 路由的query参数 命名路由 路由的params参数 路由的props配置 路由的简介 理解&#xff1a; 一个路由&#xff08;route&#xff09;就是一组映射关系&#xff08;key - value&#xff…

【毕业设计】深度学习身份证识别系统 - 机器视觉 python

文章目录0 前言1 实现方法1.1 原理1.1.1 字符定位1.1.2 字符识别1.1.3 深度学习算法介绍1.1.4 模型选择2 算法流程3 部分关键代码4 效果展示5 最后0 前言 &#x1f525; Hi&#xff0c;大家好&#xff0c;这里是丹成学长的毕设系列文章&#xff01; &#x1f525; 对毕设有任…

第八章: 项目质量管理

一、规划质量管理 识别项目及其可交付成果的质量要求和标准&#xff0c;并书面描述项目将如何证明符合质量要求和标准的过程。主要作用为整个项目期间如何管理和核实质量提供指南和方向。 输入工具与技术输出 1.项目章程 2.项目管理计划 需求管理计划风险管理计划相关方参与计…

C++ opencv图像直方图

1.图像直方图概念 图像有很多基础概念&#xff0c;在我们学习的过程中因为一些原因无法涉及&#xff0c;但这并不代表它们不重要 今天&#xff0c;我们就来介绍一个概念——图像直方图 图像直方图&#xff0c;是图像处理中很重要的一个基础概念&#xff0c; 有很多的算法&…

用HTML+CSS做一个漂亮简单的旅游网站——旅游网页设计与实现(6页)HTML+CSS+JavaScript

&#x1f468;‍&#x1f393;学生HTML静态网页基础水平制作&#x1f469;‍&#x1f393;&#xff0c;页面排版干净简洁。使用HTMLCSS页面布局设计,web大学生网页设计作业源码&#xff0c;这是一个不错的旅游网页制作&#xff0c;画面精明&#xff0c;排版整洁&#xff0c;内容…

(八)Java算法:堆排序(详细图解)

目录一、前言1.1、概念1.2、大根堆特点二、maven依赖三、流程解析3.1、初始建堆3.2、堆化第一步3.2、堆化第二步3.3、堆化第三步3.4、堆化第四步3.5、堆化第五步3.6、堆化第六步四、编码实现4.1、代码实现4.2、运行结果&#xff1a;扩展一、前言 1.1、概念 根据堆的结构可以分…

彩印图文版《Elasticsearch实战》文档,阿里内部共享,堪称精品

学习是一种基础性的能力。然而&#xff0c;“吾生也有涯&#xff0c;而知也无涯。”&#xff0c;如果学习不注意方法&#xff0c;则会“以有涯随无涯&#xff0c;殆矣”。 学习就像吃饭睡觉一样&#xff0c;是人的一种本能&#xff0c;人人都有学习的能力。我们在刚出生的时候…

Lesson1强化学习(RL)初印象 学习笔记

一、强化学习引入 ​ 人的智能可以遗传获得也可以通过后天学习&#xff1b;学习有两种&#xff0c;模仿前人的经验是一种学习&#xff1b;如果没有前人的经验可以学习&#xff0c;就需要和环境进行交互&#xff0c;得到反馈来学习。 #mermaid-svg-XUxguPj6VHcJMK3W {font-famil…

the account is locked

感谢阅读问题描述解决方案1.WinR打开命令行输入&#xff1a;sqlplus &#xff0c;或者使用sqlplus / as sysdba;无需输入密码。2.假设我们要解锁的账户是scott3.修改密码&#xff0c;从而避免再次被锁4.重启服务或者客户端&#xff08;看你是桌面版还是服务器版&#xff09;&am…

警惕,3D建模为什么选3dsMAX不选MAYA

如今现在的游戏建模都是次世代建模&#xff0c;3DMAX确实是主流软件之一&#xff0c;但是为什么说MAYA更好呢❓ 首先&#xff0c;两款软件都很适合用现代的建模&#xff0c;但是难度上有一定的差异❌ • 软件区别 &#x1f340;3DSMAX&#xff1a; 它是目前使用最广泛的3d软…

十、Mysql的DQL语句

Mysql的DQL语句十、Mysql的DQL语句select的查询一、查看系统参数二、select常用函数三、select的单表查询1、from子句2、where子句2.1 where配合等值查询2.2where配合比较操作符(> < > < <>)2.3where配合逻辑运算符(and or )2.4where配合模糊查询2.5where配合…

流量控制可靠传输机制停止-等待协议

注&#xff1a;最后有面试挑战&#xff0c;看看自己掌握了吗 文章目录链路层流量控制和传输层的流量控制区别停止-等待协议为什么要有停止等待协议无差错情况滑动窗口协议后退N帧协议GBN选择重传协议SR可靠传输流量控制&#x1f343;博主昵称&#xff1a;一拳必胜客 &#x1f3…

供应链全流程计划与排产解决方案核心功能概要

通过数字智能化运营实现将本增效至为重要。 许多企业的业务现状是销售、生产计划与市场不匹配&#xff0c;企业的运营效率低且成本高&#xff1a; 销售计划计划需要大量的人员进行沟通&#xff0c;销售预测的分析维度少、粒度粗&#xff0c;不仅效率低&#xff0c;且预测只是一…

【mycat】常用分片规则

一、 常用分片规则 1、取模 ​ 此规则为对分片字段求摸运算。也是水平分表最常用规则 2、分片枚举 ​ 通过在配置文件中配置可能的枚举 id&#xff0c;自己配置分片&#xff0c;本规则适用于特定的场景&#xff0c;比如有些业务需要按照省份或区县来做保存&#xff0c;而全…

Delphi Enterprise具有强大视觉设计功能

Delphi Enterprise具有强大视觉设计功能 Delphi可帮助您使用Object Pascal为Windows、Mac、Mobile、IoT和Linux构建和更新数据丰富、超连接、可视化的应用程序。Delphi Enterprise适用于构建客户端/服务器或多层应用程序、REST服务等的开发团队。 Delphi功能 单一代码库-用更少…