扩散模型在时间序列预测中的兴起

news2025/4/15 4:47:34

摘要

本文探讨了扩散模型在时间序列预测中的应用。扩散模型在生成式人工智能的各个领域展示了最先进的成果。本文包括扩散模型的全面背景资料,详细说明了它们的调节方法,并回顾了它们在时间序列预测中的应用。分析涵盖了11个具体的时间序列实现,它们背后的直觉和理论,在不同数据集上的有效性,以及彼此之间的比较。这项工作的主要贡献是对扩散模型在时间序列预测中的应用进行了深入的探索,并按时间顺序对这些模型进行了概述。此外,本文还对该领域的现状进行了深刻的讨论,并概述了潜在的未来研究方向。这为人工智能和时间序列分析的研究人员提供了宝贵的资源,为扩散模型的最新进展和未来潜力提供了清晰的视图。

论文:
The Rise of Diffusion Models in Time-Series Forecasting
作者:代尔夫特理工大学
Caspar Meijer, Lydia Y. Chen

生成式人工智能(AI)的出现已经在各个领域产生了变革,从教育[2,3,4]到工作场所[5,6]和日常活动[7]。这种转变的核心是深度学习,这是使人工智能能够分析和综合复杂数据模式的关键支柱。最初,生成人工智能的定义是它能够创建新的、原始的数据样本,这些样本反映了指定数据集的统计特征,数学上表示为:给定分布q(x)中的样本x,生成模型产生的输出x^似乎是从q(x)中提取的[8]。

在这里插入图片描述
在时间序列预测领域,解决方案空间随着时间的推移发生了相当大的变化。最初的进步标志着长短期记忆(LSTM)变体的引入,特别是Seq2Seq自动编码器-LSTM[20]。然而,随着Transformer结构的引入,2017年发生了重大的范式转变,该结构纳入了注意力机制[21]。这一创新解决了lstm的关键限制,即在扩展序列上丢失先前的信息[22]。基于transformer的模型的后续发展[23,24,25,26,27,28]进一步推动了该领域的发展。在生成建模领域,变分自编码器(VAEs)、归一化流(NFs)和生成对抗网络(GANs)等建模结构的引入取得了重大进展[29,30]。

然而,扩散模型的出现标志着一个革命性的时期,它有望提供高质量的输出,推动最先进的技术[31,32,33]。扩散模型的特点是,顾名思义,它们模拟了一个扩散过程,将数据转换为白噪声,然后将其反转回数据,如图1所示。这些模型能够近似原始数据分布,在图像[34,31,35,36]、文本[37,38,39]、语音[40,41]和视频合成[42,43,44,45]等多个领域都取得了优异的成绩。

时间序列

正如Koo和Kim[47]以及Lin等人[46]所强调的那样,时间序列建模是条件生成建模的一种特殊形式,其中时间序列的片段用于生成其他片段。这一领域包括三种关键类型:生成、估算和预测。生成是关于创建合成的时间序列数据;代入处理的是填补现有数据的空白,而预测是对未来值的预测。这些类型是相互关联的,预测是一种特定形式的归因,归因和预测都是生成的方面。本节将深入研究时间序列预测和评估度量的问题定义,以评估模型的性能。

在这里插入图片描述

扩散模型

扩散模型的基础工作由Ho等人[50]和Song等人[51]建立。这些基础是无条件生成数据,这意味着不依赖于特定条件(如文本提示)来创建数据样本。形式上,无条件生成可以被描述为将训练数据x视为一个分布q(x),从中可以提取由x 2 Rd描述的样本。现在的目标是将该分布近似为pθ(x),并能够从这个近似中采样新的未见过的数据[8]。

扩散模型通过学习数据在扩散到纯噪声后如何恢复来近似分布。该模型试图将高斯分布转换回图4所示的数据分布。这个过程使模型能够从噪声中生成数据样本,将噪声转化为类似于训练数据集的数据。

Ho等人[50]将扩散和去噪过程描述为离散步骤,Song等人[51]使用随机微分方程(SDE)将这些过程推广到连续时间。离散实现将在2.1节中描述,连续实现将在2.2节中描述。然而,如果需要特定的数据样本,无条件生成是没有用的。例如,生成包含通过文本提示描述的特定内容的图像[35]。第2.3节将进一步解释这种有条件的数据生成。

在这里插入图片描述
在这里插入图片描述

TSDiff

扩散模型在各种领域的生成建模任务中取得了最先进的性能。先前的时间序列扩散模型的研究主要集中在开发适合特定预测或估算任务的条件模型上。在这项工作中,我们探索了任务不可知的、无条件扩散模型在几个时间序列应用中的潜力。我们提出了TSDiff,一个无条件训练的时间序列扩散模型。我们提出的自引导机制能够在推理过程中为下游任务调节TSDiff,而不需要辅助网络或改变训练过程。我们在三个不同的时间序列任务上证明了我们的方法的有效性:预测、改进和合成数据生成。首先,我们证明了TSDiff与几种特定任务的条件预测方法(predict)是竞争的。其次,我们利用TSDiff学习的隐式概率密度来迭代地改进基本预测者的预测,减少了反向扩散的计算开销(改进)。值得注意的是,该模型的生成性能保持不变——使用来自TSDiff的合成样本训练的下游预测者的表现优于使用其他最先进的生成时间序列模型样本训练的预测者,有时甚至优于使用真实数据(合成)训练的模型。

这就提出了一个自然的研究问题:我们能否用一个无条件扩散模型来解决多个(甚至是有条件的)下游任务?具体来说,我们研究了任务不可知的无条件扩散模型用于预测任务的可用性。本文介绍了时间序列的无条件扩散模型TSDiff,并提出了两种利用该模型进行预测的推理方案。基于最近对引导扩散模型的研究[10,19],我们提出了一种自引导机制,可以在推理过程中调节模型,而不需要辅助网络。这使得无条件模型适用于本质上有条件的任意预测(和估算)任务3。我们进行了全面的实验,证明我们的自我指导方法在多个数据集和多个预测场景上与特定任务模型竞争,而不需要条件训练。此外,我们提出了一种方法,通过将TSDiff学习的隐式概率密度解释为基于能量的先验,迭代地改进基础预报员的预测,与反向扩散相比,计算开销减少。最后,我们证明了TSDiff的生成能力保持不变。我们在来自TSDiff的合成样本上训练了多个下游预测者,并表明在TSDiff样本上训练的预测者优于那些在变分自编码器[9]和生成对抗网络[57]样本上训练的预测者,有时甚至优于在真实样本上训练的模型。为了量化生成性能,我们引入了线性预测分数(LPS),我们将其定义为在合成样本上训练的线性脊回归模型的测试预测性能。TSDiff在几个基准数据集的LPS方面明显优于竞争生成模型。图1突出显示了TSDiff的三个用例:预测、改进和综合。

DIFFUSION-TS

摘要

消噪扩散概率模型(ddpm)正在成为生成模型的主要范式。它最近在音频合成、时间序列输入和预测方面取得了突破。在本文中,我们提出了一种新的基于扩散的框架Diffusion-TS,它通过使用具有解纠缠时间表示的编码器-解码器变压器来生成高质量的多变量时间序列样本,其中分解技术指导Diffusion-TS捕获时间序列的语义,而变压器从噪声模型输入中挖掘详细的顺序信息。与现有的基于扩散的方法不同,我们结合基于傅立叶的损失项,训练模型在每个扩散步骤中直接重构样本而不是重构噪声。扩散- ts被期望生成既满足可解释性又满足真实性的时间序列。此外,研究表明,该方法可以很容易地扩展到条件生成任务,如预测和imputation,而不需要改变模型。这也促使我们进一步探索扩散- ts在不规则设置下的性能。最后,通过定性和定量实验,结果表明扩散- ts在各种现实时间序列分析上取得了最先进的结果。

简介

时间序列在现实世界的问题中无处不在,在金融、医学、生物、零售和气候建模等广泛领域发挥着至关重要的作用(Lim & Zohren, 2021)。然而,在数据共享可能导致隐私泄露的某些情况下,缺乏对这些动态数据的访问是机器学习解决方案开发的关键障碍(Alaa等人,2021)。合成真实的时间序列数据被视为一种很有前途的解决方案,并且在深度学习的推动下受到越来越多的关注。 具有优于gan的感知质量,同时避免了对抗性训练的优化挑战,基于分数的扩散模型(Song et al., 2021;2020),特别是去噪扩散概率模型(ddpm) (Ho et al., 2020),已经占据了图像、视频和文本生成的世界(Ho et al., 2022;Li et al., 2022a;Dhariwal & Nichol, 2021;Harvey et al., 2022)比以往任何时候都受到风暴的影响。

扩散模型有希望推广到时间序列领域,以解决高质量时间序列生成的难题。尽管最近的一些研究率先将扩散模型扩展到时间序列相关的应用中,但几乎所有的扩散模型都是为任务不可知的生成(例如,imputation)而设计的(Tashiro等人,2021;Alcaraz & Strodthoff, 2022)和预测(Li et ., 2022b;Shen & Kwok, 2023b)),用附加信息训练和采样。与此同时,利用扩散模型进行无条件时间相关综合的罕见工作主要集中在单变量综合(Kong et al., 2021;Kollovieh et al., 2023)或短时间序列Lim et al.(2023)。但首先,这些基于扩散的方法(Lim et al., 2023;Das等人,2023)通常使用递归神经网络(rnn)作为主干来联合建模时间动态和复杂相关性。由于误差累积和推理速度慢,这些自回归方法的长期性能受到限制。第二个挑战在于,现实世界时间序列的趋势、季节性和局部特性等独立成分的大量组合通常会在扩散过程中逐渐向数据中添加噪声而被破坏。

CT 生成的作用

CT生成主要用于模拟基站、物联网设备或移动终端的流量生成模式,优化其通信资源,提高服务质量。具体来说,为了校准底层层次模型,在[29]中提出了LiTGen。这个开环流量生成器以每个用户和应用程序为基础对无线流量进行统计建模。已经证明,LiTGen在大范围的时间尺度上再现了捕获的流量的爆炸性和内部属性。为了估计传感器网络的网络寿命,[30]中的作者提出了一种不规则表面的流量生成模型,该模型集成了Elfes感知模型和事件生成模型。为了评估额外的模拟流量对移动无线网络性能的潜在影响,作者在[31]中展示了在塞尔维亚电信移动网络上使用TCP协议的多人实时游戏和M2M应用的流量建模和仿真结果。

我们首先关注web,邮件和P2P流量,并使用我们的生成器的简单版本生成三个独立的合成轨迹。使用这种所谓的基本LiTGen,所有流量实体都是使用从捕获的跟踪中提取的经验分布从更新过程中生成的。在随机变量之间没有引入其他附加依赖项。然后将三个合成路径合并为一个,并与由相同三个应用程序组成的过滤捕获流量进行比较。图2(a)显示了得到的LDE光谱。显然,基本LiTGen生成的合成轨迹(细曲线)与捕获的流量频谱(粗灰色曲线)不匹配。这个简单版本的LiTGen底层模型并不能很好地复制捕获的流量缩放结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1838470.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

20240613日志:大模型压缩方法COPAL

Location: Beijing 1 大模型剪枝 Fig. 1.1大模型压缩-剪枝 剪枝的分类:结构化修剪对于简化大型语言模型和提高其效率尤其相关。非结构化修剪关注的是选择性地去除单个权重,旨在消除网络中不那么关键的连接。 修剪的基于阶段的分类:修剪可以在…

zustand 状态管理库的使用 结合TS

zustand 是一个用于React应用的简单、快速且零依赖的状态管理库。它使用简单的钩子(hooks)API来创建全局状态,使得在组件之间共享状态变得容易。 React学习Day10 基本用法 安装:首先,你需要安装zustand库。 npm insta…

快速LLaMA:面向大型语言模型的查询感知推理加速 论文摘要翻译与评论

论文摘要翻译与评论 论文标题: QuickLLaMA: Query-aware Inference Acceleration for Large Language Models 提出的框架 我们Q-LLM框架的示意图。来自记忆上下文的输入被分割成记忆块,通过查询感知的上下文查找来搜索与查询相关的块。目前的键值缓存…

Ansys工程机械CAE应用白皮书

在工程机械领域,CAE技术已得到广泛而成功的应用,作为功能最全面、最有效高效也是全球用户数目最多的Ansys软件,在卡特皮勒(Caterpillar)、John Deere、LIEBHERR、ARDEN、三一重工、中联重科、JCB、VOLVO、小松 &#x…

Unity 之通过自定义协议从浏览器启动本地应用程序

内容将会持续更新,有错误的地方欢迎指正,谢谢! Unity 之通过自定义协议从浏览器启动本地应用程序 TechX 坚持将创新的科技带给世界! 拥有更好的学习体验 —— 不断努力,不断进步,不断探索 TechX —— 心探索、心进…

微信朋友圈的高级玩法:让你的动态更吸引人

微信朋友圈作为一个展示个人生活和分享观点的平台,已经深入人们的日常生活。然而,随着用户数量的增加,如何在众多朋友圈动态中脱颖而出,成为许多人追求的目标。本文将介绍四种高级玩法,帮助你提升朋友圈的吸引力&#…

【Unity】加速Unity编辑器模式启动时间

Unity每次Play之后都会Reload Script Assemblies(重新加载脚本程序集)。 如果我们没有使用很多Assem,则并不需要在播放前重新编译。 可以在设置中将此事的重新编译关闭。 在Edit > Project Settings > Editor 面板中 找到Enter Play…

127.0.0.1与本机IP地址的区别

大家好,今天我们来聊聊一个在网络世界中常常被提及,但可能对于非专业人士来说还有些模糊的概念——127.0.0.1与本机IP地址。这两个地址在网络通信中都扮演着重要的角色,但它们之间又有着怎样的区别呢?让我们一起来探究一下。 一、…

关于JS中的.this

什么是.this? 在JavaScript中,this是一个非常重要的概念,它指的是函数执行的上下文对象。this的值取决于函数是如何被调用的,而不是在哪里被定义的。 .this的指向 在不同的场景中,.this指向并不是唯一的,下面举几个…

Java基础——异常详解(Error 与 Exception )

Java异常主要分为 Error 和 Exception 两种 Error: Error 类以及他的子类的实例,代表了JVM本身的错误。错误不能被程序员通过代码处理。 EXception: Exception 以及他的子类,代表程序运行时发送的各种不期望发生的事件。可以被J…

禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》Chapter 10插图

禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》 Chapter 10插图

C# 索引器与迭代器分部类详情

文章目录 一、迭代器二、查看Foreach执行中间语言三、foreach实现过程总结四、实现迭代器最常用的方法五、分布类概述及其使用六、索引器概述及声明七、索引器在类中的使用八、索引器在接口中的使用九、总结 一、迭代器 1、迭代器(iterator)解决的是集合…

饮食中的隐形杀手,该如何避免?

塑料发明至今,口碑经历了过山车式的翻转。 上世纪,塑料曾被誉为20世纪最伟大的发明之一,围绕着塑料科学研究诞生出了好几位诺贝尔奖得主。 1953年,因在高分子化学方面的贡献,德国科学施陶丁格获诺贝尔化学奖&#xf…

Stable Diffusion 秋叶整合包v4.7 :解压即用,快速入门AI绘画

Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡,来自B站up秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署S…

中国各区域人口密度可视化图

原文链接https://mp.weixin.qq.com/s?__bizMzUyNzczMTI4Mg&mid2247674303&idx1&sn830304f80a0429406c4a5e38dc7750ec&chksmfa777682cd00ff9434e4660bb52ab2bf19913b6732083de061664401a9ac0fa46581cd9e5e86&token1445576002&langzh_CN&scene21#we…

【TB作品】MSP430G2553,单片机,口袋板,流量积算仪设计

题9 流量积算仪设计 某型流量计精度为0.1%, 满刻度值为4L/s,流量计输出为4—20 mA。 设计基于MSP430及VFC32的流量积算仪。 具体要求 (1) 积算仪满刻度10000 L,精度0.1 L; 计满10000 L,自动归零并通过串口(RS232)向上位…

Llama 3 大型语言模型到底是如何炼成的?

Meta 在今年 4 月开源了 Llama 3 大型语言模型,这是 Meta,也是整个行业迄今为止功能最强大的开源 LLM。 那么 Meta 是如何训练 Llama 3 大型语言模型的,又在训练过程中遇到了什么问题,提出了什么新的解决方案呢?近日&…

【Nodejs 日志库 】

总结了几个比较好用的Nodejs日志库,我认为一个 合格的日志库 需要 支持多种传输,如文件、控制台、HTTP 等。可定制的日志级别和格式。异步日志记录。 根据上述的需求,挑选出 几款比较好用的日志库, 1. Winston(Gith…

如何灵活运用keil工具进行问题分析(2)— 定位FreeRTOS的栈溢出导致hardfault问题

前言 (1)如果有嵌入式企业需要招聘湖南区域日常实习生,任何区域的暑假Linux驱动实习岗位,可C站直接私聊,或者邮件:zhangyixu02gmail.com,此消息至2025年1月1日前均有效 (2&#xff0…

防火墙中的NAT

防火墙的NAT NAT分类 源NAT 基于源IP地址进行转换。 我们之前接触过的静态NAT,动态NAT,NAPT都属于源NAT,都是针对源IP地址进行转换的。源NAT主要目的是为了保证内网用户可以访问公网。 先执行安全策略,后执行NAT 目标NAT 基于…