时间序列顶会一网打尽!时间序列基础模型的最新进展!

news2024/12/24 16:52:49

前言

最近时间序列基础模型领域,迎来了里程碑式的突破。

TimeGPT作为首个原生基础模型,于去年八月问世,一发布就震撼了预测领域。

众多其他基础模型也相继发布,包括但不限于:

  • TimesFM

  • MOIRAI

  • Tiny Time Mixers(TTM)

  • MOMENT

本文将深入探讨这些更新内容——包括新的基准测试和改进后的模型变体。

TimesFM——谷歌的基础模型

最新更新: 模型权重最近已在Hugging Face上公开!

谷歌凭借TimesFM这一拥有2000亿参数的基础模型,正式加入了时间序列基础模型的竞争行列。

构建大型时间序列模型的一大难题在于数据的稀缺性,找到优质且多样化的公开时间序列数据极具挑战性。

而TimesFM团队通过利用Google Trends和WikiPage浏览量等数据源,扩展了训练数据集。

最终模型在1000亿个真实世界的时间点上进行了预训练。

从架构上看,TimesFM是一款基于Transformer的模型,它利用规模优势进行时间序列预测(如图1所示):

TimesFM 架构概述

TimesFM的秘密在于它巧妙地结合了patching技术(而这对语言模型大有裨益)和生成式预训练模型中的仅解码器风格。

那么,patching技术是如何工作的呢?

就像文本模型预测下一个单词一样,时间序列基础模型则预测下一个时间点段的patching。

patching之所以有效,是因为它将一段时间点窗口视为一个标记,从而利用局部时间信息创建丰富的表示。

这有助于TimesFM更有效地捕捉时间动态,从而做出更准确的预测(如图2所示):

图2:使用TimesFM进行时间序列预测,多步预测的时间范围为30个数据点,频率为每半小时一次。

作者已经发布了针对单变量情况的模型权重和推理代码,并计划发布带有扩展API的新模型变体,以便进行微调。

现在就差公开预训练数据集了

MOIRAI——Salesforce的基础模型

**最新更新:**Salesforce已将该模型、权重、预训练数据集以及新模型变体开源!

您可以在AI Projects文件夹中找到MOIRAI的动手教程!

Salesforce发布MOIRAI的时间与TimesFM大致相同。MOIRAI因其独特的Transformer编码器架构而脱颖而出,该架构旨在处理时间序列数据的异质性和复杂性。

MOIRAI的关键特性包括:

  • 多补丁层:MOIRAI通过为每个频率学习不同的补丁大小来适应多种频率。

  • 任意变量注意力:一种优雅的注意力机制,尊重各变量之间的排列差异,并捕捉数据点之间的时间动态。

  • 参数分布混合:MOIRAI优化学习分布的混合体,而非假设单一分布。

MOIRAI 架构

与TimesFM相比,MOIRAI为时间序列引入了众多新颖特性。

它改进了传统的注意力机制(任意变量注意力),并考虑了不同的时间序列频率。

但MOIRAI(以及每个基础模型)的有效性在很大程度上取决于其预训练数据集。

MOIRAI在LOTSA数据集上进行了预训练,LOTSA是一个包含九个领域、共计270亿条观测记录的庞大数据集。(该数据集也已公开)

这一广泛的数据集结合模型的创新架构,使得MOIRAI成为理想的零样本预测器——能够迅速且准确地预测未见过的数据。

图4和图5展示了MOIRAI-large在日前能源预测任务中的表现(来自AI Projects文件夹中的MOIRAI教程):

图4:MOIRAI的次日能量预测(千瓦时),包含预测区间(图片由作者提供)。”

图5:MOIRAI-large的表现优于强大的统计模型。这些统计模型是针对每个时间序列单独训练的,而MOIRAI的预测则是零样本预测(即没有在这些数据上进行训练)。

最后,MOIRAI的一个显著优势在于其多变量预测能力,我们可以添加过去观测到的协变量或未来已知输入(如节假日)。

这使得MOIRAI特别适用于那些可以通过外部信息增强的时间序列案例(如交易、能源需求预测等)。

Tiny Time Mixers (TTM)

IBM研究团队的基础模型

**最新更新:**作者最初开源了一个快速版本TTM-Q。

几个月后,他们更新了论文,描述了具有新特性(如可解释性)的更好模型变体,并将这些变体也开源。

大家可以在AI Projects 文件夹中找到TTM-Q(零样本和微调)的动手项目!

TTM是一个独特的模型,它采用了与上述模型不同的方法:

它不是Transformer模型!

同时,TTM轻巧且性能优于其他更大的基础模型。

TTM的主要特点包括:

  • 非Transformer架构:TTM使用全连接神经网络层而非注意力机制,因此速度极快。

  • TSMixer基础架构:TTM采用IBM突破性时间序列模型TSMixer

  • 丰富的输入能力:TTM擅长处理多变量预测,能够接收额外通道、外生变量以及已知的未来输入。

  • 快速且强大:TTM-quick版本在Monash数据集的2.44亿个样本上进行了预训练,仅使用6个A100 GPU便在不到8小时内完成。

图6展示了TTM架构的顶层视图:

图6:TTM架构的顶层视图,左侧为预训练阶段,右侧为微调阶段。

TTM的运作分为两个阶段:预训练和微调

  • 预训练阶段:模型仅使用单变量时间序列进行训练,充分利用历史信息和局部季节性模式。

  • 微调阶段:模型接收多变量数据,并通过启用通道混合器过程(如图6所示)学习这些变量之间的相互依赖关系。

在微调过程中,核心层保持不变,使得整个过程轻量级。模型还可以选择性地通过激活外生变量混合器(如图7所示)来使用已知的未来协变量,以进一步提升性能。

图7:TTM-Q在温度预测任务中对CO2浓度(mmol/mol)的预测

此外,作者还创建了具有不同参数大小、上下文长度(sl)和预测长度(fl)的新模型变体:

  • **TTM-Base (TTM_B):**100万参数,sl=512,pl=64

  • **TTM-Enhanced (TTM_E):**400万参数,sl=1024,pl=128

  • **TTM-Advanced (TTM_A):**500万参数,sl=1536,pl=128

  • **Quick-TTM (TTMQ):**包含两个变体,分别对应sl/pl = (512,96)和(1024,96)。

作者展示了这些模型在基准测试中表现更佳。

在最终迭代中,作者还解决了可解释性问题,新变体能够提供特征重要性分析(如图8所示)。

总的来说,TTM是一款卓越的模型,其不依赖繁重的Transformer运算的方法为众多有趣的可能性开辟了道路。

MOMENT

**最新动态:**作者已开源了最大的变体MOMENT-large及其预训练数据集Time-Series Pile。

与以往的模型不同,MOMENT作为一款通用时间序列模型,能够胜任预测、分类、异常检测和插值等多种任务。

MOMENT在GPT4TS和TimesNet等同样面向多时间序列任务的模型基础上进行了改进。

以下是MOMENT的关键特性:

  • 基于LLM:利用T5模型来处理五种时间序列任务。

  • 轻量级执行:适合在有限资源下快速执行。

  • 零样本预测:在零样本场景下表现出色,且可通过微调进一步优化性能。

  • 采用patching技术:与上述模型类似,MOMENT将时间点子序列视为标记,从而提升推理速度。在预训练阶段,MOMENT会对时间点进行归一化处理,并将它们打包成嵌入表示。这些嵌入表示随后被处理以重建原始时间点。

因此,MOMENT的预训练过程类似于BERT的训练方式(掩码语言建模):随机遮挡输入时间序列的部分内容,并训练模型以最优方式重建它们(如图9所示)。

图9:MOMENT预训练阶段的顶层架构

使用T5编码器预训练了三个模型变体:T5-Small(4000万参数)、T5-Base(1.25亿参数)和T5-Large(3.85亿参数)。

这些变体在多样化的数据集(Time-Series Pile)上进行了预训练,使模型能够在未见过的数据上具备良好的泛化能力。

如何使用MOMENT

此外,MOMENT既可以作为零样本预测器使用,也可以通过微调来提升性能。

针对特定任务微调后的MOMENT模型系列(MOMENT-LP)在基准测试中展现出了令人鼓舞的结果,往往能够超越更大、更复杂的模型。

总结

基础NLP模型激发了人们对于大型语言模型(LLMs)在时间序列预测领域应用的浓厚兴趣。

TimeGPT自发布以来虽不足一年,但已吸引众多大型企业和研究人员投入时间与精力进行模型开发。

基础时间序列模型将对实际应用产生深远影响,时间序列数据广泛应用于零售、能源需求、经济分析以及医疗健康等多个领域。

类似GPT-4在文本处理中的广泛应用,一个基础时间序列模型也能以极高的准确性应用于各种时间序列案例。

当然,这一领域仍有巨大的提升空间,这也是本文所探讨的每个模型持续更新的原因所在。

最后的最后

感谢你们的阅读和喜欢,我收藏了很多技术干货,可以共享给喜欢我文章的朋友们,如果你肯花时间沉下心去学习,它们一定能帮到你。

因为这个行业不同于其他行业,知识体系实在是过于庞大,知识更新也非常快。作为一个普通人,无法全部学完,所以我们在提升技术的时候,首先需要明确一个目标,然后制定好完整的计划,同时找到好的学习方法,这样才能更快的提升自己。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

大模型知识脑图

为了成为更好的 AI大模型 开发者,这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

经典书籍阅读

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。

在这里插入图片描述

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

面试资料

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下

在这里插入图片描述

640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2194486.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue83 引入elementUI

笔记 安装插件 安装按需引入插件 代码 ### App.vue <template><div><button>原生的按钮</button><input type"text"><atguigu-row><atguigu-button>默认按钮</atguigu-button><atguigu-button type"pr…

Pikachu-Sql-Inject -基于boolian的盲注

基于boolean的盲注: 1、没有报错信息显示&#xff1b; 2、不管是正确的输入&#xff0c;还是错误的输入&#xff0c;都只显示两种情况&#xff0c;true or false&#xff1b; 3、在正确的输入下&#xff0c;输入and 1 1/and 1 2发现可以判断&#xff1b; 布尔盲注常用函数&…

MySQL连接查询:外连接

先看我的表结构 dept表 emp表 外连接分为 1.左外连接 2.右外连接 1.左外连接 基本语法 select 字段列表 FORM 表1 LEFT [OUTER] JOIN 表2 ON 条件;例子&#xff1a;查询emp表的所有数据&#xff0c;和对应部门的员工信息&#xff08;左外连接&#xff09; select e.*, d.n…

全网最详细大语言模型(LLM)入门学习路线图

Github项目上有一个大语言模型学习路线笔记&#xff0c;它全面涵盖了大语言模型的所需的基础知识学习&#xff0c;LLM前沿算法和架构&#xff0c;以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份…

假期顺便测试了一下高德POI的准确度及对景区地图的一些感想

所使用的测试工具: GIS 移动端工具 1.山西大同乌龙峡 2.山西大同昊天寺 3.山西大同火山地质公园 4.山西大同忘忧农场 总的来说高德精度还是不错的&#xff0c;测试的几个位置都比较准确&#xff01;但景区内部的目标不是很全&#xff0c;内部小的位置完全没有标记&#xff01…

C语言 | Leetcode C语言题解之第461题汉明距离

题目&#xff1a; 题解&#xff1a; int hammingDistance(int x, int y) {int s x ^ y, ret 0;while (s) {s & s - 1;ret;}return ret; }

HDLBits中文版,标准参考答案 |2.5 More Verilog Features | 更多Verilog 要点

关注 望森FPGA 查看更多FPGA资讯 这是望森的第 7 期分享 作者 | 望森 来源 | 望森FPGA 目录 1 Conditional ternary operator | 条件三目运算符 2 Reduction operators | 归约运算器 3 Reduction: Even wider gates | 归约&#xff1a;更宽的门电路 4 Combinational fo…

时域交织ADC建模文档

时域交织ADC建模文档 Time-interleaved SAR ADC modeling 32-way 6-bit TI SAR ADC 发货内容 仅有19页PDF&#xff0c;内有MATLAB代码&#xff08;3页&#xff09; MATLAB建模&#xff1b;TI SAR ADC;

微博创作平台:编辑技巧

文章目录 I 编辑技巧II 变形工具微博个人认证升级体系(橙V、金V体系规则)广告共享计划V+粉丝订阅I 编辑技巧 图片和视频一起发的时候,要求图+视频的总数不能大于9.微博app编辑文字时,图N可自动链接图片,例如图1可自动关联第一张图片,点击文字可直接打开第一张图片 II 变形…

GPU Puzzles讲解(二)

GPU-Puzzles项目是一个很棒的学习cuda编程的项目&#xff0c;可以让你学习到GPU编程和cuda核心并行编程的概念&#xff0c;通过一个个小问题让你理解cuda的编程和调用&#xff0c;创建共享显存空间&#xff0c;实现卷积和矩阵乘法等 https://github.com/srush/GPU-Puzzleshttp…

羚羊种类检测系统源码分享

羚羊种类检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Vision …

项目——超级马里奥——Day(3)

一、游戏开发思路&#xff1a; 1.Frame--->BackGround--->Obstacle---->BufferedImage&#xff0c;人物等 2.BackGround的构造函数&#xff1a; 只要记住窗口里边的每一个场景&#xff0c;只要游戏一开始就已经出现在屏幕里边的&#xff0c;都是在构造函数里边 3.绘…

就业市场需求分析:基于前程无忧岗位数据分析

背景介绍&#xff1a;在前程无忧网站&#xff0c;以"数据分析师""武汉"作为搜索关键词&#xff0c;爬取50页岗位数据合计980条。以该数据为基础&#xff0c;从岗位搜索匹配度、HR活跃度、不同区域/行业/企业的岗位数量和薪资分布等角度进行分析。 1、原始数…

自动驾驶 车道检测实用算法

自动驾驶 | 车道检测实用算法 车道识别是自动驾驶领域的一个重要问题&#xff0c;今天介绍一个利用摄像头图像进行车道识别的实用算法。该算法利用了OpenCV库和Udacity自动驾驶汽车数据库的相关内容。 该算法包含以下步骤&#xff1a; 摄像头校准&#xff0c;以移除镜头畸变&…

百度所有网页都打不开,可能是这个原因

今天笔记本连着手机热点在使用浏览器&#xff0c;突然百度的网页就打不开了&#xff0c;不管是百度一下、百家号、百度汉语、百度经验&#xff0c;只要是百度旗下的网页全都打不开,浏览器直接显示下图这个样子。但是别的网页都能正常打开。 然后我赶紧试了一下ping命令&#xf…

cnn突破五(三层bpnet网络公式)

三层网络反向传播公式推导&#xff1a; X【196】-》HI【80】/HO【80】-》YI【10】/YO【10】&#xff0c;期望是d【10】 X&#xff0c;HI之间用w1【196&#xff0c;80】 HO&#xff0c;YI之间用w2【80,10】 k10;j80;i196 (yo[k]-d[k])*ds(yo[k])*ho[j]; (yo[k]-d[k])*ds(yo[…

推荐一款强大的书签管理工具,让你的网址不在落灰

在信息爆炸的互联网时代&#xff0c;我们每天都会浏览大量的网页&#xff0c;收藏各种各样的网址。然而&#xff0c;随着时间的推移&#xff0c;这些杂乱无章的书签往往让我们感到头疼。别担心&#xff0c;今天我要向你推荐一款强大的书签管理工具&#xff0c;它将帮助你轻松整…

训练验证器解决数学应用题

人工智能咨询培训老师叶梓 转载标明出处 数学问题解决不仅要求模型能够理解问题的语言表述&#xff0c;还要求其能够准确地执行一系列数学运算&#xff0c;每一步的准确性都至关重要。遗憾的是&#xff0c;现有的语言模型在这一领域的性能远远未能达到人类的水平&#xff0c;它…

小绿书开启副业模式(保姆级教程)

大家好&#xff0c;我是凡人。 是一个不黑、不吹、不跟风、有知识、有骨气的五好小号主。 好多小伙伴给我私信&#xff0c;问我有最近没有非常火爆的副业项目&#xff0c;现在很多赛道人满为患&#xff0c;有没有值得推荐的&#xff0c;别说还真有&#xff0c;可能大家都没注…

理解Spring中静态代理

参考https://blog.csdn.net/weixin_43005654/article/details/109317773 无论是静态代理还是动态代理&#xff0c;都有四大角色&#xff1a; 抽象角色&#xff1a;一般会使用接口或者抽象类来解决真实角色&#xff1a;被代理的角色代理角色&#xff1a;代理真实角色&#xff0…