阅读笔记DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks

news2025/1/11 4:08:59

z i , t ∈ R z_{i,t}\in \mathbb{R} zi,tR表示时间序列 i i i t t t时刻的值。给一个连续时间段 t ∈ [ 1 , T ] t\in [1, T] t[1,T],将其划分为context window [ 1 , t 0 ) [1,t_0) [1,t0)和prediction window [ t 0 , T ] [t_0,T] [t0,T]。用context window的时间序列预测prediction window的时间序列的目标分布是
P ( z i , t 0 : T ∣ z i , 1 : t 0 − 1 , x i , 1 : T ) P(\mathbf z_{i,t_0:T} | \mathbf z_{i,1:t_0-1}, \mathbf x_{i,1:T}) P(zi,t0:Tzi,1:t01,xi,1:T)其中 x i , t \mathbf x_{i,t} xi,t是协变量(covariate),也就是特征,可以是时间相关的,也可以是序列相关的,比如day-of-the-week、hour-of-the-day等。
作者用自回归(autoregressive)模型建模上面时间序列的概率:
Q Θ ( z i , t 0 : T ∣ z i , 1 : t 0 − 1 , x i , 1 : T ) = Π t = t 0 T Q Θ ( z i , t ∣ z i , 1 : t − 1 , x i , 1 : T ) = Π t = t 0 T l ( z i , t ∣ θ ( h i , t , Θ ) ) Q_\Theta(\mathbf z_{i,t_0:T} | \mathbf z_{i,1:t_0-1}, \mathbf x_{i,1:T})=\Pi_{t=t_0}^TQ_\Theta(z_{i,t} | \mathbf z_{i,1:t-1}, \mathbf x_{i,1:T}) = \Pi_{t=t_0}^T l(z_{i,t} | \theta(\mathbf h_{i,t}, \Theta)) QΘ(zi,t0:Tzi,1:t01,xi,1:T)=Πt=t0TQΘ(zi,tzi,1:t1,xi,1:T)=Πt=t0Tl(zi,tθ(hi,t,Θ))其中 h i , t = h ( h i , t − 1 , z i , t − 1 , x i , t , Θ ) \mathbf h_{i,t} = h(\mathbf h_{i,t-1}, z_{i, t-1}, \mathbf x_{i,t}, \Theta) hi,t=h(hi,t1,zi,t1,xi,t,Θ)是RNN的隐含表示。likelihood l ( z i , t ∣ θ ( h i , t , Θ ) ) l(z_{i,t} | \theta(\mathbf h_{i,t}, \Theta)) l(zi,tθ(hi,t,Θ))是一个分布,参数由 θ ( h i , t , Θ ) \theta(\mathbf h_{i,t}, \Theta) θ(hi,t,Θ)给出。
在这里插入图片描述

likelihood l ( z i , t ∣ θ ( h i , t , Θ ) ) l(z_{i,t} | \theta(\mathbf h_{i,t}, \Theta)) l(zi,tθ(hi,t,Θ))的参数由网络预测,例如分布的mean和variance。具体地,作者对实数值选择Gaussian likelihood,对正的计数值选择negative-binomial likelihood。

优化目标是最大化log-likelihood:
L = ∑ i = 1 N ∑ t = t 0 T log ⁡ l ( z i , t ∣ θ ( h i , t ) ) \mathcal L = \sum_{i=1}^N \sum_{t=t_0}^T \log l(z_{i,t} | \theta(\mathbf h_{i,t})) L=i=1Nt=t0Tlogl(zi,tθ(hi,t))因为模型没有隐变量,所以不需要inference,可以直接用梯度下降优化。需要优化的参数 Θ \Theta Θ包含RNN的参数,和计算分布参数的参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/403305.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于异常控制流和系统级 I/O:进程

💭 写在前面:本文将学习《深入理解计算机系统》的第六章 - 关于异常控制流和系统级 I/O 的 进程部分。CSAPP 是计算机科学经典教材《Computer Systems: A Programmers Perspective》的缩写,该教材由Randal E. Bryant和David R. OHallaron 合著…

C 去除字符串中重复字母(LeetCode)

🌟前言摆烂太久,好久没有更文了,小九和大家一起看看题写写题找回手感吧,也希望这篇文章可以帮助正在寻找解题答案的朋友,你们的支持就是我最大的动力!求三连!求关注呀!🌟…

信息系统项目管理师第4版教材的变化:PMBOK第六版和第七版的叠加

昨天下午,软考官方网站突然发布了第4版考纲和教材,这让很多在准备今年上半年信息系统项目管理师考试的考生们有些紧张。那么这次教材改版主要的变化是什么,5月份的考试是否会按照新版的教材来考呢?让我们逐个章节进行分析。信息化…

Spark RDD编程基本操作

RDD是Spark的核心概念,它是一个只读的、可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,可在多次计算间重用。Spark用Scala语言实现了RDD的API,程序员可以通过调用API实现对RDD的各种操作,从而实现各种…

数据结构刷题(二十三):47全排列II、51N皇后、37解数独

1.全排列II题目链接思路:回溯之排列问题并且有数组排序标记数组。 回溯三部曲同46. 全排列。过程图:https://programmercarl.com/0047.%E5%85%A8%E6%8E%92%E5%88%97II.html#%E6%80%9D%E8%B7%AF注意:本题的去重操作主要在树层上。就是说同一树…

2.JVM常识之 运行时数据区

1.JVM核心组成 2.JVM 运行时数据区(jdk8) 程序计数器:线程私有,当前线程所执行字节码的行号指示器 jvm栈:线程私有,Java 虚拟机栈为 JVM 执行 Java 方法服务 本地方法栈:线程私有,本…

SpringBoot接口 - 如何统一异常处理

SpringBoot接口如何对异常进行统一封装,并统一返回呢?以上文的参数校验为例,如何优雅的将参数校验的错误信息统一处理并封装返回呢?为什么要优雅的处理异常如果我们不统一的处理异常,经常会在controller层有大量的异常…

【Java】初识Java

Java和C语言有许多类似之处,这里就只挑不一样的点来说,所以会比较杂乱哈~ 目录 1.数据类型 2.输入与输出 2.1三种输出 2.2输入 2.3循环输入输出 //猜数字小游戏 //打印乘法口诀表 3.方法 //交换两个数(数组的应用) //模…

栈的应用-算数

本题要求你为初学数据结构的小伙伴设计一款简单的利用堆栈执行的计算器。如上图所示,计算器由两个堆栈组成,一个堆栈 S1​ 存放数字,另一个堆栈 S2​ 存放运算符。计算器的最下方有一个等号键,每次按下这个键,计算器就…

Form Generator扩展 文本 组件

一、form-generator是什么?✨ ⭐️ 🌟 form-generator的作者是这样介绍的:Element UI表单设计及代码生成器,可将生成的代码直接运行在基于Element的vue项目中;也可导出JSON表单,使用配套的解析器将JSON解析成真实的表单。 但目前它提供的组件并不能满足我们在项目中的…

kubeadm探秘

为什么kubeadm可以用于生产?第一是kubeadm已经被官方收编,可以在官网文档中找到它的身影。另外一个是kubeadm是用golang调用k8s的命令去执行创建k8s集群的。查看一下kubeadm的代码即可知道。本文来源于csdn作者 sunican挨个打开目录查看文件可知&#xf…

Guitar Pro8吉他学习辅助软件

Guitar Pro8最大的特色就是可以直接用鼠标和键盘按标准的六线谱、四线谱进行乐谱输入、查看、打印和试听,可以实时、自动滚屏、多种模式的显示单声部或乐曲总谱,在做弹拨乐器的滑音、倚音、推弦、揉弦、泛音、摇把、闷音、琶音、分解和弦、BASS打弦等方面…

【汽车应用处理器】DRA770PJGACDQ1、TDA4VM88TGBALFR功能应用

DRA770PJGACDQ1 汽车应用处理器旨在满足现代车内数字驾驶舱体验对于处理性能的强烈需求。利用该器件,原始设备制造商(OEM)和原始设计制造商(ODM)得以将创新型连接技术、语音识别和音频流式传输等快速投入实施。Jacinto6 Plus器件通过极其灵活的全集成混合处理器解决…

zigbee学习笔记:IO操作

1、IAR新建工程 (1)Projetc→Create New Projetc→OK→选择位置,确定 (2)新建一个c文件,保存在路径中 (3)点击工程,右键→add→加入c文件 (4)…

10、go工程化与标准库

目录一、用go mod管理工程二、包引入规则三、init调用链四、可见性五、标准库1 - 时间函数2 - 数学计算3 - I/O操作4 - 编码一、用go mod管理工程 初始化项目:go mod init $module_name,$module_name和目录名可以不一样。上述命令会生成go.mod文件 mod…

除了「加机器」,其实你的微服务还能这样优化

生产实践中,如果遇到业务流量变高导致服务负载升高甚至报警,我们的第一反应往往是「加机器」。 俗话说,能用钱解决的问题都不是问题。 俗话又说,充钱你就能变得更强。 但是,作为一个有理想有抱负的架构师,…

前端——7.图像标签和路径

这篇文章,我们来讲解一下图像标签 目录 1.图像标签 1.1介绍 1.2实际展示 1.3图像标签的属性 1.3.1 alt属性 1.3.2 title属性 1.3.3 width / height 属性 1.3.4 border属性 1.4注意事项 2.文件夹 2.1目录文件夹和根目录 2.2 VSCode打开目录文件夹 3.路…

决策树学习报告

报告 一、基本概念 决策树的定义:首先,决策树是一种有监督的分类算法——即给定X,Y值,构建X,Y的映射关系。不同于线性回归等是多项式,决策树是一种树形的结构,一般由根节点、父节点、子节点、…

MyBatis-Plus的入门学习

MyBatis-Plus入门学习简介特性快速开始MyBatis-Plus的注解详解Tableld主键生成策略1、数据库自动增长 AUTO2、UUID3、Redis生成id4、MP主键自动生成TableNameTableField自动填充测试方法:update乐观锁select查所有根据id查多个id批量查询简单条件查询(通…

MySQL性能优化

MySQL性能调优 存储数据类型优化 尽量避免使用 NULL尽量使用可以的最小数据类型。但也要确保没有低估需要存储的范围整型比字符串操作代价更低使用 MySQL 内建的数据类型(比如date、time、datetime),比用字符串更快 基本数据类型 数字 整数…