目录
序列数据
自回归模型
马尔可夫假设
潜变量模型
序列模型总结
序列数据
实际中很多数据是时序结构的,如:电影的评价随时间的变化而变化:拿奖后评分上升、电影整体质量提升,人们要求变高。。。等等
除此之外,音乐、语言、文本和视频都是连续的序列数据。
自回归模型
自回归模型的基本思想是,给定一个序列,我们可以根据之前的时间点上的值来预测下一个时间点的值。具体来说,自回归模型尝试拟合如下形式的概率分布:
这个概率分布可以用来生成新的序列数据。生成过程是从序列的开始部分逐步向前推进,每一步都基于之前已知的数据来预测下一个元素。
自回归模型有两种基本策略:
马尔可夫假设
马尔可夫模型假设当前数据只与前tau个数据相关。即,如果即可得到一阶马尔可夫模型:
潜变量模型
潜变量模型引入一个潜变量来表示过去信息,这种情况下: 。潜变量模型涉及两个模型,一个模型基于和计算,一个模型基于和 计算得出的计算。
序列模型总结
时序模型中,当前数据与之前观测到的数据相关。
自回归模型使用自身过去数据预测未来数据。
马尔可夫模型假设当前数据之和最近少数数据相关从而简化模型。
潜变量模型使用潜变量来概括历史信息。