时间序列分析基础篇

news2024/11/25 10:55:35

**时间序列分析(time series analysis)是量化投资中的一门基本技术。时间序列是指在一定时间内按时间顺序测量的某个变量的取值序列。**比如变量是股票价格,那么它随时间的变化就是一个时间序列;同样的,如果变量是股票的收益率,则它随时间的变化也是一个时间序列。时间序列分析就是使用统计的手段对这个序列的过去进行分析,以此对该变量的变化特性建模、并对未来进行预测。

时间序列分析试图通过研究过去来预测未来。

一个时间序列可能存在的特征包括以下几种:

  • **趋势:**趋势是时间序列在某一方向上持续运动(比如牛市时股市每天都在上涨,股票收益率持续为正;熊市时股市每天都在下跌,股票收益率持续为负)。趋势经常出现在金融时间序列中,特别是大宗商品价格;许多商品交易顾问(CTA)基金在他们的交易算法中都使用了复杂的趋势识别模型。

  • **季节变化:**许多时间序列中包含季节变化。在金融领域,我们经常看到商品价格的季节性变化,特别是那些与生长季节或温度变化有关的商品,比如天然气。

  • **序列相关性:金融时间序列的一个最重要特征是序列相关性(serial correlation),又称为自相关性(autocorrelation)。**以投资品的收益率序列为例,我们会经常观察到一段时间内的收益率之间存在正相关或者负相关。此外,波动聚类(volatility clustering)也是一种序列相关性,它意味着高波动的阶段往往伴随着高波动的阶段出现、低波动的阶段往往伴随着低波动的阶段出现,这在量化投资中尤为重要。比如下图为 2001 年到 2017 年上证指数日收益率的标准差,从中可以清晰的看到波动聚类。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

**随机噪声:**它是时间序列中除去趋势、季节变化和自相关性之后的剩余随机扰动。由于时间序列存在不确定性,随机噪声总是夹杂在时间序列中,致使时间序列表现出某种震荡式的无规律运动。

量化投资的交易者的目标是利用统计建模来识别金融时间序列中潜在的趋势、季节变化和序列相关性。

金融时间序列的关系中,最重要的当属**自相关性。**对于金融时间序列,比如投资品的收益率,看似随机的时间序列中往往存在着惊人的自相关。对自相关建模并加以利用能够大幅提高交易信号的准确性。配对交易的均值回复策略就是这么一个例子。均值回复策略利用一对投资品价差序列的负相关性进行投资,产生做多或者做空的交易信号,实现盈利。

金融时间序列分析的核心就是挖掘该时间序列中的自相关性。

协方差和相关系数

协方差是有量纲的,因此它的大小受随机变量本身波动范围的影响

当两个随机变量的波动范围扩大 100 倍后,它们的协方差扩大了 10000 倍。因此,人们希望使用某个和协方差有关,但是又是无量纲的测量来描述两个随机变量的相关性。最简单的做法就是用变量自身的波动对协方差进行标准化。相关系数(correlation 或者 correlation coefficient)便由此得来。

ρ \rho ρ表示 x和 y 的总体相关系数(population correlation),它的定义为:

ρ ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] σ X σ Y = C o v ( X , Y ) σ X σ Y \rho(X,Y)=\frac{E[(X-\mu_{X})(Y-\mu_{Y})]}{\sigma_X\sigma_Y}=\frac{Cov(X,Y)}{\sigma_X\sigma_Y} ρ(X,Y)=σXσYE[(XμX)(YμY)]=σXσYCov(X,Y)

其中 σ X \sigma_X σX σ Y \sigma_Y σY 分别为 X和 Y 的总体标准差(population standard deviation)。通过使用 X 和Y 的标准差对它们的协方差归一化, ρ \rho ρ 的取值范围在 -1 到 +1 之间,即 [-1, +1]:

在这里插入图片描述

时间序列的平稳性

平稳性(stationarity)是时间序列分析的基础。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

自相关性和自相关系数

假设我们有弱平稳的投资品收益率序列 { r t } \{ r_t \} {rt} 。自相关性考察的是 t时刻的收益率 r t r_t rt和距当前任意间隔 k时刻的收益率 r t − k r_{t-k} rtk 之间的线性相依关系( k 的取值是所有 $\geq$0的整数)。由于 r t r_t rt r t − k r_{t-k} rtk 来自同一个时间序列,因此我们将第三节中的相关系数的概念应用到 r t r_t rt r t − k r_{t-k} rtk 上,便推广出自相关系数(autocorrelation)。

相关图在我们对时间序列建模时至关重要

拿来一个收益率序列,只要画出相关图,就可以检测该序列在任何间隔 有无统计上显著的自相关性。

对金融时间序列建模,最重要的就是挖掘出该序列中的不同间隔 的自相关性。相关图可以帮助我们判断模型是否合适 如果模型很好的捕捉了自相关性,那么原始时间序列与模型拟合的时间序列之间的残差应该近似的等于随机噪声。

对于任意不为 0 的间隔,随机噪声的自相关均为 0。

显然,间隔为 0 的自相关系数为 1;

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传
在这里插入图片描述

因此,在评价对金融时间序列的建模是否合适时,我们首先找到原始时间序列和它的拟合序列之间的残差序列;然后只要画出这个残差序列的相关图就可以看到它是否含有任何模型未考虑的额外自相关性:

如果残差的相关图和上面这个图相似,则可以认为残差是一个随机噪声,而模型已经很好的捕捉了原始时间序列中的自相关性;

如果残差的相关图体现了额外的自相关性,它们将为我们改进已有的模型提供依据,因为这些额外的自相关说明已有模型没有考虑原始时间序列在某些特定间隔上的自相关。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1089861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【树莓派/入门】1.69inch LCD屏幕的连接与测试

说在前面 树莓派版本:4bLCD模块:MAX30102树莓派系统:Linux raspberrypi 5.15.76-v8 #1597 SMP aarch64 GNU/Linuxpython版本:3.9.2买回来发现不是触摸屏,瞎了 模块详情 某雪的1.69inch LCD模块,包含杜邦线…

10月13日星期五今日早报简报微语报早读

10月13日星期五,农历八月廿九,早报微语早读分享。 1、我国2022年出生人口956万,三孩及以上占比为15%; 2、九部门:支持针对新能源汽车等发展国际级、国家级汽车赛事; 3、外交部:目前已确认3名中…

《C++ Primer》练习9.51:设计类解析不同的输入

练习9.51是一个很好的对类的封装练手的题目,我们观察都是按照月、日、年的形式输入字符串,并且它们之间有逗号、点号或者空格隔开,于是我们可以根据这个特征设计类。设计的过程中要明确哪些是公有的(可以外部访问的)、…

人脸活体检测技术的应用,有效避免人脸识别容易被攻击的缺陷

随着软件算法和物理终端的进步,人脸识别现在越来越被广泛运用到生活的方方面面,已经成为了重要的身份验证手段,但同时也存在着自身的缺陷,目前常规人脸识别技术可以精准识别目标人像特征,并迅速返回比对结果&#xff0…

【Page-level Heap Fengshui -- Cross-Cache Overflow】corCTF2022-cache-of-castaways

前言 什么叫 Cross Cache 呢?其实就是字面意思,我们知道内核中的大部分结构体都有自己的专属 slab 内存池。那现在我们可以想象一下这个场景,我们拥有一个特定 kmem-cache 的溢出漏洞,那么我们该如何利用呢? 程序分析…

栈实现深度优先搜索

引言 之前刚学DFS的时候并不完全理解为什么递归可以一直往下做,后来直到了递归的本质是栈,就想着能不能手写栈来代替递归呢。当时刚学,自己觉得水平不够就搁置了这个想法,今天上数据结构老师正好讲了栈的应用,其中就有…

leetcode oj

150. 逆波兰表达式求值 - 力扣(LeetCode) 思路:定义一个名为 Solution 的类,并在其中定义了一个名为 evalRPN 的公共函数。这个函数接受一个由字符串组成的向量 tokens 作为输入,并返回一个整数。 在代码中&#xff0…

从基础到卷积神经网络(第12天)

1. PyTorch 神经网络基础 1.1 模型构造 1. 块和层 首先,回顾一下多层感知机 import torch from torch import nn from torch.nn import functional as Fnet nn.Sequential(nn.Linear(20, 256), nn.ReLU(), nn.Linear(256, 10))X torch.rand(2, 20) # 生成随机…

IPv6环境telnet报错:Permission denied

一、问题描述 某次redis迁移时,对新的redis集群进行新组建时,一直卡在Waiting for the cluster to join …,如下所示: 对端主机telnet本段端口,telnet报错:Permission denied,如下所示&#xff…

【软件设计师-下午题总结】

目录 下午题之总结于学习记录:题一、数据流图:1、熟悉相关的图形2、实体名称3、数据存储4、补充缺失的数据流和起点终点5、用结构化语言描述6、描述,找加工逻辑的时候7、如何保持数据流平衡 题二:实体联系图:1、常用图…

为Mkdocs网站添加评论系统(以giscus为例)

官方文档:Adding a comment system 这里我同样推荐giscus 利用 GitHub Discussions 实现的评论系统,让访客借助 GitHub 在你的网站上留下评论和反应吧!本项目深受 utterances 的启发。 开源。🌏无跟踪,无广告&#…

有关范数的学习笔记

向量的【范数】:模长的推广,柯西不等式_哔哩哔哩_bilibili 模长 范数 这里UP主给了说明 点赞 范数理解(0范数,1范数,2范数)_一阶范数-CSDN博客 出租车/曼哈顿范数 det()行列式 正定矩阵(Posit…

【网安必读】CTF/AWD实战速胜指南《AWD特训营》

文章目录 前言💬正文这本书好在哪❔这本书讲了什么❔文末送书 前言💬 【文末送书】今天推荐一本网安领域优质书籍《AWD特训营》,本文将从其内容与优势出发,详细阐发其对于网安从业人员的重要性与益处。 正文 🔭本书…

【奇葩问题】微信小程序 We分析 访问来源Top10的总比例为什么不止100%

今天有朋友在小程序后台开访问来源数据的时候发现三个渠道来源的比例超过了100% 搜了很多文章最终在官方社区找到了官方回复: 超过100%,是因为可能有用户,在当日通过多个场景,打开过你的小程序 比如用户A,上午通过【…

【Linux】进程概念讲解

前言 在了解进程概念之前,还有很多东西需要我们先了解,以助我们更好地学习以后的知识 大部分都是概念的东西,大部分大概有个印象就好了 冯诺依曼体系结构(硬件方面) 当代计算机的设计都是按照冯诺依曼体系结构设计…

Leetcode101.对称二叉树

本专栏内容为:leetcode刷题专栏,记录了leetcode热门题目以及重难点题目的详细记录 💓博主csdn个人主页:小小unicorn ⏩专栏分类:Leetcode 🚚代码仓库:小小unicorn的代码仓库🚚 &…

代码随想录算法训练营第五十二天 | 123.买卖股票的最佳时机III、188.买卖股票的最佳时机IV

123.买卖股票的最佳时机III 视频讲解:动态规划,股票至多买卖两次,怎么求? | LeetCode:123.买卖股票最佳时机III_哔哩哔哩_bilibili 代码随想录 (1)代码 188.买卖股票的最佳时机IV 视频讲解&a…

堆叠注入([强网杯 2019]随便注1)

详解: 堆叠注入(Stack Injection)是一种计算机安全概念,涉及攻击者向程序的堆栈内存中插入恶意代码,以便在程序执行期间执行非预期的操作。 堆栈注入攻击通常利用程序在处理函数调用时使用的堆栈机制。当一个函数被调…

力扣刷题 day43:10-13

1.完全平方数 给你一个整数 n ,返回 和为 n 的完全平方数的最少数量 。 完全平方数 是一个整数,其值等于另一个整数的平方;换句话说,其值等于一个整数自乘的积。例如,1、4、9 和 16 都是完全平方数,而 3 …

一文就懂大语言模型Llama2 7B+中文alpace模型本地部署

大语言模型Llama2 7B中文alpace模型本地部署 VX关注晓理紫并回复llama获取推理模型 [晓理紫] 1、Llama模型 一个由facebook发布的生成式语言模型,具体可以到其官方了解。 为了大家更好理解,这里把目录结构显示下一如下图。 2、 下载Llama并配置环境 …