大投资模型 arxiv 量化论文

news2024/11/15 9:17:11

郭建与沉向阳

摘要

传统的量化投资研究面临着回报递减以及劳动力和时间成本上升的问题。 为了克服这些挑战,我们引入了大型投资模型(LIM),这是一种新颖的研究范式,旨在大规模提高绩效和效率。 LIM 采用端到端学习和通用建模来创建上游基础模型,能够从跨越多个交易所、工具和频率的各种金融数据中自主学习综合信号模式。 这些“全局模式”随后被转移到下游策略建模,优化特定任务的性能。 我们详细介绍了 LIM 的系统架构设计,解决了该方法固有的技术挑战,并概述了未来研究的潜在方向。 LIM 的优势通过一系列商品期货交易跨仪器预测的数值实验得到了证明,并利用了股票市场的见解

关于作者

郭建IDEA研究

郭建现任国际数字经济研究院(IDEA)执行院长、人工智能金融与深度学习首席科学家。 他还是香港科技大学(广州)人工智能兼职教授、上海交通大学上海高级金融学院(SAIF)附属教授以及清华大学实践教授。 郭博士获得学士学位。 清华大学数学博士,并获博士学位。密歇根大学统计学博士。 自 2011 年起,他开始在哈佛大学担任教授(终身教授)。

沉向阳IDEA研究

沉向阳是国际数字经济学院(IDEA)创会主席,也是香港科技大学校董会主席。 美国国家工程院外籍院士、英国皇家工程院国际院士、ACM Fellow、IEEE Fellow。 2020 年 3 月之前,他担任微软公司执行副总裁,负责人工智能和研究。 沉博士获得博士学位。卡内基梅隆大学计算机科学学院机器人学博士学位。

1


目录

1 简介 1

2 量化投资回顾1

2.1 量化策略。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2.2 定量建模中的数据多样性。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.3 多因素定量建模。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3 大型投资模式 4

3.1 LIM 的端到端建模。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 3.2 LIM 通用建模。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

4 上游基础模型 7

4.1 问题表述。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 4.2 建模原理。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 4.3 基础模型设计。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

5 下游任务模型 8

5.1 数据对齐和标准化。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 5.2 模型微调。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 5.3 各种类型的下游任务。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

6 LIM 11 系统架构

6.1 计算和数据基础设施。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 6.2 基础模型系统。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 6.3 自动化策略建模。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 6.4 代理系统。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 6.5 交易系统。 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

7 未来的研究方向 13

8 讨论与结论 14

2


文章信息

摘要

传统的量化投资研究面临着回报递减以及劳动力和时间成本上升的问题。 为了克服这些挑战,我们引入了大型投资模型(LIM),这是一种新颖的研究范式,旨在大规模提高绩效和效率。 LIM 采用端到端学习和通用建模来创建上游基础模型,能够从跨越多个交易所、工具和频率的各种金融数据中自主学习综合信号模式。 这些“全局模式”随后被转移到下游策略建模,优化特定任务的性能。 我们详细介绍了 LIM 的系统架构设计,解决了该方法固有的技术挑战,并概述了未来研究的潜在方向。 LIM 的优势通过一系列商品期货交易跨仪器预测的数值实验得到了证明,并利用了股票市场的见解。

关键词:通用人工智能 端到端大额投资模型 量化投资基础模型 多模态大语言模型

造型。 与通过研究管道逐步构建交易策略的多因素建模不同,端到端建模旨在直接生成最终交易策略,绕过因子挖掘等中间步骤,并生成预测阿尔法、最佳头寸甚至算法交易订单。 这种方法有可能消除劳动密集型的要素挖掘过程,并显着提高定量研究的效率。 其次,从传统的特定任务建模到通用建模的转变,类似于“预训练基础模型大型语言模型中常用的“微调任务模型”方法,在量化投资中日益凸显。 基础模型通常是在广泛且多样化的数据集(例如跨越不同国家、证券市场和交易资产的数据)上训练的通用模型,可以进行微调以优化特定的交易策略。 通过结合端到端建模和通用建模的优势,我们提出了大型投资模型(LIM),这是一种新颖的量化投资研究方法论框架。 图 1 说明了多因素建模、端到端建模和通用建模之间的区别。

1. 介绍

量化投资(Quant)涉及由数学、统计或机器学习模型驱动的金融投资策略,它使用强大的计算机以人类交易者无法达到的速度和频率执行源自量化模型的交易指令。 特别是,深度学习技术广泛应用于量化建模,例如股票/期货趋势预测[1,2,3,4],选股[5,6,7],投资组合优化[8,9,10,11] , 12] 和算法交易 [13, 14, 15, 16, 17]。

传统的定量研究范式充满了一些局限性。 首先,它坚持包括数据处理、因子挖掘、机器学习、投资组合优化和算法交易在内的综合管道。 这些步骤中的每个都需要大量的研究资源,包括大量的劳动力和大量的间来识别有效的“阿尔法”。此外,这些管道阶段的优化目标通常缺乏一致性,导致最终交易策略的结果不理想。 此外,传统的特定任务定量建模严重依赖于预定义的场景、策略任务和相关数据,因此很难将这些模型直接转移到其他策略任务中。 这种对“本地”数据的依赖不仅限制了模型的潜力,而且还加剧了研究成本,因为宽客被迫为每种策略开发独特的模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2072354.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构系列-归并排序

🌈个人主页:羽晨同学 💫个人格言:“成为自己未来的主人~” 归并排序 递归版本 首先,我们来看一下归并的示意图: 这是归并排序当中分解的过程。 然后便是两个两个进行排序,组合的过程。 归并完美的诠释…

docker镜像,ip,端口映射,持久化

docker 镜像的迁移:导出和导入镜像 查看镜像: [rootdocker ~]# docker images REPOSITORY TAG IMAGE ID CREATED SIZE centos latest 5d0da3dc9764 2 years ago 231MB 打包 将镜像打包,找到save,可以将…

远程在电脑上玩PS5《黑神话:悟空》?借助极空间实现PS5远程串流攻略

远程在电脑上玩PS5《黑神话:悟空》?借助极空间实现PS5远程串流攻略 哈喽小伙伴们好,我是Stark-C~ 这两天的《黑神话:悟空》可谓是火爆出圈呀!虽说我也是第一时间体验到了这款可以说是划时代意义的首款国产3A大作&…

maven 依赖管理(4)

依赖就是项目里运行的jar 一个项目可以设置多个依赖 这种的 1.依赖传递 直接依赖:就是当前自己的项目pom里的依赖 间接依赖:在自己pom文件引入别人的项目 就能共享到别人项目的依赖 2.依赖传递冲突问题 路径优先:出现相同依赖&#xff0…

华为数通方向HCIP-DataCom H12-821题库(更新单选真题:1-10)

第1题 1、下面是一台路由器的部分配置,关于该配置描述正确的是? [HUAWEllact number 2001 [HUAWEl-acl-basic-2001]rule 0 permit source 1.1.1.1 0 [HUAWEl-acl-basic-2001]rule 1 deny source 1.1.1.0 0 [HUAWEl-acl-basic-2001]rule

SSRF+Redis+Fastcgi

目录 1、打redis 2、打fastcgi 3、SSRF绕过 4、SSRF防御 1、打redis ssrfme靶场实战 页面直接给出了代码,过滤了file: dict ,等等 但是下面我们看到只要有info就能打印phpinfo() 通过phpinfo()打印的信息,发现有内网其他服务器的ip 直接访问 发现…

漏洞挖掘 | 浅谈一次edusrc文件上传成功getshell

0x1 前言 这里记录一下我在微信小程序挖人社局等一些人力资源和社会保障部信息中心漏洞,人社这类漏洞相对于web应用端的漏洞来讲要好挖很多,里面的WAF过滤等一些验证也少。比如你在开始学习src漏洞挖掘,就可以从微信小程序下手。 一般像这类…

Python编码系列—Python CI/CD 实战:构建高效的自动化流程

🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中…

(7)JavaSE:注解与反射

一、注解 1.1什么是注解 Annotation 是从JDK5.0开始引入的新技术 。 作用: (1)不是程序本身 , 可以对程序作出解释.(这一点和注释(comment)没什么区别) (2)可以被其他程序(比如:编译器等)读取.使用范围: &#xff0…

Python进阶(十一)】—— Pandas和Seaborn可视化

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一|统计学|干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项,参与研究经费10w、40w级横向 文…

数字化与进制转换

1.数字化是什么? 数字化是将事物的属性转化为计算机可处理对象的过程。 2.数字化的好处? 可以让我们的生活,学习和工作更加便捷,大大提升我们学习和工作的效率。 3.如何将采集到的数据进行数字化? 可以通过两种信…

运维的利器–监控–zabbix–第三步:配置zabbix–网络–原理:通过ping实现网络连通性监控

文章目录 通过ping实现网络连通性监控1、参数说明2、建立监控项3、创建图形 通过ping实现网络连通性监控 1、参数说明 ICMPPING[,,,,]通过ICMP ping检查主机是否可以访问。 target-目标IP或者域名 packets-数据包数量 interval-间隔时间(毫秒) size-数…

Windows系统电脑安装多个Tomcat服务教程

文章目录 引言I 下载Tomcat安装包II 安装tomcat多个tomcat服务重命名Tomcat应用程序安装Tomcat服务安装和配置JRE配置服务信息III 知识扩展: windows RDP远程访问资源引言 需求: 基于Tomcat部署多个服务和站点都一台Windows机器 I 下载Tomcat安装包 https://tomcat.apache.o…

LabVIEW高速数据采集关键问题

在LabVIEW进行高速数据采集时,需要关注以下几个关键问题: 数据采集硬件的选择: 高速数据采集需要高性能的数据采集硬件,例如NI PXIe、USB DAQ等模块。硬件的选择应根据采集速率、通道数、精度、以及应用场景的具体需求来确定。 采集速率与带…

认知杂谈22

今天分享 有人说的一段争议性的话 I I 私人空间,成长的温床 咱一说到成长啊,可不能小瞧了外部环境对咱的影响。这环境啊,那可不是无关紧要的事儿,实际上呢,它对咱的成长起着特别关键的作用。你就想想看&#xff0c…

ssrf漏洞复现分析(1)

目录 Web-ssrfme 搭建环境 分析 ssrf攻击本地fastcgi漏洞复现 Web-ssrfme 搭建环境 这里我们使用的是docker环境,只需要把docker压缩包下载到Ubuntu下解压后执行命令即可, docker-compose up -d 但是我的环境中不知道是缺少什么东西,他…

姿态识别 python 效果好,提供多种精准模型

该项目是一款基于Python的AI健身教练系统,它利用先进的姿态识别技术来帮助用户进行正确的运动姿势训练。该系统可以识别并纠正用户在做特定运动时的姿势,比如深蹲、仰卧起坐、步行等。 技术栈: 编程语言:Python深度学习框架&…

深度理解指针(3)

hello,各位小伙伴们在上期的最后我们了解到了指针数组,是用来存储指针的数组。这期我们将会学习深度理解指针(3)有关指针的内容,仍然与数组分不开,让我们踏上此次列车来进行新的旅途吧! 目录 字…

【实施】软件实施方案(word套用)

软件实施方案 二、 项目介绍 三、 项目实施 四、 项目实施计划 五、 人员培训 六、 项目验收 七、 售后服务 八、 项目保障措施 软件开发全套资料获取:(本文末个人名片也可直接获取) 软件产品,特别是行业解决方案软件产品不同于一…

【ES6】使用Proxy实现单例模式

前言 由于JS没有private关键字,无法私有化构造器,所以下面代码无法限制: class Person {constructor() {console.log("Person created");} }const p1 new Person(); const p2 new Person();console.log(p1 p2); // false实现 …