精华帖分享 | 从华泰研报出发,开启人工智能炼丹篇章!

news2025/1/21 4:01:05

本文来源于量化小论坛策略分享会板块精华帖,作者为1go的程序猿,发布于2024年3月30日。

以下为精华帖正文:

最近研究完邢大新发布的各种框架后,突然冒出了想当牛马的想法。但是,本人作为一个量化小白,从头开始到变成牛马那必定是道阻且长。于是我决定从彩虹几乎没有涉及到的角度入手:做人工智能深度学习系列。

那为什么要做这个系列呢?人工智能的原理究竟是什么?能带给我们什么?

随着AI大模型的爆火,人工智能进入了大家的视野。现在的人工智能模型大致包含如下几种:语言模型、图像视频模型、音频模型、时间序列模型等等。

人工智能在图片文本领域的能力大家有目共睹(gpt,sora....),那将其应用在量化领域会不会给大家带来超乎想象的收益呢。

我翻阅了一下彩虹论坛上关于人工智能的研究,几乎没有可以应用于实盘的,那就只能从研报中寻找思路了。

简单的读了海通、广发、华泰的几篇相关研报后,发现还是华泰的研报写的详细,思路连贯开阔。与多因子选股模型相关的主要包含两部分:因子生成与合成、对抗过拟合。

几篇研报中的模型效果都还不错,而且不难实现。正巧,最近在学校研究时间序列模型,那直接准备一波爆肝,把邢大的选股框架和人工智能一结合,新款的丹炉说不定就出来了!

但是问题来了,理想很丰满,现实很打脸。前几天发过一篇微软AI炒股的论文解读,阅读量那是相当低。。。仔细一想,大部分人都没接触过人工智能模型,那再看原理公式啥的就更看不懂了。

那想让大家接受人工智能模型,还是得从头说起,这个听起来很高大上的东西到底工作原理是什么?

01

   深度学习简介

 深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。

上面的解释来源于百度百科,就很复杂,我把它精简一下:深度学习就干俩事,从已知数据中提取信息、并合成出“未知”的信息。

02

提取信息

深度学习,到底从哪学,学什么?在量化领域,深度学习主要的学习对象包含股票基本数据,另类数据等。

基本数据即全市场所有股票最近几年的开高收低量价以及基本面等数据;另类数据包含文本数据即市场舆论、新闻、分析师研报等、基金经理持仓等大家不常用的数据。

深度学习模型在得到这些数据后第一步就是进行信息提取,即模型的编码器部分。

编码:字面意思,将输入的数据编成码。例如摩斯密码就是一种编码方法,将26个字母变成更复杂的特征。

深度学习模型也是类似,可以从输入的数据中学习更多特征信息,并将其转换为高维度多特征的向量输出。直接说有点抽象哈,高维度、多特征是啥东西?

维度:举个例子,原始的股票数据包含三个维度:时间维度(如2020年-2023年所有交易日),股票特征维度(单只个股的开高收低、各种因子值),股票池维度(全市场所有股票)。

特征:我对特征的理解就是在单一维度上,这个向量到底有多长。例如某股票在某天的开.高.收.低价格就是4个特征。一周五个交易日就是五个特征。

这些已知特征在模型挖掘后可以生成更多的特征,挖掘出未知的特征值:例如我输入了近20天的个股收盘价数据,模型就可以推算出20日均线这一特征的值,信息便从长为4的向量(开高收低)变成了长度为5的向量(多加了均线)。

听起来也一般般哈,均价我们手动不是也能算嘛。但是深度学习模型厉害的点在于可以通过权重组合、添加非线性等手段获得我们无法计算的特征。

03

合成结果

那挖掘出特征后,模型还可以将信息合成出我们想要的结果,这便是模型的解码器部分。还是拿摩斯密码举例,我们拿到了摩斯密码表示的文章后我们也看不懂啊,那就得反向操作一下,通过密码本将其转换为字母。

深度学习模型现在可以做的合成任务例如,回归——计算某天股价具体涨跌,二分类——计算某天某支股是涨还是跌,多分类——文字的生成,具体输出26个字母中的哪个。

至于从什么数据中提取信息,怎么提取信息,合成什么样的结果,是个很大的坑,要以后慢慢来填了。先看看人工智能它能带给我们什么,提取合成的信息到底好不好用。

04

华泰做了什么?

华泰去年发表了一篇研报《华泰人工智能研究6周年回顾》。华泰用人工智能就做了三件事 1.模型测试 2.因子挖掘 3.对抗过拟合。

图片

2017年-2020年研究了模型测试,使用了传统机器学习(我不咋会...),这里跳过哈。

2019年6月,华泰开始做因子挖掘。从开始的传统机器学习模型到2020年6月的AlphaNet模型,华泰人工智能系列开始向深度学习转型。华泰研究的模型很多,AlphaNet、GRU、GNN啥的,但核心没变,主要研究的都是基础数据,如量价数据等,并从中挖掘信息,生成了单因子、多因子。

2020年开始,华泰开始拓宽思路,进行了另类数据研究。大家最熟悉的应该是文本数据,最近gpt的爆火,让大家也体验到了,人工智能模型可以做到分析文本情感,挖掘语义等,借助语言模型,华泰构建了基于舆情、基于研报情感等选股策略。

图片

图片

过拟合也是量化中令人头大的一件事,人工智能模型也能帮我们解决这一问题。从2019年末,华泰开始对GAN(生成对抗网络)进行很多研究。

GAN能gan什么呢:它可以生成假数据!以前我们都是在历史数据上进行回测,找最优参数。那历史容易过拟合,我们就创造一些没发生过的历史,这样不就从根源上解决了过拟合嘛。

图片

说了这么多,想让大部分老板接受,那还是得向彩虹学习,老板们只需要配config就行了,什么模型实现,数据、因子挖掘交给卷王就好了。再狠狠表扬一下彩虹集团,新的选股框架很牛逼哈!里面能复用的部分非常多,把人工智能模型塞进去也不费劲。之后向这个方向努力一下,发出来的代码大家配config就行。

05

篇末预告

其实已经复现了华泰的AlphaNet,研报里的实验结果相当不错(但毕竟是华泰第一个深度学习模型,现在直接拿来用的效果我不太看好)。

下图是《20200614-华泰人工智能系列之三十二:AlphaNet:因子挖掘神经网络-华泰证券》中挖掘出的单因子ICIR分析,效果远超大部分传统因子。正在尝试着塞到选股框架里,自己测试一下。如果测试效果还不错的话,下一篇就给大家透一下。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2217934.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【图解版】力扣第1题:两数之和

Golang代码实现 func twoSum(nums []int, target int) []int {m : make(map[int]int)for i : range nums {if _, ok : m[target - nums[i]]; ok {return []int{i, m[target - nums[i]]}} m[nums[i]] i}return nil }

【深度学习】阿里云GPU服务器免费试用3月

【深度学习】阿里云GPU服务器免费试用3月 1.活动页面2.选择交互式建模PAI-DSW3.开通 PAI 并创建默认工作空间4.前往默认工作空间5.创建交互式建模(DSW)实例 1.活动页面 阿里云免费使用活动页面 2.选择交互式建模PAI-DSW 支持抵扣PAI-DSW入门机型计算用量…

ONLYOFFICE文档8.2:开启无缝PDF协作

ONLYOFFICE 开源办公套件的最新版本新增约30个新功能,并修复了超过500处故障。 什么是 ONLYOFFICE 文档 ONLYOFFICE 文档是一套功能强大的文档编辑器,支持编辑处理文档、表格、幻灯片、可填写的表单和PDF。可多人在线协作,支持插件和 AI 集…

C++从入门到起飞之——红黑树 全方位剖析!

🌈个人主页:秋风起,再归来~🔥系列专栏:C从入门到起飞 🔖克心守己,律己则安 目录 1. 红⿊树的概念 2. 红⿊树的实现 2.1 构建整体框架 2.2 红黑树的插入 2.3 红黑树的验证 2.4 红黑树…

C#学习笔记(三)

C#学习笔记(三) 第 二 章 命名空间和类、数据类型、变量和代码规范二、类的组成和使用分析1. 基本概念2. 类的内容组成3. 方法的初步理解 第 二 章 命名空间和类、数据类型、变量和代码规范 二、类的组成和使用分析 1. 基本概念 类是程序的基本单元&a…

能源设施安全智能守护:AI监控卫士在油气与电力领域的应用

能源行业的安全与稳定运行对于社会的可持续发展至关重要,无论是石油、天然气还是电力设施,都面临着复杂的监测需求。思通数科推出的AI视频监控卫士,通过应用先进的人工智能技术,为能源行业的安全监测提供了高效、智能的解决方案。…

Web前端高级工程师培训:使用 Node.js 构建一个 Web 服务端程序(1)

1-使用 Node.js 构建一个 Web 服务端程序 文章目录 1-使用 Node.js 构建一个 Web 服务端程序1、Node.js的安装与基础语法2、Node.js 中的 JavaScript 与 浏览器中的 JavaScript2-1、Node.js 中的 JavaScript2-2、浏览器 中的 JavaScript 3、什么是 WebServer(APP)?4…

USB UVC开启 PU功能研究

文章目录 前言一、UVC拓展结构二、修改是否开启亮度等功能 在处理单元1. 处理单元理解2.实际代码部分2.修改主要对控制段进行修改 总结 前言 提示:这里可以添加本文要记录的大概内容: 项目需要: 在哪里学习UVC 肯定是USB中文网 网址 https:…

React父子组件,父组件状态更新,子组件的渲染状况

目录 React.memo不包裹 React.memo包裹 传递一个简单数据类型 传递一个复杂数据类型 传递一个函数 React.memo不包裹 如果子组件没有使用React.memo包裹,则父组件中数据更新时,子组件会重新进行渲染 父组件: import { useState } fro…

MongoDB 8.0已全面可用

全球广受欢迎的文档型数据库MongoDB目前最新最强的版本,在易用性、企业级安全性、 弹性、可用性等方面均有大幅提升,适用于各种应用程序。 MongoDB 8.0的优化使整体吞吐量提高了32%,时间序列数据聚合的处理速度提高了200%以上。MongoDB 8.0的…

SegFormer: 一个基于Transformer的高效视觉图像分割算法

今天我分享一篇关于 Transformer 架构在图像视觉分割中的应用的文章,主题是 SegFormer。SegFormer 是一种新颖的语义分割方法,它结合了无位置编码的层次化 Transformer 编码器和轻量级 All-MLP 解码器,避免了传统方法中的复杂设计&#xff0c…

Flink Kubernetes Operator

Flink Kubernetes Operator是一个用于在Kubernetes集群上管理Apache Flink应用的工具。 一、基本概念 Flink Kubernetes Operator允许用户通过Kubernetes的原生工具(如kubectl)来管理Flink应用程序及其生命周期。它简化了Flink应用在Kubernetes集群上的…

字节 HLLM 论文阅读

github连接:https://github.com/bytedance/HLLM 探讨问题: 推荐LLM的三个关键问题: LLM预训练权重通常被认为是对世界知识的概括,其对于推荐系统的价值?对推荐任务进行微调的必要性?LLM是否可以在推荐系统…

SL3037B降压恒压芯片DC24伏输入5伏输出带单片机,电流100mA

一、SL3037B芯片概述 SL3037B是一款内置功率MOSFET的单片降压型开关模式转换器,具有高效、稳定、外围元器件少等特点。它能够在宽输入电源范围(5.5~60V)内实现0.6A的峰值输出电流,并具有出色的线电压和负载调整率。此外&#xff…

uniapp小程序自定义聚合点

注&#xff1a; 1.默认的聚合点可以点击自动展示子级点位&#xff0c;但是自定义的聚合点在ios上无法触发markerClusterClick的监听&#xff0c;至今未解决&#xff0c;不知啥原因 2.ios和安卓展示的点位样式还有有差别 源码附上 <template><view class"marke…

SpringMVC之 文件上传和下载

1. 文件上传 1.1 前端注意事项 文件上传操作&#xff0c;前端的表单项需要如下三项设置&#xff1a; &#xff08;1&#xff09;input标签的type属性应设置为file&#xff0c;并且注意不要在input标签中设置value属性&#xff0c;因为这可能导致文件上传不成功&#xff1b; …

轻触节点,链表里的悄然邂逅

公主请阅 1. 移除链表元素1. 题目说明示例 1示例 2示例 3 1.2 题目分析1.3 代码部分1.4 代码解析 2. 反转链表2. 1题目说明示例 1示例 2示例 3 2.2 题目分析2.3 代码部分2.4 代码分析 1. 移除链表元素 题目传送门 1. 题目说明 给你一个链表的头节点 head 和一个整数 val &…

无头浏览器测试:如何使用 Puppeteer 和 Browserless?

什么是无头浏览器测试&#xff1f; 无头浏览器测试通常指没有头的物体或东西&#xff0c;在浏览器的语境中&#xff0c;它指的是没有 UI 的浏览器模拟。无头浏览器自动化使用 Web 浏览器进行端到端测试&#xff0c;而无需加载浏览器的 UI。 无头模式是一个功能&#xff0c;它…

SpringBoot1~~~

目录 快速入门 依赖管理和自动配置 修改自动仲裁/默认版本号 starter场景启动器 自动配置 修改默认扫描包结构 修改默认配置 读取application.properties文件 按需加载原则 容器功能 Configuration Import ​编辑 Conditional ImportResource 配置绑定Configur…

一款AutoXJS现代化美观的日志模块AxpLogger

简介 Axp Logger是一款基于autox.js的现代化日志模块&#xff0c;具备窗口事件穿透、拖拽和缩放功能。 Axp Logger文档 特性现代化的UI设计支持点击穿透模式&#xff08;不影响脚本运行&#xff09;监听音量-键切换模式支持窗口操作模式窗口拖拽移动窗口自由缩放清空日志关闭日…