量化择时——SVM机器学习量化择时(第1部分—因子测算)

news2024/10/6 16:25:03

文章目录

  • 机器学习在量化模型上的应用
    • 机器学习量化应用场景
    • 量化模型有效性的思考
  • 机器学习模型在量化择时中的应用
    • 训练与预测流程
    • 训练数据特征构造
  • SVM模型与测算
    • SVM训练与预测
    • 效果测算
    • 效果分析

最近ChatGPT比较火,NLP的同学们感触肯定会更深。NLP的应用为人所知并积极部署是一件好事,但是应用层面上的每个应用场景都是过去的领域内SOTA模型不断攻克的任务。但是可惜的是,近年来,解决单一任务在算法层面的突破明显减速,应用层面却在加速推广。

ps:目前资讯里还没有见到提到“天网”这个词,hhhhhhh,当年VR,AR啥啥都没有的时候,漫山遍野的提“天网”要来啦,不知道这次的爆点又是什么

这里我们使用一个较为简单且常用的机器学习模型SVM,对择时提供帮助,以获得超额回报

在这里插入图片描述

机器学习在量化模型上的应用

机器学习量化应用场景

博主总结的机器学习应用与量化策略有以下三种场景:

  1. 构造胜率大于50的量化策略,无论模型是否可解释,通过增加交易次数,使综合收益向均线附近偏移,获取预期超额回报
  2. 在一个可能获取超额回报的逻辑框架上,使用机器学习模型优化细节,使预期收益均值在模型的加持下,向更高的回报偏移
  3. 以定价模型为基础,赚取修正市场的超额收益

而每一种场景都对应了不同的量化思路,同时也对应了不同的研究人员的知识体系:

  1. 第一种适合专业度足够高的工科背景,难点在于“历史不会重演”的前提下,论证模型可以获取超额回报,且获取超额回报也是大概率事件,以高频交易为主
  2. 第二种适合有编程能力的金融人员,难点在于论证可以取得超额回报的逻辑链条
  3. 第三种适合有编程能力,且富有经验的金融人员,难点在于识别并排除市场的噪声信息,或是对定价模型的修正与优化

量化模型有效性的思考

目前的共识是:投资任务的复杂性远远超出了机器学习能够处理的范围,因此通常需要在人为的框定一个逻辑框架内,用机器学习的模型来优化。

学习到现在,看了很多量化方面的书籍与策略,博主有些思考想和大家分享一下:

  1. 其实有很多同学和博主一样是计算机大类转到金融的,所以“量化”是我们一个不错的切入点,越偏向数据分析,也越是我们的舒适圈。但是人与算法相比:
    • 人的优点是:剥离噪声,总结归纳,能把书越读越少
    • 机器的优点是:统计、推理,能把书越读越厚

发展了半个多世纪的计量经济学模型已经说明金融、定价这些“结果数据”,它们的信息构成是混沌且带有随机性的,因此,在出策略的时候,最好不要让机器“替代自己思考”,算法的结果最多只能给与一些启发,远达不到辅助思考的程度。同时也不要“特征多多益善”,垃圾特征就是噪声源,而机器是无法自己筛选的,所以首先要“人”是懂金融有逻辑的,然后“人”去构造算法。

  1. 除了调参外,提升机器学习模型的效果一般有两种:
    • 人为构造经得起逻辑推敲的特征序列
    • 不要预先按照数据分析的固有规则剔除特征

经验哈,比如博主常用的随机森林模型,在不做调参的情况下,想要只通过调整特征与数据提升效果时,首先,不要根据有偏分布什么的,把这个特征剔除。因为每一个特征都是一个视角,有的视角比较准确,但是有的视角思路清奇。但是每个视角都是有价值的,这时我们需要人为的参与,构造一些合适的视角来配合这些特征,对特征做再次的加工。越是没有重要性的特征,越是灵感的来源,提升的空间也越大!而预先剔除掉就亏大了。

  1. 专业知识的不同会让我们看待世界的视角也不一样,正所谓“凡有所学,皆成性格”。金融专业的同学会把“风险管理”放在首要位置,同时对“幸存者偏差”事件有着近乎本能的辨识度,非常厉害!但据我观察很多量化策略为了追求“理论的均值”,会唯数据论,放纵模型发挥,这一点需要格外注意。

这篇博客只使用SVM模型测算,更多机器学习模型请参考:https://blog.csdn.net/weixin_35757704/article/details/89280669

机器学习模型在量化择时中的应用

训练与预测流程

使用机器学习通常有以下几个步骤:

  1. 数据清洗
  2. 切分训练集、测试集
  3. 使用训练集,交叉验证模型的稳定性
  4. 测试集判断模型的有效性
  5. 应用模型测算、回测

因此我们将时间切分成以下两个部分:

  1. 训练、测试数据时间:2015-01-01到2020-01-01
  2. 应用模型测算、回测时间:2020-01-01到2023-01-01

训练数据特征构造

这里我们构造的特征简单一些,以方便大家复现:

  1. 过去5日换手率均值
  2. 过去10日换手率均值
  3. 过去5日涨跌幅
  4. 过去10日涨跌幅
  5. MACD指标DIF值
  6. MACD指标DEA值
  7. MACD值
  8. 阿隆指标(一种动量指标)DOWN值
  9. 阿隆指标UP值

SVM模型与测算

SVM训练与预测

通常,拿到数据后,以最终收益为目标的模型,主要有以下几种训练目标:

  1. 直接预测未来一段时间的收益率
  2. 预测未来一段时间的收益所处的区间

机器学习模型由于性能有限,通常以收益率为最终目标时,会选择“预测未来一段时间的收益所处的区间”

因此我们按照以下规则进行训练、预测:

  1. 70%的数据做训练集,30%的数据做测试集
  2. 将【未来5日涨跌幅】作为预测目标,同时将数据分箱,分为:
    • 收益率区间:[负无穷,-1]
    • 收益率区间:[-1,1]
    • 收益率区间:[1,正无穷]
  3. 训练集中,做10次交叉验证
  4. 测试集计算混淆矩阵,并可视化

上面的“交叉验证”是为了判断过拟合与欠拟合的问题的,很多文章容易把效果差的锅甩给“过拟合”,但明显是有问题的。关于过拟合与欠拟合请参考:https://blog.csdn.net/weixin_35757704/article/details/123931046

效果测算

测算的流程如下:

  1. 收集每一个非ST的股票在2015-01-01到2020-01-01的时间
  2. 然后根据个股的股价走势,构造成上面9个特征
  3. 按照70%的数据做训练集,30%的数据做测试集
  4. 对训练集做10份交叉验证

按照如上规则进行训练与预测,得到如下模型结果:

  1. 按照上述测算流程进行测算,在测试集上的准确率为 0.4751

  2. 归一化后的混淆矩阵如下:

  3. 使用10份交叉验证的结果如下:

准确率效果0.4925020.4880920.4785290.4735290.4858820.4776470.4770590.4841180.4808820.486176

在实际使用时,我们会根据模型的逻辑效果来判断:如果模型预测为正收益,则买入;如果预测为负收益,则卖出;

效果分析

  1. 交叉验证的效果与测试集的预测效果差不多,说明SVM模型表现较为稳定
  2. SVM将0,1,2等类别几乎无差别的预测为了类别1,抛开本身类别为1的,单单计算0与2的准确率只有10%

这个效果算中规中矩,因为没有优化、调整、或者主观构造特征,裸模型的效果也就差不多这个效果…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/418911.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【电子学会】2022年12月图形化一级 -- 潜水

潜水 暑假小雨和爸爸去玩了潜水,他见到了各种各样的海洋生物。 1. 准备工作 (1)添加背景“Underwater 2”; (2)删除小猫角色,添加角色“Diver2”、“Fish”、“Jellyfish”、“Shark”; (3)为背景添加声音“Xylo2”。 2. 功能实现 (1)点击绿旗,播放背景音乐…

【chatGPT】chatGPT初步体验,赶快来学习吧

目录 1、什么是ChatGPT 2、我可以相信人工智能告诉我真相吗? 3、你会使用我的对话进行培训吗? 4、ChatGPT 接口参考 认证 请求组织 5、ChatGPT初体验 1、什么是ChatGPT ChatGPT的研究预览是免费使用的。 ChatGPT 是从 GPT-3.5 微调而来的&#x…

vue3+typescript+vant页面开发案例

文章目录效果index.vue页面template内容script内容index.ts页面效果 index.vue页面 template内容 <van-form submit"onSubmit"><van-cell-group inset><van-fieldv-model"providerApply.companyName"name"企业名称"label"企…

snipaste 截图工具——可以使图片悬浮在任何软件上,方便对比

一、下载 官网下载地址&#xff1a;Snipaste Downloads &#xff08;需要梯子&#xff09; CSDN下载地址&#xff1a;https://download.csdn.net/download/weixin_43042683/87671809 1. 下载 压缩包后&#xff0c;免安装&#xff0c;直接解压后既可以使用。 2. 点击Snipaste.…

【c语言】二维数组与指针 存储原理

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 给大家跳段街舞感谢支持&#xff01;ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…

Adaptive Weight Assignment Scheme For Multi-task Learning

Adaptive Weight Assignment Scheme For Multi-task Learning 题目Adaptive Weight Assignment Scheme For Multi-task Learning译题用于多任务学习的自适应权重分配方案时间2022年期刊/会议IAES International Journal of Artificial Intelligence (IJ-AI) 摘要&#xff1a;如…

UDS 14229-1标准加Trace ,两万字长文详细解读

&#x1f345; 我是蚂蚁小兵&#xff0c;专注于车载诊断领域&#xff0c;尤其擅长于对CANoe工具的使用&#x1f345; 寻找组织 &#xff0c;答疑解惑&#xff0c;摸鱼聊天&#xff0c;博客源码&#xff0c;点击加入&#x1f449;【相亲相爱一家人】&#x1f345; 玩转CANoe&…

比较系统的学习 pandas(5)

pandas 常见的高级操作 1、进行复杂查询 由于不好描述&#xff0c;就举几个栗子吧&#xff0c;不明白的可以私聊我 1、pnadas 支持逻辑计算与位运算 对DataFrame的一列进行逻辑计&#xff0c;会产生一个对应的由布尔值组成的Series&#xff0c;真假值由此位上的数据 是否满…

ArrayList的深入理解

ArrayList的源码解析1. 实例化无参构造器2. add&#xff08;&#xff09;方法2.1. add&#xff08;&#xff09;List的扩容3. get&#xff08;&#xff09;方法4. remove&#xff08;&#xff09;5. modCount 的作用(面试题)5. 手写简单List实现存储删除1. 实例化无参构造器 A…

Pandas 2.0 vs Polars:速度的全面对比

前几天的文章&#xff0c;我们已经简单的介绍过Pandas 和Polars的速度对比。刚刚发布的Pandas 2.0速度得到了显著的提升。但是本次测试发现NumPy数组上的一些基本操作仍然更快。并且Polars 0.17.0&#xff0c;也在上周发布&#xff0c;并且也提到了性能的改善&#xff0c;所以我…

Apple苹果开发者Certificates, Identifiers Profiles创建

1.创建Profile: 登陆Apple开发者账号,进入开发者后台,选择Profiles 然后点击Generate a Profile生成一个配置 选择配置类型 点击继续 选择APP ID 创建APP ID 注册一个新的APP id 选择应用类型,然后点击继续

两种事件处理模式:reactor/proactor

&#xff01;&#xff01;同步通常是reactor&#xff0c;异步通常是proactor reactor 要求主线程&#xff08;I/O处理单元&#xff09;只负责监听文件描述符上是否有事件发生&#xff0c;有的话就立即将该事件通知工作线程&#xff08;逻辑单元&#xff09;&#xff0c;将 so…

SpringBoot——单元测试实践总结

文章目录单元测试概念作用黑白盒黑盒测试白盒测试逻辑覆盖1、语句覆盖2、判定覆盖3、条件覆盖4、条件/判定覆盖5、条件组合覆盖6、路径覆盖SpringBoot工程单测介绍pom依赖注意&#xff1a;Idea结构创建路径创建类和方法Controller层单测被测代码测试代码Service层单测被测代码测…

springboot集成hadoop3.2.4HDFS

前言 记录springboot集成hadoop3.2.4版本&#xff0c;并且调用HDFS的相关接口&#xff0c;这里就不展示springboot工程的建立了&#xff0c;这个你们自己去建工程很多教程。 一、springboot配置文件修改 1.1 pom文件修改 <!-- hadoop依赖 --><dependency><gro…

【从零开始学Skynet】基础篇(八):简易留言板

这一篇我们要把网络编程和数据库操作结合起来&#xff0c;实现一个简单的留言板功能。 1、功能需求 如下图所示&#xff0c;客户端发送“set XXX”命令时&#xff0c;程序会把留 言“XXX”存入数据库&#xff0c;发送“get”命令时&#xff0c;程序会把整个留言板返回给客户端。…

怎么把视频转成mp3音频,下面有四个方法

你有没有遇到过这种情况&#xff0c;看了一部电影或者纪录片&#xff0c;里面的背景音乐或者对白让你很感动&#xff0c;但是我们只需要其中的音频部分&#xff0c;比如在手机上收听音乐或者创作自己的音频内容。这时候我们可以先把视频保存下来&#xff0c;然后通过视频转音频…

光耦继电器工作原理及优点概述

光耦继电器是一种电子元器件&#xff0c;也是固态继电器的一种&#xff0c;其主要作用是隔离输入与输出电路&#xff0c;用于保护或者控制电路的正常工作。 光耦继电器工作原理是利用光电转换器将外界信号转化为光信号&#xff0c;通过光纤传输到另一端&#xff0c;再由另一端的…

【C生万物】 数组篇

欢迎来到 Claffic 的博客 &#x1f49e;&#x1f49e;&#x1f49e; 前言&#xff1a; 这个专栏好久没更新了&#xff0c;今日诗兴大发&#xff0c;打算尽快完成这个专栏&#xff0c;这期讲数组。 目录 Part1:一维数组 1.创建 2.初始化 3.使用 4.在内存中的存储 Part2:二…

安卓开发学习记录(续)

文章目录十一、综合训练&#xff08;购物车功能&#xff09;十二、内容提供者Provider十一、综合训练&#xff08;购物车功能&#xff09; 实现功能&#xff1a; 手机商品页面展示&#xff0c;加入购物车功能&#xff0c;商品详情页面&#xff0c;清空购物车&#xff0c;删除购…

C++算法初级9——递归

C算法初级9——递归 文章目录C算法初级9——递归递归求阶乘递归求斐波那契数列递归&#xff0c;简单地来说&#xff0c;就是一个函数自己调用自己。函数f()就好像是工厂中生产零件的模板&#xff0c;每次我们调用函数f()的时候&#xff0c;都会依照模板生产一个新的零件&#x…