精华帖分享 | 判定策略失效的新方法——统计假设检验

精华帖分享 | 判定策略失效的新方法——统计假设检验

news2025/4/26 15:40:13

本文来源于量化小论坛策略分享会板块精华帖，作者为元亨利贞，发布于2023年12月25日。

以下为精华帖正文：

1、起因

去年刚入门B圈，由于之前有做商品期货择时的经验，通常来讲，趋势跟随，并且回测结果还不错的情况，实盘跑起来基本OK。

于是我就用自己比较熟悉的模式上了实盘，用的BOLL，选择了姨太。大概优化了一下参数用的5m的频率。回测结果如下图，红圈是开始实盘的点，之前是回测：

结果扔了几万块钱，跑了一年，结果净值跑成了这样~

2、思考

邢大经常教导我们，要对策略加深理解，知道策略什么时候赚钱，什么时候亏钱，这样才不会慌。不会因为策略暂时的回撤就停策略，虽然这个说法不错，但是其实有一套逻辑即：

对策略有深厚的理解 -> 在回撤的时候心里不慌，甚至加仓 -> 策略净值回升，加仓获得更多收益。

问题是如果策略真的失效了怎么办？就一直加仓？或者即使不失效，但是回撤很长时间怎么办？

比如邢大直播上讲过的美股曾经的漂亮50行情，整整10年，一直是大盘股涨，小盘股就是不如大盘股。规模因子失效了么？

并没有。因为后面规模因子又涨回来了。

但是作为一个交易者，我能坚守信念，面对逆境10年么？

显然不可能。肯定会放弃投资了。

所以这个问题似乎就成了我的达摩利斯之剑，虽然它通常不会来烦扰我（交易赚钱或者保持平稳的时候）。

但是，duang。出现了上面的这样的策略，我就又不得不来面对与思考这个问题了。

我们已有的框架与知识确实有一些解决策略回撤问题的工具：

策略再择时。
策略轮动。

它们都有一些用，解决了一些问题，不过由于引入了假设（轮动与再择时策略的有效性），又会有新的问题。

策略再择时，通常是使用一些技术指标，对策略的净值进行择时。策略轮动通常也是计算策略净值一段时间的绩效评价指标，然后选最近表现好的，或者表现不好的来下一周期运行。

新的问题在于，再择时与轮动把策略失效的问题，变成了轮动策略失效的问题（逻辑上）即：如果我选的策略跌，没选的涨，择时停的时候策略涨了，跑的时候策跌了。

没有什么东西能够保证策略净值层面的动量与反转一定会稳定有效。于是我就麻了，那这问题不就无解了么。

3、新思路

一个偶然的机会，我在B站上面看某坤的内部人士对于当前量化市场的一个宣讲，他也讲到了策略失效的问题。他说：“我们追求一个高夏普比率，对于夏普为4的策略来说，我能很容易判断它是否失效，对于夏普比为1的策略我也很难判断它是否失效了。”

不知道大家有没有get到他的点，我反正是灵光一现。就是像下图这个样子：（纯手绘，有点丑，将就着看）

这个图啥意思呢，他们表示都是策略净值，上面那个图表示的就是高夏普的策略，一条直线往上，然后遇见回测。

下图就是我们正常的策略（夏普低的策略），波动向上，也在最近遇见了回撤幅度差不多，时间长度也差不多。

上图的策略我们看图就可以说策略应该是出了点问题，或者说最近失效了，但是下图能说最近那一段回撤是失效么？我们只能说是还算比较正常的回撤吧？这就是那个某坤分享的人的意思。于是我就悟了，这样也可以判断策略失效与否。

那么，这个光凭看图似乎太简单了，我们就引出本文的主角——假设检验吧（不太清楚的同学可以自行百度）。

上图的公式中X表示样本均值，μ0表示总体均值，σ表示总体标准差。n表示有多少个样本即自由度。也就是说在样本均值和总体均值之间的偏差经过标准差和自由度的调整之后，应该是符合标准正态分布的。

怎么用在策略失效与否的判断呢？

就是图一的策略之前很稳定（波动小），所以后面出现一定幅度的回撤就可以判断失效，但是图二中策略本身波动就很大，所以出现和图一同样的波动的情况也不能判断是否失效了。

另外就还跟自由度即样本量有关，统计可靠性随自由度增加成平方根增加，也就是回测时间越长，交易次数越多，我们的假设检验不需要太离谱的观测值就可以判断策略失效。这与我们的回测实盘的经验也是相符合的。

总的来说就是使用经过波动（标准差）和自由度（回测时长，净值点个数分钟频的会更多，更容易判断）调整的样本均值（近期的收益）与总体均值（总的回测期的收益）的偏差来判断策略是否正常，统计学认为这个调整后的偏差应该是符合标准正态分布的。

4、代码

前面说了那么多都是在说遇到的问题和新想到的解决方案。接下来我就用gpt给的假设检验代码来实际跑一下，看看我这个策略能不能被判定为有问题了。

代码中的pkl文件就是我最前面那张图的回测的净值曲线，回测至今，使用22年9月1号来切分，也就是接近上实盘的时候，取这个时间前后的数据来进行检验，看看假设检验是否能显著的判断它们的总体均值不一样（策略失效了）。输出结果是：

哎，无情的告诉我该停策略了。

5、不足

这个做法是有一些问题的，我已知的都列举在这里：

1、假设检验一般需要假设两个样本具有相同的分布，如果不是都要求正态分布的话。交易的数据显然不是那么靠谱的。数学不好，现学现卖，说的不对请指正~

2、长期的历史回测并不能代表总体，因为无论多长都是有误差的，但是对于交易策略来说，总体是什么呢？我也没太想明白。

3、假设检验只是从比较量化的方式上来判定策略“出现了问题”。并不代表策略就真的失效。有兴趣的可以去搜索一下“统计学的两类错误”。

6、结论

既然有这许多不足，并且也没有解决我自己开头提出的如何判断策略失效的问题，抑或如何应对策略回撤的问题（我现在依然不知道这个策略该停还是不停，个人倾向于坚持一下，等运气好赚点钱再停）。

那么这玩意有什么用？我觉得可以用来当做一个轮动因子对显著性指标排序，越显著失效的越加仓或者越下线。或者择时因子，检验判断显著失效了就择时停掉。

那么就引入了新的问题，停掉的策略什么时候再上线呢？哎不知道了，想的太过烧脑。感觉交易就是这样，更多的是一个思考者，而不是一个coder。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2202706.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

谁说电商选品找货源没有捷径，只要你用对工具！

谁说电商选品找货源没有捷径，只要你用对工具！

最近跟很多同行聊，都在抱怨选品难的问题，都说7分靠选品，3分靠运营，对于选品来说，并没有捷径可走，但其实是有很多不同的角度的。现在市面上大部分开发做的选品，“选品方法”或“产品分析方法”…

阅读更多...

SiLM266x系列SiLM2661高压电池组前端充/放电高边NFET驱动器为电池系统保护提供可靠性和设计灵活性

SiLM266x系列SiLM2661高压电池组前端充/放电高边NFET驱动器为电池系统保护提供可靠性和设计灵活性

SiLM2661产品概述： SiLM2661能够灵活的应对不同应用场景对锂电池进行监控和保护的需求，为电池系统保护提供可靠性和设计灵活性。是用于电池充电/放电系统控制的低功耗、高边 N 沟道 FET 驱动器，高边保护功能可避免系统的接地引脚断开连接&am…

阅读更多...

Pycharm连接AutoDL服务器文件上传启动终端

Pycharm连接AutoDL服务器文件上传启动终端

Pycharm AutoDL 需要使用pycharm专业版（学生可以通过教育邮箱认证，每年一次）。首先进入AutoDL官网：AutoDL-品质GPU租用平台-租GPU就上AutoDL进行学生注册登录（可以领10元的代金券）点击右上角的控制台&am…

阅读更多...

京东web 京东e卡绑定第二部分分析

京东web 京东e卡绑定第二部分分析

声明本文章中所有内容仅供学习交流使用，不用于其他任何目的，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！ 有相关问题请第一时间头像私信联系我删…

阅读更多...

api测试和接口测试的区别

api测试和接口测试的区别

API测试和接口测试是软件测试中一个非常重要的领域，尤其是在当前Web应用程序和移动应用程序的发展中。虽然它们都测试了Web服务的功能，但是二者在测试方法和测试实施方面存在很大的差异。本文将介绍API测试和接口测试之间的主要区别 API测试的主要关注点…

阅读更多...

serialVersionUID 的作用

serialVersionUID 的作用

阅读更多...

【WebGis开发 - Cesium】三维可视化项目教程---图层管理基础

【WebGis开发 - Cesium】三维可视化项目教程---图层管理基础

目录引言一、功能设计1. 主体功能2. 细节问题二、代码实现1. 树形控件2. 全局状态准备3. 创建图层控制方法3.1 加载、卸载方法编写3.2 统一对外暴露入口3.3 提供图层类别的可拓展性3.1 完整代码 4. 效果展示5. hooks函数使用方法三、总结引言本教程主要是围绕Cesium这一开…

阅读更多...

华为云服务器公网ip访问不通解决

华为云服务器公网ip访问不通解决

问题：用弹性公网IP登录超时，ping不通，但是VNC方式可以登陆成功解决：执行ifconfig，看到eth0网卡没有获取到 ifconfig 执行dhclient自动获取下网卡 ： dhclient 再次执行ifconfig：网卡已经获…

阅读更多...

【AI论文精读3】RAG论文综述1-P1

【AI论文精读3】RAG论文综述1-P1

AI知识点总结：【AI知识点】 AI论文精读、项目、思考：【AI修炼之路】简介论文中英文名 Retrieval-Augmented Generation for Large Language Models: A Survey 面向大型语言模型的检索增强生成：综述论文地址 arxiv地址：http…

阅读更多...

知识蒸馏介绍

知识蒸馏介绍

一、知识蒸馏介绍 1.1 概念介绍知识蒸馏（knowledge distillation）是模型压缩的一种常用的方法，不同于模型压缩中的剪枝和量化，知识蒸馏是通过构建一个轻量化的小模型，利用性能更好的大模型的监督信息，来…

阅读更多...

项目经理是怎么慢慢废掉的？这些无意识行为可能会毁了你！

项目经理是怎么慢慢废掉的？这些无意识行为可能会毁了你！

工作久了，每个人都或多或少会有一些无力感和疲惫感。如果没有调整过来，久而久之，会感觉自己好像废掉了，做什么事情都打不起精神。如果你是项目经理，工作中有这样一些迹象，比如总是拖延时间、丧失自己的判…

阅读更多...

【进程间通信（三）】【system V共享内存】

【进程间通信（三）】【system V共享内存】

目录 1. 原理2. 编码通信2.1 创建共享内存2.2 shmat && shmdt && shmctl2.3 通信 3. 共享内存的特性3.1 共享内存的属性3.2 加入管道实现同步机制前面的文章介绍了管道通信，其中包括匿名管道、命名管道。这篇文章介绍另一种进程间通信的方式 -----…

阅读更多...

NVP的含义？如何理解其在AEM|FLUKE线缆认证测试中的意义？不同的NVP会出现怎样的结果？

NVP的含义？如何理解其在AEM|FLUKE线缆认证测试中的意义？不同的NVP会出现怎样的结果？

在AEM|FLUKE铜缆认证测试中，有很多朋友对NVP设置有疑问，不知道应该怎么去设置它，并很好的应用它，那我们基于此，做一个简单的分析。什么是NVP? NVP是Nominal Velocity of Propagation的缩写？简单直接译过…

阅读更多...

Java基础-泛型机制

Java基础-泛型机制

文章目录为什么引入泛型泛型的基本使用泛型类泛型接口泛型方法泛型数组正确的数组声明使用场景如何理解Java中的泛型是伪泛型？泛型中类型擦除泛型数组：如何正确的初始化泛型数组实例？ 为什么引入泛型引入泛型的意义在于： 适用…

阅读更多...

KEYSIGHT B1500A 半导体器件参数分析仪

KEYSIGHT B1500A 半导体器件参数分析仪

新利通 B1500A 半导体器件参数分析仪 ——一体化器件表征分析仪—— 简述 Keysight B1500A 半导体参数分析仪是一款一体化器件表征分析仪，能够测量 IV、CV、脉冲/动态 IV 等参数。主机和插入式模块能够表征大多数电子器件、材料、半导体和有源/无源元器件。 B…

阅读更多...

关于相机的一些零碎知识点

关于相机的一些零碎知识点

热成像，英文为Thermal Imaging，例如型号500T，其实指的就是热成像500分辨率。相机的CMOS，英文为Complementary Metal Oxide Semiconductor，是数码相机的核心成像部件，是一种互补金属氧化物导体器件。 DPI…

阅读更多...

PVC刻字膜高精度模切应用

PVC刻字膜高精度模切应用

PVC刻字膜是一种由聚氯乙烯（PVC）为主要成分制成的薄膜材料，具有耐磨、耐刮、耐水、耐油以及良好的化学稳定性等特点。这种薄膜在多个行业中得到广泛应用，特别是在服装、鞋业、箱包、汽车内饰等领域，用于制作各种标识、…

阅读更多...

NDC美国药品编码目录数据库查询方法

NDC美国药品编码目录数据库查询方法

NDC（National Drug Code）翻译为“国家药品代码”，是美国食品药品监督管理局（FDA）制定的一种药品标识系统，用于唯一标识药品。这个编码系统主要目的是为精准识别和追踪不同药品而建设，行业人员和…

阅读更多...

2024最新【Pycharm】史上最全PyCharm安装教程，图文教程（超详细）

2024最新【Pycharm】史上最全PyCharm安装教程，图文教程（超详细）

1. PyCharm下载安装完整安装包下载（包含Python和Pycharm专业版注册码）：点击这里 1）访问官网 https://www.jetbrains.com/pycharm/download/#sectionwindows 下载「社区版 Community」安装包。 2）下载完成后&#…

阅读更多...

【斯坦福CS144】Lab7

【斯坦福CS144】Lab7

一、实验目的在本课程中，你已经实现了互联网基础设施的重要部分。这个检查点不是关于实现，而是关于测量实际的互联网并报告特定路径的长期统计数据。二、实验内容 1.收集数据选择一个远程主机，其往返时间（RTT）从…

阅读更多...

推荐文章

最新文章