单因子分析(如何判定一个因子是否有效)

news2024/11/14 10:31:32

        本人之前都是做期权中性策略,第一次接触这个多因子策略,和一些大私募对接学习后,才知道这里面的水(只能说各有各的道)。

        先说下,何为因子策略,就是一个因子和股票的价格在一定时间内是存在一定的相关性的,举个最简单的例子,买方力量大于卖方,股价一定上涨。然后就是各种挖掘,从财务因子,基本面因子,价格因子,舆情因子,到各种千奇百怪的sb因子,无一不为了证明,这个因子是可以挣钱的,用了我这个因子,可以向公司报备,让公司付钱,实际上,挖的因子,99%都是无效因子。

       就是我不知道这个因子的内部逻辑,为什么会挣钱,就是为了构建一个高ic,而去构建,过拟合什么的,全都会有,然后还有一个严重的问题就是价格断层影响因子,就是涨停板,除权之类的,导致因子失效。

        事实上,我们仔细对比主观策略,或者半自动量化策略,与幻方之流的量化策略对比,年化收益其实不大,区别就是全自动量化夏普率高,资金平滑,而主观,半自动呈现阶梯状。

        什么叫多因子策略,实际上,就是找到一个有效因子,证明这个因子,在极大值做空,极小值做多,(或者反过来,根据ic值正负)就可以获得稳定收益。一般根据1日,5日,10日,20日进行评估,ic值,rank ic值,换手率等。

        注意,由于使用的分析周期都很短,特别是现在主流由过去的月调仓,转移为周调仓,注意是因子为计数的周,所以换手率异常的高,所以,手续费、滑点这些就是多因子的现实成本。

        当挖出一个因子后,就是根据这个因子值对股票排序,然后买入因子值大的,卖出因子值小的。特别是当因子非常多,就会出现有些因子买,有些卖同一只股票。这些都会导致交易的换手率非常高。毫无疑问,是这种异常的换手率产生了平滑的资金曲线。

A:因子你自己定义的,怎么不知道内部逻辑

B:很多因子是为了拟合而拟合

A:那只是你没有耐心去理解公式表达了什么含义而已

A:101因子本来就是交易型因子,它的设计目的就是为了今天买明天卖,所以只考虑最近5天的数据进行判断

B:自动挖掘因子,知道吧,就是遗传算法,不断挖因子,结果出来的大量因子,很美丽,看不懂原因,一实盘,死翘翘

A:你可以质疑这个参数有更优的选择,可以去测试,但是这里的总体思路就是短周期交易

那是因为遗传算法太傻逼,都是上个世纪的算法了

这个世纪的算法叫AutoML

但是会的人太少了,愿意投钱的老板在下一个牛市,所以还没火而已

B:所以,你理解的因子是什么

A:alphas are predictive models.

寻找因子就是为了寻找未来上涨的相关性

C:西格尔教授对股息率做了一个关于美国股市50多年的研究,股息率最高的一组公司其年化回报竟然高达12.6%;与此同时,股息率最低的一组则为8.8%;而在相同周期内,标普500指数的股息率大约为10%左右。
由此可见,股息率因子很可能是我们战胜市场的重要制胜因素之一。

A:所有的因子本质上是一个预测模型,IC是评价预测会不会靠谱的手段之一

B:一个问题,美国是价值投资,全球资本进入是为了享受成长红利,而中国股市是利好兑现市场,换成钱才是它的作用

A:构建因子是通常基于一种假设,比如你认为量价齐升,明天更有可能涨。量价齐升就是你的假设,至于这个假设成不成立就靠评估方式来确定

你所说的自动挖掘因子看不懂,那是因为他的核心假设不是这些【交易经验】,而是【过去数据中有效的因子未来也有效】

很明显随着市场处于不同的位置和风格,一种因子(且背后所对应的假设)不会长期有效。这又是另外一个问题了。

一个有效的因子,有效的时间只有60%-70%

大部分人会在因子失效的时候,换一种模式,再次进入这个循环,很多人无法坚持自己赚钱的套路,就是因为没有意识到这个原因

  (A:浙大计算机博士,B:up主  C:恒大深圳财务总监)

下面进入正题:

如何判定一个因子是否有效

 

分层模型回测

  • 分层模型主要是考量保序作用。

依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量指标优劣的手段。一般来 说,通过回归法和计算因子 IC 值都无法确定因子的单调性(例如,某因子值排名在中间 1/3 的个股表现比前 1/3 和后 1/3 的个股表现要好) , 但是分层回测法是可以确定因子单调性的。 分层回测法逻辑简单,结果清晰,操作方便,并且具有能区分因子单调性的独特优势,是接 受度非常高的一种单因子测试手段。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/97460.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【算法数据结构专题】「线程锁算法专项」初探CLH队列锁机制原理分析

技术扩展 SMP(对称多处理器架构) SMP(Symmetric Multi-Processor),即对称多处理器结构,指服务器中多个CPU对称工作,每个CPU访问内存地址所需时间相同。其主要特征是共享,包含对CPU,内存&#…

使用Python互转pdf文档和word文档

1 前言 一日,欲将手头上的一份pdf文档转换成word文档。先试着用XX办公软件试了下,微信扫码登录后,在PDF转换界面,选中文档,点击“开始转换”,弹出提示对话框:免费的只给转换5页文档&#xff0c…

十万部冷知识:本届世界杯阿根廷会夺冠吗?

明天,世界杯的决赛“阿法大战”就开始了。而我个人是希望阿根廷夺冠的,熟悉我的人会知道,在2014巴西世界杯的64场比赛中,我曾预测对了63场,唯一一场不对的就是,那年阿根廷和德国的决赛,我当时就…

基于SSM村委会工作管理系统

开发工具(eclipse/idea/vscode等): 数据库(sqlite/mysql/sqlserver等): 功能模块(请用文字描述,至少200字): 工作人员: (1)通知管理:对日常的重要信息以及公告进行发布通知。 (2)财务管理:用于收…

【学习打卡】CAM可解释性分析-算法讲解

文章目录引言该算法能做什么直观上研究上意义上精妙之处定位特点弱监督学习特点作者简介CAM算法原理具体计算方法巧妙之处讨论全卷积神经网络池化简介池化的作用全局平均池化CAM总结SqueezeNet显著性分析的意义例1:工艺改进例2:识别鸟例3:围棋…

事业编招聘:事业单位招聘136人!可免笔试!

吉林的小伙伴看过来 2023年吉林四平事业编招聘136人 本科起报名,研究生免除笔试 报名时间:12月20日至12月24日 感兴趣的宝子们别错过了哦 为深入实施“万名大学生留平计划”,持续加大我市党政干部的专业化人才储备力度,现面向…

数据治理的数据流程整合

一、核心业务流程 在企业业务整合时,根据企业对信息化的投入,避免整合对企业业务流程影响过大,按照循序渐进的方式进行整合。 核心业务流程是企业经营、存在、发展的基础。在信息整合中,要围绕这样的业务流程整合企业的信息。在…

首看世界杯

首看世界杯,不谈技术,只聊自己的几点感受,纯属个人感想。 今年是第一次关注世界杯,本来对足球是没有什么兴趣的。如果说对足球有什么了解的话,大部分还是来自小时候的动画片“足球小将”。但是看现实中的足球比赛&…

Java项目:SSM酒吧后台管理系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 管理员角色包含以下功能: 管理员登录,桌位信息查看,查看账单,日常维护,酒水库存管理等功能。 环境需要 1.运行环境:最…

桌面壁纸实时展示粉丝数(CSDN)

最近csdn偶尔就又有几个同学关注我,觉得很有动力!于是我想能在任何时候的桌面壁纸,都能看到csdn粉丝数以及显示他们的昵称,我觉得会很有意义! 下面展示效果,(「・ω・)&…

ArcGIS:如何进行栅格数据的拼接和裁剪、坡度坡向的提取、地形透视图的建立、等高线的提取、剖面图的创建?

目录 01 说明 02 实验目的及要求 03 实验设备及软件平台 04 实验内容与步骤 4.1 DEM 数据拼接和裁剪 4.2 地形属性的提取 4.3 透视图的建立(均在ArcScence中操作) 4.4 建立和显示 TIN 4.5 创建等高线图层 4.6 垂直剖面图创建 4.7 坡度分级 05 实验结果与…

【MySQL】MySQL性能优化

MySQL性能优化1、SQL语句及索引优化1.1 EXPLAIN查看索引使用情况1.2 SQL语句中IN包含的值不应过多1.3 SELECT语句务必指明字段名称1.4 当只需要一条数据的时候,使用limit 1,limit 是可以停止全表扫描的1.5 排序字段加索引1.6 如果限制条件中其他字段没有…

JAVA类和对象重点笔记及理解

1.类创建对象的详细过程 创建完成,dog就成了一个实例(对象),具有属性和方法 Dog类的属性:一般叫做成员变量 Dog类的方法:一般叫做成员方法 类是对象的抽象,对象是类的具体实例。 2.JAVA的数据…

Mycat(4):mycat名词解释

1、逻辑库 对实际应用来说,并不需要知道中间件的存在,业务开发人员只需要知道数据库的概念,所以数据库中间件可以被看做是一个或多个数据库集群构成的逻辑库。 如图一中,在MYCAT服务区中的TESTDB库,只是逻辑上存在的数…

使用GraalVM 构建 Spring Boot 3.0 原生可执行文件

GraalVM 介绍 既然是VM,那肯定也是一个虚拟机,那它跟JVM有关系吗?有一定关系,GraalVM 可以完全取代上面提到的那几种虚拟机,比如 HotSpot。把你之前运行在 HotSpot 上的代码直接平移到 GraalVM 上,不用做任…

【GRU回归预测】基于麻雀算法优化门控循环单元SSA-GRU神经网络实现多输入单输出回归预测附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

java秋招被问到的八股文

投递的岗位是Java后端开发,八股文背了很多,现在面过三十场,做一个总结,整理出一些我确实被问到的问题。 该准备什么 首先是简历里的项目,一定要好好整理,项目的架构是怎样的,开发过程中遇到的…

国产实时操作系统+intel x86/龙芯平台超边缘计算机方案

引言 近年来,物联网、云计算、机器学习和网络安全等技术不断推动工业 4.0 的发展,“云边端” 的架构正逐步替代 “云管端”,边缘计算成为新时代许多领域转型的关键要素。以智能制造为例,不同于为互联网服务的 CDN 边缘计算技术&a…

Spring(二):Spring的创建和使用

目录一、创建Spring项目1.1 创建一个Maven项目1.2 添加Spring框架支持1.3 创建启动类二、使用Spring存储对象2.1 创建Bean2.2 将Bean注册到容器三、获取并使用Bean对象3.1 创建Spring的上下文3.2 从Spring上下文对象中取出Bean对象3.3 使用Bean一、创建Spring项目 1.1 创建一个…

传统数据治理的常见陷阱有哪些?

一、传统的数据治理 传统的数据治理是一种数据优先的治理方法。这种传统方法缺乏响应数据用户需求的流动性——或者在新法规出现时适应新法规的灵活性。传统方法概述角色、创建数据标准、分配责任并创建公司范围的数据策略。因为它强调对数据的控制,这种方法威胁工…