智能风控体系之基于IC值因子有效性研究

news2024/12/24 22:12:45

在量化金融股市市场中,因子有效性的检验是经常被提及的。实际上对于多因子量化选股模型的有效性分析,更有指导参考意义的指标应该观察看的IC和IR。

因子评价4大维度:

1.因子单调性:因子单调性越高,收益越强。

2.因子有效性:因子对未来收益的解释能力。

3.因子稳定性:因子的有效性是否稳定、可持续。

4.因子时效性:在过去有效的因子,现在或将来不一样有效。

信息系数IC介绍

表示所选股票的因子值与股票下期收益率的截面相关系数,通过 IC 值可以判断因子值对下期收益率的预测能力。通俗来说,IC代表因子选股带来的超额收益能力。IC值越大,因子的Alpha就越大:

1.IC的最大值为1,则因子预测能力100%准确;

2.IC最小值为-1,则因子反向的预测作用;

3.IC等于0,则因子预测无效果;

4.当IC大于5%或者小于-5%,就认为因子是比较有效。

5.如果IC的平均值能够达到10%以上,则代表这个因子的预测能力非常强。

常见的IC有两种:一种是Normal IC 另外一种则是Rank IC。通常使用的是RankIC,此时IC表示因子选出股票的排名与股票收益率的相关性。

  • Normal IC

IC的定义:t期(这里的期一般指的是调仓周期)的因子载荷(因子值)对t+1期的收益预测值和实际收益之间的相关系数。

  • Rank IC

Rank IC即某时点某因子在全部股票暴露值排名与其下期回报排名的截面相关系数,它与IC的区别就是将因子的具体值以及收益的具体值都转换为了所对应的数值在其截面上的排序名次。然后通过计算排序值的相关系数(秩相关系数),得到Rank IC。

具体案例方法:

第一种方法是按照因子取值把个股分成 n 档(比如6档),然后将每一档视作一个投资组合,计算投资组合收益率和投资组合因子在截面上的 IC 或 Rank IC。每一个投资组合中,可以按照等权或者市值加权来计算投资组合的收益率和因子取值。因子描述的是一揽子股票所共同承担(或者暴露于的)的某一方面的系统性风险。使用因子选股是为了规避个股特异性收益率的风险。因此,比起个股,我们更应该关注一揽子股票的收益率和相应因子取值之间的相关性。这就是使用因子构建投资组合、再计算 IC 的初衷。投资组合的收益率是一揽子股票的均值,也可以更好地消除收益率上的噪音。

信贷风控角度计量IC值

将分箱坏账率作为投资组合的收益率,按照信贷风控中征信指标或者外部数据评分取值把所有客户同一时间段的样本分成 n 档(比如6档),然后将每一档视作一个分箱组合,计算分箱组合坏账率和分箱组合因子在截面上的 IC 或 Rank IC。每一个分箱组合中,可以按照等权或者平均加权来计算分箱组合的坏账率和因子取值。

图片

d1 = pd.DataFrame({'x':datas['Tdcredit'],'y':datas['Y'],'bucket':pd.cut(datas['Tdcredit'],6)}) #利用pd.cut实现等距分箱
d2 = d1.groupby('bucket',as_index=True) # 按照分箱结果进行分组聚合
d3 = pd.DataFrame(d2.x.min(),columns=['min_bin'])
d3['min_bin'] = d2.x.min() # 箱体的左边界
d3['max_bin'] = d2.x.max() # 箱体的右边界
d3['mean_bin']=d2.x.mean()
d3['bad'] = d2.y.sum() # 每个箱体中坏样本的数量
d3['total'] = d2.y.count() # 每个箱体的总样本数
d3['bad_rate'] = d3['bad']/d3['total'] #
d3['分组']=range(1,len(d3)+1)
d3

图片

通过计算因子排名与分组坏账率计算IC值和计算因子分组平均值与分组坏账率计算IC值:

图片

第二种方法仍然从分组坏账率和因子取值的 IC 出发,但是在计算时根据因子的业务逻辑(大到小、还是小到大的关系)来给 x 和 y 的取值赋权,从而得到weighted IC。由于结合了从业务逻辑出发的权重,这个加权 IC 能更好的反映因子的选股能力。

图片

总结:通过两种方法去计量IC值,绝对值均大于0.8。可知该因子的筛选坏客户的能力很强。好坏区分能力效能很好。IC_IR:IC / IC的标准差,衡量因子IC的稳定性。p-value:衡量因子与未来坏账率相关度的显著性,通常我们认为 p-value 低于0.05 的因子对未来坏账率有预测性。也要去考察因子的稳定性,不同时间段的IC值是否稳定和正负方向是否稳定。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1489361.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

笔记74:在SLAM建图过程中,为什么要使用【障碍物点云配准算法】和【里程计估算算法】结合的方法

仅使用【障碍物点云配准算法】,很容易导致在一条长通道中,因为前后两帧的雷达点云图过于相似,导致特征匹配一直完全重合,使得机器人建图一直停留在原地,但实体机器人早就沿着通道跑向远端了; 使用Hector_ma…

三范式与ER模型

三范式 概念: 三范式(3NF)是关系型数据库设计理论的基础,它确保数据的结构化和减少数据的冗余性。三范式由数学家E.F. Codd在1970年提出,作为关系理论的一部分。三范式包括: 第一范式(1NF&am…

182基于matlab的半监督极限学习机进行聚类

基于matlab的半监督极限学习机进行聚类,基于流形正则化将 ELM 扩展用于半监督,三聚类结果可视化输出。程序已调通,可直接运行。 182matlab ELM 半监督学习 聚类 模式识别 (xiaohongshu.com)

我的NPI项目之Android 安全系列 -- Keymaster到底是个什么

最近因为一直在调研独立secure element集成的工作,不巧的是目前使用的高通平台只有NFC-eSE的方案。高通目前也并不支持独立的eSE集成,codebase中并无相对应的代码。举个例子,目前使用的STM的一款eSE,但是这款eSE的开发STM还没有完…

Mint_21.3 drawing-area和goocanvas的FB笔记(三)

一、改变goocanvas线条自动画线时间间隔 通过系统SIGALRM信号触发,每秒画一条线对于慢温湿度等慢变信号可以应付,但对于快速信号1秒的间隔就太慢了。可以改变方式,通过另外的线程,完成要做的任务。 1. 线程的回调函数 myfunc 2…

串的定义及BF算法

定义 BF算法——朴素查找算法——也叫做串的模式匹配算法 其应用特别多,比如经常在一篇文章里面搜索一些东西,(比如文章里的某个内容,或某些关键字词出现的位置,次数等) 之前我们大多数情况下是用来搜索关…

在Ubuntu中安装pycharm的专业版且可以激活到2099年(保姆级教学,值得借鉴与信任)

一、进入官网,下载Pycharm2021.3版本 1.官网如下 https://www.jetbrains.com/pycharm/2.在浏览器中进入官网后,点击Download 3.再点击右下角的Other versions 4.选择Version 2021.3下的2021.3-Linux(tar.gz)进行下载 二、安装Pycharm2021.3 1.先将该压…

还在手动Word转PPT?快来试试这些一键生成工具!

在我们日常的工作和学习中,将Word转化成PPT的需求时常出现,尤其是当我们需要进行演讲或者报告时。这不仅能使我们的演讲更具视觉冲击力,也有助于我们更好地传达信息。 那么,如何才能轻松地将Word转换成PPT呢?下面将为…

MWC 2024 | 紫光展锐推出业界首款全面支持5G R16宽带物联网特性的芯片平台V620

要点: 紫光展锐V620支持5/4/3/2G全网通。支持NR 2CC和LTE 5CC,在SA网络下,其5G下行速率可达4.67Gbps,上行速率高达1.875Gbps,相比紫光展锐上一代产品提升100%。紫光展锐V620率先支持5G TSN,把5G应用于工业…

汽车设计的视觉盛宴:艺术家的渲染效果图集锦

对于那些对汽车渲染艺术充满热情的朋友来说,"至臻汽车"渲染效果图总是心之向往。本回,我们精心准备了第十届3dmodels年度汽车渲染比赛的佳作,收录了来自全球的顶级创作者的精彩作品。每张作品都代表了艺术家对精细质感的深究及对极…

基于springboot+vue的流浪宠物管理系统

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

【每日刷题】数组-LC56、LC238、随想录1、LC560

1. LC56 合并区间 题目链接 Arrays.sort先让intervals里的子数组按照子数组的第一个数字值从小到大排列。开一个新数组,newInterval,存放合并好的子数组让intervals的当前子数组i的第一个数字与newInterval的当前子数组index的最后一个数字比较大小&am…

软文推广带来的收录排名提升,助你在搜索引擎中脱颖而出

互联网营销是一种不受时间和空间限制的营销方式,是一些中小企业成本低、效果好的推广方式。 行业做软文推广,最重要的是选择合适的软文推广平台,现在市场上有很多软文推广平台,这使得很多企业难以选择,此时企业需要学会…

回溯算法套路③排列型回溯+N皇后【基础算法精讲 16】

46 . 全排列 链接 : . - 力扣&#xff08;LeetCode&#xff09; 思路 : 那么怎么确定选了那个数呢? 这里设置一个used表示i选没选过 ; class Solution { public:vector<vector<int>> ans;vector<int> path;void backtrack(vector<int>nums,vect…

常见漏洞的流量特征

1、SQL注入漏洞 查看url / Referer字段/User-Agent字段/cookie字段 出现一些特殊字符&#xff08;eg&#xff1a;单引号【‘】、双引号【“”】、括号【&#xff08;&#xff09;】、单引号括号【‘&#xff08;】、双引号括号【“&#xff08;】等一些常见的特殊的字符&#…

ansible执行速度慢问题解决过程

ansible执行速度慢问题解决过程 一、初见端倪二、问题分析三、解决问题更多技术博客,请关注微信公众号:运维之美 接到项目反馈,客户环境使用我们提供工具部署产品,在主机添加步骤卡了很久,实施同学没有办法,将问题上升给我们。 环境信息:kylin10 架构:arm 一、初见…

【NR 定位】3GPP NR Positioning 5G定位标准解读(四)

目录 前言 6 Signalling protocols and interfaces 6.1 支持定位操作的网络接口 6.1.1 通用LCS控制平面架构 6.1.2 NR-Uu接口 6.1.3 LTE-Uu接口 6.1.4 NG-C接口 6.1.5 NL1接口 6.1.6 F1接口 6.1.7 NR PC5接口 6.2 终端协议 6.2.1 LTE定位协议&#xff08;LPP&#x…

python二级常见题目

一.常见语法 jieba—第三方中文分词函数库 jieba—第三方中文分词函数库_jieba库函数-CSDN博客 Python基础——format格式化 Python基础——format格式化_python format-CSDN博客 format()方法的使用超全_format方法-CSDN博客 Python中random函数用法整理 Python中random…

如何在CentOS部署JumpServer堡垒机并实现无公网ip环境远程访问

文章目录 前言1. 安装Jump server2. 本地访问jump server3. 安装 cpolar内网穿透软件4. 配置Jump server公网访问地址5. 公网远程访问Jump server6. 固定Jump server公网地址 前言 JumpServer 是广受欢迎的开源堡垒机&#xff0c;是符合 4A 规范的专业运维安全审计系统。JumpS…

网络进程:广播、组播、流式域、报式域(套接字)

1.广播 1.1广播发送端模型(类似UDP客户端) 程序代码&#xff1a; #include<myhead.h> int main(int argc, const char *argv[]) {//创建套接字int sfdsocket(AF_INET,SOCK_DGRAM,0);if(sfd-1){perror("socket error");return -1;}//将套接字设置成允许广播i…