信贷产品年终总结之风控评分模型

news2024/9/28 13:18:58

叮咚,信贷年终总结的又一个专题来了,作为报告总结类的系列型文章,近期我们番茄知识星球平台陆续发布了相关年终总结专题,依次为客群特征画像、贷中行为分析、贷后逾期表现等,以上文章可详见之前陆续发布的内容。该业务场景不仅涉及贷前贷中贷后的典型分析环节,而且还有专项描述风控体系的策略与模型。同时,每篇文章兼顾了业务介绍与案例实操,将理论知识、样例实践有效结合起来,便于大家能够更全面理解信贷总结的重点内容。
今天的专题文章将聚焦在“信贷产品年终总结之风控评分模型”,重点来介绍贷前申请评分模型(A卡)在历史数据的效果表现,从而客观评价模型区分度与稳定度的整体性能。在具体内容介绍过程中,我们将以实例模型分析为主线,围绕测试样本数据来描述模型对象在不同维度的效果与能力,例如好坏用户的区分度、时间窗口的稳定性、客户分层的有效性等。
在展开样例分析之前,我们简单熟悉下评分模型在贷前风控流程的重要价值,可以认为模型是信贷风控体系必不可少的模块,尤其是申请评分卡模型(A卡)是各信贷产品经常采用的形式。模型在应用层面上可以理解为是一种策略规则,但由于模型与策略在开发复杂度、特征丰富度、信息饱满度等方面有较大区别,因此模型在实际场景中往往以独立模块来对待。在贷前风控的决策流程中,模型与策略相互协调配合,构成风控决策有效的风险审核机制,二者虽然加工过程有较大差异,但识别风险且决策目标是一致的,相应示意描述如图1所示。
在这里插入图片描述
图1 贷前风控决策流程

1、实例样本描述
本文选取的实例样本均为具有贷后表现的存量用户数据,包含40000条样本与4个字段,部分数据样例如图2所示。其中,id为客户订单号,且主键唯一;date为放款时间,窗口范围202101~202112;score为A卡模型分数,取值范围300~700;flag为贷后违约标签,1/0分别代表是/否。
在这里插入图片描述
图2 样本数据样例

我们先来简单了解下模型分数score的极值大小,以及在全年时间窗口date的分布形态,具体实现过程如图3所示,输出可视化结果分别图4所示。由图可知,模型score主要集中在分数433~483区间段,整体分布并未呈现出标准的正态形式,当然这并非说明模型应用效果不好,而是实际业务的一种客观数据体现。此外,模型分数score的最大值、最小值、平均值依次为647、373、481。
在这里插入图片描述
图3 模型分布形态实现

在这里插入图片描述
图4 模型分布可视化

由于样本时间窗口为202101~202112全年12个月,通过图5分析过程可以从整体上了解不同月份的用户数量情况,具体可视化分布结果如图6所示,可见每月放款用户量的规模大小较为稳定。
在这里插入图片描述
图5时间窗口用户量分析

在这里插入图片描述
图6 时间窗口用户量分布

2、样本坏账分析
由于实例样本的特征标签flag代表违约表现,取值0/1直接反映出用户的好坏情况。因此,通过样本用户群体的好坏分布,可以了解贷前风控体系的综合效果,从而体现出策略与模型的决策性能。我们以不同月份时间窗为参考维度,来简单分析下各月份的坏账率变化趋势,样本坏账率badrate的分析过程如图7所示,输出明细结果数据如图8所示,相应可视化分布如图9所示。
在这里插入图片描述
图7 样本坏账率分析

在这里插入图片描述
图8 样本坏账率明细

在这里插入图片描述
图9 样本坏账率可视化

由以上分析结果可知,样本在全年所有月份的平均坏账率为36.3775%,各个月份表现基本在此数值附近,指标的整体变化趋势较为稳定,其中坏账率最高的月份为202103(37.1%),坏账率最低的月份为202107(35.3%)。

3、模型评级分布
评分模型在贷前环节的应用机制,往往是根据某个阈值进行判断并决策,当然这个阈值是在建模过程经过分析确定的。举个例子,当申请用户的模型score小于300时采取拒绝,否则予以通过走后续审核环节。对于存量用户且有贷后表现的样本数据,无需再次围绕某个阈值进行决策,但从客户管理方面考虑,我们可以将样本用户群体的模型分数采取分段形式表示,按照分数高低划分多个风险等级(例如A/B/C/D/E),从而可以量化分析模型评级的风险程度差异。此外,模型评级也可用于客户价值度管理,为后期的精准营销提供理论依据与数据参考。
针对样本用户数据,我们通过模型分数score来进行风险等级划分,具体实现过程详见知识星球代码详情,将用户群体分为A/B/C/D/E共5个等级,风险从低到高。同时,我们在不同评级维度下汇总相应的好坏用户数量、坏账率等指标,输出结果如图11所示。
在这里插入图片描述
图11 模型评级分布

通过以上结果可知,按照模型分数转换得到的模型评级,对于各风险类型的用户群体有较明显区分效果,从A到E的风险等级升高,对应坏账率(bad_pct)同步增大,且数值跨度较为显著,可视化分布如图12所示。同时,各评级类型的样本群体占比均有一定规模(12.725%~23.3%),进一步体现了模型score对用户群体分层的有效性与合理性。
在这里插入图片描述
图12 模型评级坏账表现

由上图结果可以了解到,模型评级C对应的坏账率为36.73%,与所有用户的整体坏账率36.3775%较为接近,因此评级D与E属于坏用户群体,尤其是等级E相应的坏账率达到50.97%,因此了解此类用户群体的变化情况,在实际业务中非常必要。下面我们按照不同月份的时间窗维度,来汇总各个月份评级D与E的分布情况,具体实现过程详见知识星球代码详情,输出数据结果分别如图14、15所示。
在这里插入图片描述
图14 模型评级E分布结果

在这里插入图片描述
图15 模型评级D分布结果

从以上结果可知,高风险E/D等级用户群体在各个月份的占比大小分别稳定在22.5%、23.2%附近,没有较明显的波动节点。在实际业务场景中,此类用户群体由于风险表现较高,后期二次营销的价值度很低,但从风控体系优化的角度考虑,可以从中挖掘高风险的特征表现,从而为风控策略或模型的调整提供有价值的数据参考。

4、模型稳定性能
风控模型在应用实践中,除了重点分析模型的区分度,还要考虑模型的稳定度,若模型在不同时间窗口有较大波动,会直接影响业务的通过率、风控的准确率等,因此研究分析模型的稳定性能显得至关重要。本文根据时间维度date,按3个月间隔单位将全年12个月划分为4个时间窗口,分别为Time1(202101202103)、Time2(202104202106)、Time3(202107202109)、Time4(202110202112),我们依次分析Time1~Time4时间窗样本相互之间的稳定性能,这里采用PSI指标来展开量化分析。
为了便于分析,我们将模型分数score划分为10个区间bin01~bin10,然后分别统计各个Time时间窗的样本区间占比,从而可以算出样本分布的PSI指标,具体实现过程详见知识星球代码详情,由于各样本之间稳定性分析的原理逻辑一致,这里以Time1与Time2的分析过程作为样例,更多详情参见本文附带代码。
通过以上分析过程,可以得到时间窗Time1与Time2样本评分的PSI分布结果,其中PSI=(pct1-pct2)*ln(pct1/pct2),具体数据如图18所示,相应样本模型评分的整体PSI=0.0019,远低于实际业务通常采用的稳定性判断阈值0.1,说明两个时间窗样本评分的稳定性表现较好。按照以上Time1与Time2对比分析逻辑,我们可以同理得到Time1~Time4时间窗样本相互之间的评分PSI值,具体结果如图19所示,可见模型评分在各个时间窗口均表现稳定。
在这里插入图片描述
图18Time1&Time2评分PSI

在这里插入图片描述
图19不同Time时间窗评分PSI

综合以上内容,我们围绕实例样本数据,通过实操详细介绍了评分模型的综合性能表现,包括风险量化的区分度、客户评级的有效性、时间窗口的稳定性等,客观描述了风控评分模型的整体决策优势,在实际场景中对于风控审批、客户分层、精准营销等方面具有非常重要的意义。为了便于大家对风控评分模型应用分析的进一步了解与熟悉,本文额外附带了与以上内容同步的python代码与样本数据,详情请移至知识星球查看相关内容。
在这里插入图片描述
在这里插入图片描述


~原创文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/129270.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

nacos配置部署与管理

nacos配置部署与管理配置文件配置获取顺序:nacos配置热部署方式一:RefreshScope方式二:ConfigurationProperties配置文件 首先新建配置文件 Data ID:配置文件的名称(唯一)命名规范:服务名称-运…

广州车展|继原力技术之后,长安深蓝半固态电池呼之欲出

新年将至,万象更新。12月30日,2022第二十届广州国际汽车展览会在广州中国进出口商品交易会展馆隆重举办。全新数字纯电品牌长安深蓝携旗下首款战略车型深蓝SL03重磅参展,并邀请深蓝SL03车主亲临车展现场,或进行产品讲解&#xff0…

面向对象分析与设计的底层逻辑

作者:高福来 阿里全球化业务平台团队 在面向对象出现之前,已有面向过程的分析方法,那为什么面向对象被提出了呢?究其本质,人们发现面向过程并非按照人正常认识事物的方式去分析软件。面向过程是一种归纳的分析方法&a…

virtio技术(3)virtqueue机制

virtio技术(3)virtqueue机制 virtio的关键技术是virtqueue机制,其提供了一套统一的用于virito前端和后端的通信机制。virtqueue的核心数据结构是vring,这是virtio前端驱动和后端Hypervisor虚拟设备之间传输数据的载体。 vring数…

Word处理控件Aspose.Words功能演示:使用 Java 将 RTF 转换为 PDF

Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外, Aspose API支持流行文件格式处…

改变podman的存储路径

使用podman容器时,podman会默认使用/var/lib/containers路径作为存储路径,可能会导致根磁盘空间占用过大,那如何修改podman的存储路径呢?本文将带你一起来探讨。 前几天公司的服务器根目录磁盘空间不足了,经过查找问题…

JAVA - fastjson 中 JSONObject 的顺序问题

目录 1. JSONObject 存在的默认排序问题一 1.1. 解决方案一 1.2. 解决方案二 2. JSONObject 存在的默认排序问题二 2.1. 解决方案一 2.2. 解决方案二 在使用 fastjson 中的 JSONObject 有时候会遇到数据顺序发生了变化,而实际需求中需要保持原有的顺序。 1…

【软件测试】测试人的巅峰?测试专家?

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 经常有人谈到&#…

如何实现全网置灰?CSS3来解决

文章目录前言正文网站示例核心代码前言 当发生大事时,部分小伙伴会发现:“怎么某APP是灰的?不会是手机出问题了吗?” 然后再打开其他APP,发现:“都是灰的啊!明白了,看来是有大事发生…

UKF 无迹卡尔曼滤波

目录参考:UKF数学原理:UKF的基本非线性系统描述:计算sigma point和权重参数UKF的基本预测步和更新步:UKF代码实现:参考: UKF数学原理: UKF的基本非线性系统描述: The UKF takes i…

vue element-ui 手机号校验 验证码校验 获取验证码倒数60秒无样式实现模板

上一篇其实发过了。。。 但是实在真的是太丑了 丑到自己看不下去了 加个对话框好看很多&#xff0c;再发一次 原链接为&#xff1a;https://blog.csdn.net/ZZDT099/article/details/128496693?spm1001.2014.3001.5502 <template><el-dialog title"校验手机号…

算法:反转图像(旋转的矩阵)

前言 今天要介绍的是一个较为经典的算法题&#xff1a;反转图像或者旋转矩阵。这道题的原题是Leetcode上的一道题&#xff0c;在题库序号为48。具体内容粘贴如下&#xff1a; 这种题目就是一个典型的倒置矩阵的思路&#xff0c;大体内容就是将一个矩阵逆向反转90度。首先针对…

Spring Boot学习篇(四)

Spring Boot学习篇(四) 1 BLOB(二进制大类型) 1.1 创建tb_blob表,其sql语句如下所示 CREATE TABLE tb_blob(id number primary key,fname VARCHAR2(50) NOT NULL,f blob )1.2 在entity包下面创建TbBlob实体类 package com.zlz.entity;import lombok.AllArgsConstructor; im…

【嵌入式】NXP/LPC使用GPIO+定时器模拟UART串口接收

目录 一 项目背景 二 原理说明 三 设计实现--GPIO部分 四 设计实现--定时器部分 五 总结 一 项目背景 项目需要使用485串口编码器&#xff0c;编码器的数据以波特率9600持续向外发送。接收端计划使用485转换芯片MCU串口。但是片上的外设资源已经被占用了&#xff0c;没有多…

19.删除链表的倒数第N个结点

给你一个链表&#xff0c;删除链表的倒数第 n 个结点&#xff0c;并且返回链表的头结点。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], n 2 输出&#xff1a;[1,2,3,5] 示例 2&#xff1a; 输入&#xff1a;head [1], n 1 输出&#xff1a;[] 示例 3&#…

车辆未冲洗抓拍识别 工地车辆冲洗监测 opencv

车辆未冲洗抓拍识别 工地车辆冲洗监测系统t通过opencvpython可以对进出车辆冲洗情况进行自动识别&#xff0c;发现冲洗不合格自动进行抓拍存档。OpenCV基于C实现&#xff0c;同时提供python, Ruby, Matlab等语言的接口。OpenCV-Python是OpenCV的Python API&#xff0c;结合了Op…

如何对美国服务器响应速度进行优化

决定一个网站加载速度的最大因素之一是服务器的响应时间。服务器响应时间是你的服务器响应用户请求的速度&#xff0c;它可以大大影响你网站的用户体验。本文中&#xff0c;我们将讨论如何确定美国服务器响应时间慢的原因&#xff0c;尤其是如何对美国服务器响应速度进行优化。…

初探Lua脚本

1、什么是Lua Lua脚本是一个由C语言编写的小巧脚本语言&#xff0c;在所有脚本引擎中&#xff0c;Lua的速度是最快的。Lua的核心代码不过一万多行&#xff0c;因为是C语言编写的&#xff0c;因此Lua可以在几乎所有的操作系统和平台进行编译运行 2、Lua适用场景 1&#xff09;…

minio分布式集群部署

minio分布式集群部署 分布式 Minio 可以让你将多块硬盘或者多台服务器组成一个对象存储服务。由于硬盘分布在不同的节点上&#xff0c;分布式 Minio 避免了单点故障。MinioMinio分布式模式可以帮助你搭建一个高可用的对象存储服务&#xff0c;你可以使用这些存储设备&#xff…

七种分布式系统的解决方案,一次性讲给你听!

V-xin&#xff1a;ruyuan0330 获得600页原创精品文章汇总PDF 目录 TB级数据放在一台机器上&#xff1a;难啊&#xff01;到底啥是分布式存储&#xff1f;那啥又是分布式存储系统呢&#xff1f;天哪&#xff01;某台机器宕机了咋办&#xff1f;Master节点如何感知到数据副本消失…