1、背景说明
本文旨在提出一种针对风控催收受限情况下,如何提升风控审批模型的风险识别能力,以缓解贷后催收的压力,降低贷款资金坏账的风险。这篇工作依然是很早期的项目,分享的目的一方面做笔记,另一方面则是希望其中涉及的算法思想和优化点,对读者有一定的启发作用。
本文所涉任务是面向续贷审批场景,当然也可以将该思想扩展到其他场景。主要是提出一种融合还款意愿分层的逾期⻛险识别的新模型。之前风控场景流⾏的建模⽅式,是对Y的定义为贷后⽤户是否为dpd10+。这样的处理⽅式,在模型训练时,虽然能够⼀定程度把 ⾮dpd10+的⽤户排在前⼏档, 但是不能保证这⼏档的好⽤户还款意愿强弱与后⼏档的好⽤户存在差异。 在低⻛险档中,很容易混⼊ dpd1-10的“好⽤户”,⽽这些⽤户越往后其逾期的概率越⼤。 因此随着催收的⼒度降低,更容易造成dpd10+的⽤户产⽣,影响全⽣命周期的坏账率。 所以通过对Y进⼀步细化,引⼊⽤户的还款意识强度的识别,进⼀步提升模型对还款意识强的好⽤户的识别能⼒。
2、数据分析
还款⾏为在续贷贷后不同期的分布转移分析:
初步分析结论:
(1)M1各类用户到M2,M3的迁移分布保持一致。
(2)M1各类用户到M3的迁移分布与M2各类用户到M3的迁移分布保持一致。
(3)从M1-M3&M2-M3,可看出,M1的各类用户能够体现出还款意愿强弱差异。
(4)对用户按照意愿强度分层具备意义,如果控制放款的用户为“提前还款”用户,有利于在当前催收力度下降的情况下,控制全生命周期的坏账。
(5)因此评判模型的优劣,需额外引入新的指标,即topK档的好用户中“提前还款或者当天还款”用户占比。
因此我们希望通过改变模型的学习目标后,模型评估的结果分布可以将提前还款用户占比提升。
3、续贷审批流程
4、融合还款意识分层的信用风险识别审批模型
4.1 模型思路
针对申请的⽤户,⾸先会识别其还款意愿度, 筛选出有较强还款意识的申请者。因为不同的
还款意识强度,会对应不同的还款⾏为。提前还款⽤户偏好提前还款或者按时还款。
针对1-3
类的每⼀分层,都会构建对应场景限制的逾期⻛险模型。如针对提前还款场景,在M1-M3任意⼀期逾期dpd10+
作为坏⽤户,反之作为好⽤户,训练⻛险识别模型。对于第4
类,由于其本身属于还款意识弱的⾼危⽤户,因此会直接作为⾼⻛险⽤户。
通过有效融合还款意识模型分以及各分层信⽤⻛险模型分,得到最终的⽤户排序分值,从低到⾼⻛险排序⽤户。
4.2 模型实践
4.2.1 初步策略探索(baseline+策略1~4)
baseline
:
不加⼊还款意图分层,使⽤
Xgboost
进⾏⼆分类
融合策略
1
:
加⼊还款意图分层
(
P
repay_intention), 除
dpd10
还款类别外,各分层单独训练主信⽤⻛险模型
(
P
overdue_risk)
融合策略
2
:
在融合策略
1
的基础上,对
P
overdue_risk
(x, repay_intention)
进⾏
Min-Max Scale
(
MMS
)
融合策略
3
:
加⼊还款意图分层, 单独训练主信⽤⻛险模型
融合策略
4
:
加⼊还款意图分层, 单独训练主信⽤⻛险模型
,
输⼊
RF stacking
进⾏模型融合
不同融合策略结果对⽐:
还款意愿分层确实能够改变
L1-L3
的好⽤户组成⽐例
4.2.2 优势策略融合
4.2.2.1 策略5
融合策略5:策略1+策略4优势互补
从实验结果来看,策略1
可以明显提升
L1-L3
的提前还款⽤户⽐例,⽽策略
4
可以明显降低
L1
的容忍期还款⽤户⽐例。 我们希望通过对策略1
和策略
4
结合进⾏优势互补,
既能提升
L1-L3
的提前还款⽤户⽐例,⼜能明显降低
L1
的容忍期还款⽤户⽐例
。
4.2.2.1.1 策略5新数据结果
结果说明
(
融合策略
5
相对于
baseline
)
:
(1) L1-L3
,
提前还款⽤户占⽐
都有提升,其中
L1
的
提升⽐例
为
19.54%
(2) L1-L3
,
容忍期还款⽤户占⽐
都有降低,其中
L1
的
降低幅度
为
39.05%
(3)
前三档总的
坏账率由
0.561%
下降到
0.549%
(4) ks
保持⼀致
4.2.2.2 策略6
融合策略6(融合策略5+加法模型)
增加加法模型,从实验结果来看,策略
6
相对于策略
5
,可以使前三档逾期率有明显的下降。
加法模型, 该方法我们已经在《
互联网风控业务中的拒绝推断场景算法应用分享(涉及半监督算法、异常检测、变分自编码、样本权重自适应调整、迁移学习等)
》中提及:
结果说明
(
融合策略
5
相对于
baseline
)
:
(1) L1-L3
,
提前还款⽤户占⽐
都有提升,其中
L1
的
提升⽐例
为
17.35%
(2) L1-L3
,
容忍期还款⽤户占⽐
都有降低,其中
L1
的
降低幅度
为
39.64%
(3)
前三档总的
坏账率由
0.561% 大幅
下降到
0.527%
4.2.3 算法优化点总结