信贷产品年终总结之贷中行为分析

news2024/11/24 19:04:12

番茄知识星球平台上周开始推出信贷业务年终总结的系列文章,首篇主题为客户特征画像,并已在平台发布(12月13日),感兴趣童鞋可前翻查阅。作为系列专题的续集,本篇将围绕信贷存量数据为大家带来第二个主题“贷中行为分析”,其核心内容是根据某信贷业务客群的历史还款明细数据,来分析汇总不同客户群体在还款周期内的行为表现,从而了解贷中客户群体的整体业务状况,以及各类客户的分布特点。

1、实例样本介绍
在介绍本文主题相关内容时,我们仍然以实例模拟数据与python代码实操相结合,全面理解并实践整个数据分析过程。本文选取的实例样本数据,来自于客户还款信息明细表,共包含136224条样本与11个字段,每条样本观测代表某客户某一分期的还款详情,包括放款日期、放款金额、合同金额、产品期数、应还日期、结清日期、应还金额、已还金额、待还金额等详细字段,部分数据样例如图1所示,具体特征字典如图2所示。其中,字段apply_id为样本主键,同一客户订单号下包含多条分期还款明细数据,以样本apply_id=15357394149为例,由于对应产品期数(periods_num)为6,则此客户共有6条样本数据,分别体现从1至6每期的还款状态与行为表现。
在这里插入图片描述
图1 样本数据样例

在这里插入图片描述
图2 特征字典详情

2、整体业务情况
针对以上样本数据,我们先来了解下数据的整体情况,包括日期窗口、客户数量、期数类型、额度范围、应收总额、已还总额、待还总额等,具体实现过程详见知识星球代码详情,输出结果如图4所示。
在这里插入图片描述
图4 整体情况指标

根据以上分析指标结果,可以大体了解到业务的基本情况,产品分期包含3种类型,额度范围为100012000,在时间窗口2020040120201230内,共放款12741笔,放款总金额为73144600,本金与利息形成的合同总金额为84589667。此外,对于应还总金额,理论上与合同总金额一致,但由于实际场景中会存在优惠券抵扣等情况,使得应还总金额低于合同总金额。
由于放款月份(loan_date)、放款额度(loan_amount)、产品期数(period_num)等维度均为业务分析的重要指标,因此我们在实际场景中有必要对其展开进一步的细化分析,从而了解不同放款月份、不同放款额度、不同产品期数维度下的订单数量、放款金额、还款金额等分布情况。这里我们以订单数量指标为例,首先来了解下各个放款月份(loan_date)的分布表现,具体分析过程详见知识星球代码详情,相应结果如图6所示。
在这里插入图片描述
图6 放款月份的订单分布

针对放款额度(loan_amount)的分析,由于授信额度的取值较多,为了便于数据汇总与结果展现,可以将其转换为额度区间来进行分析,本例以额度差1000为间隔,将各个单一额度取值以额度区间形式表示,具体实现过程详见知识星球代码详情,输出分布结果如图8所示。
在这里插入图片描述
图8 放款额度的订单分布

通过以上结果可知,当前产品的放款额度主要集中在[6000,7000)、[8000,9000)、[3000,5000)区间,以[6000,7000)的占比最高(32.2659%)。下面我们再来了解下产品期数(period_num)的类型分布,具体分析过程如图9所示,输出分布结果如图10所示,可见6期订单形式占主要类型,数量占比(82.6073%)明显高于9、12期类型。
在这里插入图片描述
图10 产品期数的订单分布

3、订单分期状态
以上分析过程是针对业务整体情况的了解,而对于客户贷中期间的分期还款表现,是本文需要研究的重点内容,接下来我们将围绕客户不同还款周期的数据表现,来探究不同还款状态的详细指标分布。对于还款状态的类型划分,这里需要重点根据应还日期(repay_date)、结清日期(clear_date)来进行分析,同时还需参考一个当前分析日期,以判断客户相应订单的还款状态,具体分为以下几种类型:
(1)提前还款:结清日期<应还日期(结清日期不为空)
(2)正常还款:结清日期=应还日期
(3)逾期已还:结清日期>应还日期
(4)逾期未还:当前日期>=应还日期(结清日期为空)
(5)未到还款日:当前日期<应还日期(结清日期为空)

本文样例数据的应还日期(repay_date)最晚日期为20211229,我们若以时间窗口2022年来分析,所有用户的分期订单均已到还款日,也就是不存在以上“未到还款日”的状态,因此我们将按照其余4种还款状态(提前还款、正常还款、逾期已还、逾期未还)来分析所有分期订单数据,具体实现过程详见知识星球代码详情。
通过以上过程可以得到所有分期订单的还款状态详情,包括不同状态的订单数量、应还金额的描述分布结果,具体如图12、图13所示,可见在所有客户的全量分期订单中,从订单数量与应还金额2个维度分析,“正常还款”与“提前还款”2种类型均占1/3左右,此外约有18.71%数量占比的“逾期未还”订单,对应金额大小占比约为17.65%。
在这里插入图片描述
图12 订单状态数量分布

在这里插入图片描述
图13 订单状态金额分布

4、客户还款情况
针对所有分期订单的还款状态分析(提前还款、正常还款、逾期已还、逾期未还),虽然可以便于了解各期订单层的还款详情,但在实际场景中以客户层的分析总结,是我们最终需要获取的结果。因此,围绕前边各期订单还款状态的实现,我们来进一步将存量客群划分为以下几种类型:
(1)全部已还:分期订单还款状态均为还款(提前还款/正常还款/逾期已还);
(2)部分还款:分期订单还款状态存在逾期未还,但不全为逾期未还;
(3)全部未还:分期订单还款状态均为逾期未还。
对于客户3种还款情况的区分,具体实现过程如图14所示,输出各类型的频数分布如图15所示,相应的可视化分布如图16所示,可知全部已还的客户数量为9180,约占全量客群的72.05%;存在逾期还款的客户数量为3561(部分还款2946+全部未还615),占比约为27.95%。
在这里插入图片描述
图15 客户还款类型分布

在这里插入图片描述
图16 客户还款类型可视化

5、客户细化分层
对于“全部已还”、“部分还款”、“全部未还”这3种还款情况的客户层分析,一方面可以客观获知客群还款的表现差异,另一方面也可以侧面了解客户的风险程度或营销价值,即风险从低到高(或价值从高到低)的顺序为全部已还、部分还款、全部未还。同时,针对“全部已还”与“部分还款”的客群,根据每期订单还款状态的不同,还可以将客户进一步细化。其中,“全部已还”客群的分期订单由于包含提前还款、正常还款、逾期已还3种情形,且好坏比较可以归纳为提前还款>正常还款>逾期已还。因此,对于还款情况为“全部已还”的客户,“逾期已还”的分期订单数量越多,对应客户的风险程度越高,也可以理解为“提前还款”与“正常还款”的分期订单数量越多,客户的风险程度越低,这也是根据本实例数据对客户细化分层的主要思想。
按照以上“全部已还”客群的细化逻辑,同样包含多种分期还款状态的“部分还款”客户,结合订单数量分布最终可以形成多种组合情况,而在实践场景中为了便于数据分析,可以考虑根据“已还款”与“未还款”2种状态的分期数量来细化客户,其中“已还款”包括提前还款、正常还款、逾期已还,“未还款”即逾期未还。此外,对于“全部未还”的客户群体,由于各个分期订单均为“逾期未还”情形,自然没有细化可能。
围绕以上客户细化分层的原理逻辑,我们选取“全部已还”的客群作为样例来进行分析,由于同一还款情况的客户还存在分期数量的差异(6/9/12),这里我们以6期客群来扩展描述。在客户分层的参考维度上,由于“逾期已还”可以直接反映客户的风险程度,因此对于“全部已还”且同为6期类型的客群,“逾期已还”的订单数量越多,较大程度说明客户的风险越高。根据客户逾期已还(overdue_pay)订单数量的取值范围06,可以依次赋予等级AG,具体实现过程详见知识星球代码详情,输出的频数统计结果如图18所示,对应可视化分布如图19所示,可以直观了解到A等级客户为主要群体,客群占比约为67.7135%,代表全部分期订单均为正常还款或提前还款。
在这里插入图片描述
图18 全部已还客户细化

在这里插入图片描述
图19 全部已还可视化

对于“全部已还”的9期或12期客户,以及“部分还款”的6/9/12期客户,若实现客户细化分层,均可按照以上逻辑来完成,这不仅便于理解客群不同还款状态的分布情况,而且有助于客户群体的风险与营销管理。
综合以上内容,我们围绕信贷产品业务的客户还款表现,结合具体的实例样本数据,详细分析了客群从整体到局部的分布特点,重点对于分期订单的不同还款状态(提前还款、正常还款、逾期已还、逾期未还),以及客户综合订单的不同还款情况(全部已还、部分还款、全部未还),进行了较具体的特征描述与业务概况,这对信贷业务的年终总结有较好的参考意义。为了便于大家对客户还款行为分析的进一步理解与熟悉,本文额外附带了与以上内容同步的python代码与样本数据,供大家参考学习,详情请移至知识星球查看相关内容。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


~原创文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/102336.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多维数据库概念与理解

如今多维数据库已经越来越普及&#xff0c;不少公司开始研发属于自己公司的基于多维开发的作业平台。利用多维的数据直观化、效率高等优势&#xff0c;直接打开数据分析的大门。 有人好奇什么是多维数据库&#xff1f;下面我和大家一一探讨 其实多维数据库是指将数据存放在一…

C语言数组

1、数组 数组使用之前必须声明&#xff1a; 类型定义符 数组名[常量表达式] 在声明数组时必须说明数组长度。 较好的方法是用宏来定义数组的长度。 #include <stdio.h> #define N 10 int main() { int arr[N];for(int i0;i<10;i){arr[i]i1;printf("%d &q…

科技云报道:疫情三年,数字会展成色几何?

科技云报道原创。 三年疫情&#xff0c;会展行业并未消极等待&#xff0c;线上线下融合趋势越来越明显&#xff0c;“数字展会”模式已成为常态化。 据《中国会展主办机构数字化调研报告&#xff08;2022&#xff09;》显示&#xff0c;超七成会展主办方采取数字化手段提升展…

OpenCV 之 图像平滑

1 图像平滑 图像平滑&#xff0c;可用来对图像进行去噪 (noise reduction) 或 模糊化处理 (blurring)&#xff0c;实际上图像平滑仍然属于图像空间滤波的一种 (低通滤波) 既然是滤波&#xff0c;则图像中任一点 (x, y)&#xff0c;经过平滑滤波后的输出 g(x, y) 如下&#xff…

从编程小白到年薪40万,为什么首选Python?

前言 在众多的计算及语言中&#xff0c;呼声很高、位列编程语言榜前面的无疑是生命力顽强的java、最近热度猛增的Python、被称为万物之源的C语言、争议很大的PHP等等。但是对于初学者来说&#xff0c;计算机语言就像天书&#xff0c;不知道到底该学习哪个&#xff0c;从哪一门…

Karl Guttag:Niantic户外AR参考设计或采用Lumus光波导

前不久&#xff0c;Niantic在高通骁龙峰会上公布了一款用于户外场景的AR眼镜参考设计&#xff0c;其特点是采用无线一体化设计&#xff0c;配备了柔性头带&#xff0c;可用来玩LBS AR游戏。目前关于该AR眼镜方案的信息不多&#xff0c;它的光学方案是大家非常关注的一点&#x…

游戏服务端 - AOI九宫格算法

游戏服务端 - AOI九宫格算法 下面简述内容&#xff0c;只针对平面上的简易场景。我们将平面上的场景分为一个个格子&#xff08;Grid&#xff09;&#xff0c;场景管理所有的Grid。如下&#xff08;假设场景的长宽均为20&#xff0c;每个格子宽高定义为1&#xff09;&#xff1…

电脑怎么查看是固态硬盘还是机械硬盘

前言 前两天有粉丝问我&#xff0c;买电脑的时候有的参数看不懂&#xff0c;比如固态硬盘和机械硬盘区分&#xff0c;他听商家说给他配置的电脑是512G固态硬盘&#xff0c;但是又不知道从哪里看到底是不是固态硬盘&#xff0c;怕以次充好。 今天我就跟大家详细介绍一下硬盘到…

五、path路径模块和url模块

上一篇内容讲到的fs文件系统模块是官方提供的内置模块&#xff0c;本篇path路径模块也是Node.js官方提供的内置模块&#xff0c;也是核心模块&#xff0c;用来处理路径&#xff0c;path模块用来满足用户对路径的处理需求。在上一篇内容就涉及到路径拼接的问题&#xff0c;来一个…

1 数据结构 绪论(时间空间复杂度)

文章链接是我的掘金博客&#xff0c;大家有兴趣可以去我的博客上看 博客地址&#xff1a;数据结构专栏 1 数据结构 绪论&#xff08;时间空间复杂度&#xff09;考纲要求 &#x1f495;1 术语&#xff08;逻辑结构&存储结构&#xff09;1.1 数据结构的形式定义&#xff08;…

【图像分割】遗传算法优化K聚类图像分割【含Matlab源码 1605期】

⛄一、遗传算法优化K聚类简介 文中提出基于优化遗传算法的模糊聚类图像分割算法, 是在上述对遗传算法进行了优化的基础上形成的。不仅根据个体适应度大小和变化快慢自适应调节变异率和交叉率, 提高计算准确性和效率, 另外, 在遗传算法迭代计算中加入基于曲线二阶导数的约束条件…

JavaWeb框架(三):JavaWeb项目实战 基于Servlet 实现系统登录注册功能

MVC实战项目 仓储管理系统需求&#xff1a;实现基本的登录和注册功能MVC实战项目&#xff1a;登录和注册登录功能实现注册功能实现总结Redis章节复习已经过去&#xff0c;新的章节JavaWeb开始了&#xff0c;这个章节中将会回顾JavaWeb实战项目 公司管理系统部分功能 代码会同步…

「地表最强」C++核心编程(四)类和对象--继承

环境&#xff1a; 编译器&#xff1a;CLion2021.3&#xff1b;操作系统&#xff1a;macOS Ventura 13.0.1 文章目录一、继承的基本语法二、继承方式2.1 public继承2.2 protected继承2.3 private继承2.4 继承规则三、继承中的对象模型四、继承中的构造和析构顺序五、继承同名成员…

PyQt5利用Qt designer(QT设计师)使用tab widget和stacked widget实现多页面切换

PyQt5 Qt designer QT设计师 使用tab widget和stacked widget实现多页面切换一、使用Qt designer(QT设计师)进行多页面切换ui设计二、实现tab widget多页面切换三、实现stacked widget多页面切换四、生成代码五、运行效果一、使用Qt designer(QT设计师)进行多页面切换ui设计 本…

Go 实现线性查找算法和二分查找算法

耐心和持久胜过激烈和狂热。 哈喽大家好&#xff0c;我是陈明勇&#xff0c;今天分享的内容使用 Go 实现线性查找算法和二分查找算法。如果本文对你有帮助&#xff0c;不妨点个赞&#xff0c;如果你是 Go 语言初学者&#xff0c;不妨点个关注&#xff0c;一起成长一起进步&…

雪花算法原理

SnowFlake算法生成id的结果是一个64bit大小的整数&#xff0c;它的结构如下图&#xff1a;1bit&#xff0c;不用&#xff0c;因为二进制中最高位是符号位&#xff0c;1表示负数&#xff0c;0表示正数。生成的id一般都是用整数&#xff0c;所以最高位固定为0。41bit时间戳&#…

热门技术中的应用:云计算中的网络-第27讲-云中的网络QoS:邻居疯狂下电影,我该怎么办?

在小区里面,是不是经常有住户不自觉就霸占公共通道,如果你找他理论,他的话就像一个相声《楼道曲》说的一样:“公用公用,你用我用,大家都用,我为什么不能用?”。 除此之外,你租房子的时候,有没有碰到这样的情况:本来合租共享WiFi,一个人狂下小电影,从而你网都上不…

编程15年40岁程序员的我终于在压力下被迫转行了

本人今年40岁多了&#xff0c;中山大学计算机小硕&#xff0c;已经从事it工作15年多&#xff0c;最后一次工作是2017年&#xff0c;创业&#xff0c;互联网教育方向&#xff0c;2020年失败关闭公司。 创业失败后&#xff0c;在家沉淀了几个月&#xff0c;然后决定再次找工作。…

如何在UnrealEngine虚幻引擎中进行版本管理

项目团队中的分工协作必不可少&#xff0c;在UE项目中进行版本控制非常必要。UE支持使用Perforce和SVN进行版本管理&#xff0c;此处选用自己比较熟悉的SVN。 1.使用SVN进行源码管理 通过编辑器偏好设置窗口&#xff08;编辑&#xff08;Edit&#xff09;> 编辑器偏好设置&…

9. Spring注解开发

1. 注解开发定义Bean对象 目的&#xff1a;xml配置Bean对象有些繁琐&#xff0c;使用注解简化Bean对象的定义 1.1 在applicationContext.xml中开启Spring注解包扫描 <?xml version"1.0" encoding"UTF-8"?> <beans xmlns"http://www.spr…