实战【金融评分卡】

news2024/11/24 16:12:49

金融评分卡

网站:百融、同盾

1.导入

信贷评分卡是一种用于评估个人或企业申请贷款的工具,就像-个评分表-样。我们可以把它看作是银行或金融机构用来判断某人是否有资格获得贷款的一-种方式。
想象一下,你是一个银行家,有很多人向你申请贷款,比如个人贷款或房屋贷款。你需要决定哪些人更有可能按时还款,哪些人可能会有逾期还款或违约的风险。
那么,信贷评分卡就是一-种帮助你做出这个决策的工具。它通过考虑一系列与借款人相关的因素来给每个人打分。这些因素可以包括年龄、收入、职业、信用记录等等。
首先,我们需要收集大量的数据,比如以往的借款记录、个人信息和其他与还款能力相关的数据。然后,我们会使用统计和分析的方法,找出与还款能力最相关的因素。接下来,我们会为每个因素赋予- -定的权重。 这些权重代表了每个因素对于决定一个人是否有能力按时还款的重要性。例如,一个人的收入可能比年龄更重要,所以收入的权重会更高。
然后,当有新的借款人申请贷款时,我们会根据他们的个人信息和数据,计算他们的得分。这个得分可以告诉我们这个借款人有多大的潜在风险。
最后,我们会设定一个阈值, 比如说,如果得分超过某个特定值,那么我们会认为这个人是有资格获得贷款的。如果得分低于阈值,那么我们可能会拒绝他们的贷款申请,或者要求他们提供更多的担保或保证人。

2.评分卡的类别

●申请评分卡:申请评分卡用于评估借款人在提交贷款申请时的信用风险。当一个人向银行或金融机构申请贷款时,机构需要快速评估其信用状况。申请评分卡基于申请人提供的信息和数据(例如个人资料、收入、就业状况等), 根据历史数据和统计模型,给出一个评分来预测该借款人是否有可能按时还款。这样银行可以更快地作出决策,是否接受或拒绝贷款申请。
●行为评分卡:行为评分卡用于评估借款人或客户在贷款期间的行为表现和还款能力。它基于贷款人的还款历史、逾期记录、使用信用额度的方式等行为数据,以及其他因素,如收入和债务负担等,来预测借款人在未来的行为表现。行为评分卡对于银行或金融机构来说,是监控和管理贷款组合的重要工具,帮助它们识别风险客户并采取相应的措施。
●催收评分卡:催收评分卡是用于评估已逾期贷款客户的催收风险和催收策略的工具。当借款人未能按时偿还贷款时,银行或金融机构需要采取适当的催收措施来追回欠款。催收评分卡基于逾期客户的还款历史、欠款金额、与催收人员的沟通互动等因素,给出一个评分来预测催收的成功概率。这有助于银行制定催收策略,优化资源分配,提高催收效率。

3.评分卡常用模型

**逻辑回归: **
●优点:
简单而直观,易于解释和理解。计算效率高, 适用于大规模数据集。可以得到变量的系数,用于解释变量对目标变量的影响。
●缺点:
假设自变量与因变量之间的关系是线性的,无法捕捉非线性关系。对于变量之间存在多重共线性的情况,系数的解释可能会变得困难。对于特征工程的要求较高,需要对输入特征进行一定的预处理和转换。

决策树:

●优点:
适用于处理分类和回归问题,能够处理离散和连续特征。可以处理非线性关系和交互作用,不需要对数据进行过多的预处理。结果易于解释,可以生成可视化的决策树模型。
●缺点:
决策树容易过拟合,特别是当树的深度较大时。对于数据中的噪声和不规则性较敏感。容易产生复杂的树结构,导致模型的泛化能力下降。

XGBoost:

●优点:
在决策树的基础.上使用了集成学习的方法,提高了模型的准确性和稳定性。能够处理大规模数据集和高维特征。对于特征的选择和权重调整 具有自动化的能力。可以处理非线性关系、交互作用和缺失值。
●缺点:
相对于其他模型,XGBoos在计算方面的复杂性较高,训练时间可能会更长。对于数据质量的要求较高,对于异常值和噪声比较敏感。参数调整和模型调优可能需要一 些经验和领域知识。

4.特征构造

​ 在评分卡模型的开发中,特征构造是极其关键的步骤,其作用是将分散在不同字段中的信息加以组合,从中提炼出有价值的、可用的信息进而进行评分卡模型的开发。
●求和:例如过去-段时间内的每月网购金额的总和

●比例:例如申请贷款的月还款本息与月收入的占比

●频率:例如过去一 -段时间内的境外消费次数

●平均:例如过去一段时间内平均每次信用 卡取现额度

案例:

对PPD. LogInfo. 3_ .1 _Training. Set字段的处理
由于绝大部分观测样本的时间跨度在半年内,所以我们选取半年内的时间切片,考虑以月为单位的时间切片,则可以衍生出30天、60天、90天、120天、 150天、 180天等多种选择。
同时,对于类别型变量,可以考虑构造如下计算逻辑:
●时间切片内的登录的次数

●时间切片内不同的登录方式的个数

●时间切片内不同登录方式的平均个数

5.特征分箱

不需要分箱的变量

对于类别型变量,如果取值个数较少,一般无需分箱

分箱结果的有序性

对于有序型变量(包括数值型和有序离散型,例如学历),分箱要求保证有序性
分箱的平衡性

在较严格的情况下,分箱后的每-箱的占比不能相差太大。- -般要求占比最小的占,占比不低于5%
分箱的单调性

在较严格的情况下,有序型变量分箱后每箱的坏样本率要求与箱呈单调关系。例如,将收入分为<5K, 5K~ 10K, 10k~20k, >20k后,坏样本率分别是20%,15%, 10%, 5%。或者,将学历分为{低于高中},{高中,大专},{本科,硕士}, {博士}后,坏样本率分别是15%,10%, 5%,1% 。
分箱的个数

通常要求分箱后,箱的个数不能太多,- -般在7或5个以内
分箱的优点

●稳定:分箱后,变量原始值在一定范围内的波动不会影响到评分结果

●缺失值处理:缺失值可以作为一个单独的箱,或者与其他值进行合并作为一个箱

●异常值处理:异常值可以和其他值合并作为-一个箱

●无需归一化:从数值型变为类别型,没有尺度的差异

分箱的缺点

●有一定的信息丢失:数值型变量在分箱后,变为取值有限的几个箱

●需要编码:分箱后的变量是类别型,不能直接带入逻辑回归模型中,需要进行一次数值编码

分箱的调整

每箱的坏样本率单调且需要同时包含好坏变量

6.WOE编码

编码操作是一种用数值代替非数值的操作,目的是为了让模型能够对其进行数学运算。例如,可以用3组0~255之间的整数来对颜色进行编码。在评分卡模型开发中,完成变量的分箱后所有的变量都变成了组别。此时需要对其进行编码才能下一步的建模。 评分卡模型里常用WOE (Weight of Evidence)的形式进行分箱后的编码。其计算公式如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ooGBcVCz-1686020274145)(C:\Users\Administrator\Desktop\b.png)]

●优点
提高模型的性能:以每一箱中的相对全体的log odds的超出作为编码依据,能够提高模型的预测精度;

统一变量的尺度:经验上来看,WOE编码后的取值范围一般介意4与4之间;

分层抽样中的WOE不变性:如果建模需要对好坏样本进行分层抽样,则抽样后计算的WOE与未抽样计算的WOE是一致的;
●缺点
要求每箱中同时包含好坏样本:已在之前有过说明;

对多类别标签无效:如果目标变量取值个数超过2个,分箱后的WOE是无法计算的;

7.IV值

在评分卡模型中,衡量变量重要性的工作是-项必要的工作。在特征工程的初期我们往往能够衍生出数量较多的变量,但是并不能保证这些变量对于模型开发来说都很重要。通过衡量变量重要性,能够让我们从中挑选出相对更加重要的变量,为后续的分析提供降维的能力。
此处我们通过计算特征信息值(Information Value)来衡量其重要性。其计算公式如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AzHhOfXc-1686020274146)(C:\Users\Administrator\Desktop\c.png)]

单变量分析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pp8ylMh3-1686020274147)(C:\Users\Administrator\Desktop\d.png)]

多变量分析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lpcYGxn8-1686020274148)(C:\Users\Administrator\Desktop\e.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-68UBIVOG-1686020274149)(C:\Users\Administrator\Desktop\d1.png)]

8.逻辑斯蒂回归建模

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SHLvQ0je-1686020274151)(C:\Users\Administrator\Desktop\f.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uD1IzX8p-1686020274152)(C:\Users\Administrator\Desktop\f1.png)]

处理方案:重新做特征选择

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iB9DDQte-1686020274153)(C:\Users\Administrator\Desktop\g.png)]

9.尺度化

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Vuha4Zyh-1686020274154)(C:\Users\Administrator\Desktop\h.png)]

10.模型评估

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cd9Xh8Im-1686020274155)(C:\Users\Administrator\Desktop\j.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QPD1g165-1686020274156)(C:\Users\Administrator\Desktop\j1.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IQOS11gE-1686020274157)(C:\Users\Administrator\Desktop\k.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d8klexpf-1686020274159)(C:\Users\Administrator\Desktop\k1.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mX5ZDwJR-1686020274160)(C:\Users\Administrator\Desktop\k2.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fV6pQ8HJ-1686020274161)(C:\Users\Administrator\Desktop\k3.png)]
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/614851.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

cas单点登录-服务端部署

一.需求描述 公司开发系统越来越多&#xff0c;每个系统都有自己的登录认证流程&#xff0c;给用户很繁琐的体验&#xff0c;统一认证单点登录迫在眉睫 二.流程图 三.本地运行cas服务端 1.拉取cas服务端代码&#xff0c;切换到对应分支&#xff08;我使用的是6.4.x&#xff…

proxmox7.4 安装后配置

关于proxmox7安装和配置的博文&#xff0c;倒是不少。可惜鱼龙混杂&#xff0c;踩了不少坑&#xff0c;如今实践成功后&#xff0c;做一分享。 proxmox7.4安装(与安装linux系统类似) 1.去官网https://proxmox.com/en/downloads 下载安装镜像&#xff0c;注意&#xff1a; 下…

iTOP-3588开发板Android12源码定制开发uboot开发

uboot 开发-Uboot 源码是 v2017.09 版本。目前在该平台上已经支持 RK 所有主流在售芯片。支持 的功能主要有:  支持 RK Android 固件启动;  支持 Android AOSP 固件启动;  支持 Linux Distro 固件启动;  支持 Rockchip miniloader 和 SPL/TPL 两种 Pre-loader 引导…

对比才知差距!海尔“精华洗”用实验告诉用户

《怪诞关系学》一书中讲到&#xff0c;人生来会与他人做比较&#xff0c;对比是天性&#xff0c;竞争是必然。用高深点的话讲&#xff0c;人是通过对比身边的事物和同类来定位自身的&#xff0c;只有对比才知道差距有多大。“仰观宇宙之大&#xff0c;俯察品类之盛”&#xff0…

Python如何批量合并70个doc和docx文件

目录 一、问题的提出 二、算法分析 三、代码展示 四、注意事项 有一位朋友发来70多个数名命名的doc和docx文件&#xff0c;问我有没有vba代码&#xff0c;可以把这些文件按照数字大小的顺序合并。我试着用了chatgpt&#xff0c;搞了一串vba代码行不通&#xff0c;于时我就找…

【PyQt5】(01)PyQt的详细介绍

文章目录 前言一、PyQt的前世今生1.1 PyQt6、PyQt5和PyQt41.2 商业版和开源版1.3 支持的操作系统 二、 PyQt的优点三、PyQt的应用场景总结 前言 PyQt是使用Python语言编写的QT库的界面工具包。QT是一个跨平台的C应用程序开发框架&#xff0c;可以用于创建高性能、高可靠性、图形…

高频面试八股文用法篇(六) 说说反射及其作用

目录 什么是反射&#xff1f; 反射的作用 反射的优缺点 反射的用途 什么是反射&#xff1f; 动态语言。 当程序运行时&#xff0c;允许改变程序结构或变量类型&#xff0c;这种语言称为动态语言。Java 并不是动态语言&#xff0c;但是它却又一个非常突出的动态相关的机制&am…

Permission denied, please try again.

如果你是容器或者二进制安装启动的gitlab&#xff0c;在克隆代码一直有这样的问题 正克隆到 h5... git192.168.0s password: Permission denied, please try again. 服务ipgit 192.168.40.15 gitlab192.168.40.17 1、 docker run -d --name gitlab -p 80:80 -p 224:22 -p 4…

基于springboot的在线学习平台

源码获取&#xff0c;V&#xff1a;qq2056908377 采用技术 项目整体采用传统的B/S架构和MVC设计模式&#xff0c;开发语言选用JavaHTMLJavascript&#xff0c;技术上采用SpringBoot、Mybatis等开发框架&#xff0c;数据库采用MySQL 5.7。 功能介绍 平台分为用户端和管理两个系…

1.8 基于Java配置方式使用Spring MVC

一、基于Java配置方式使用Spring MVC 实现步骤 1、创建Maven项目 Maven项目 - SpringMvcDemo02 2、添加相关依赖 在pom.xml文件里添加相关依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/…

chatgpt赋能python:如何用Python创建一个成功的项目

如何用Python创建一个成功的项目 无论是初学者还是有经验的开发者&#xff0c;Python语言的丰富生态系统和易于使用的语法使得它在项目开发领域中成为了一种非常流行的选择。但是&#xff0c;要构建一个好的Python项目需要很多工作&#xff0c;需要一些经验和技巧。在这篇文章…

LeetCode_二叉树_BFS_中等_117.填充每个节点的下一个右侧节点指针 II

目录 1.题目2.思路3.代码实现&#xff08;Java&#xff09; 1.题目 给定一个二叉树&#xff1a; struct Node {int val;Node *left;Node *right;Node *next; }填充它的每个 next 指针&#xff0c;让这个指针指向其下一个右侧节点。如果找不到下一个右侧节点&#xff0c;则将 …

数据共享传输:台式机和笔记本同步文件!

为什么要在台式机和笔记本同步文件&#xff1f; “我想在台式机和笔记本同步文件。因为我工作时使用笔记本&#xff0c;在家里使用安装了Windows 10系统的台式机&#xff0c;我想要在笔记本和台式机之间同步应用程序、游戏、文档等。有没有一种可以在台式机和笔记本同步文件的…

11 【组件通信】

1.props 适用于的场景:父子组件通信 注意事项: 如果父组件给子组件传递数据(函数):本质其实是子组件给父组件传递数据 如果父组件给子组件传递数据(非函数):本质就是父组件给子组件传递数据 书写方式:3种 [‘todos’],{type:Array},{type:Array,default:[]} 特殊情况&am…

为何要将行驶证转为Excel?在线怎么操作?需要注意些什么?

一、为何要将行驶证转为excel表格&#xff1f;有何好处&#xff1f; 将行驶证转为Excel一般是为了方便信息的整理和管理。将行驶证上的信息录入Excel表格中&#xff0c;可以实现快速搜索、排序和筛选等功能&#xff0c;避免了手动整理信息的繁琐和容易出错的问题。此外&#xf…

ChatGPT 时代,程序员的生存之道 | 人工智能 AI

ChatGPT 近期炙手可热&#xff0c;仿佛没有什么问题是它不能解决的。出于对 ChatGPT 的好奇&#xff0c;我们决定探索下它对于前端开发人员来讲&#xff0c;是作为辅助工具多一些&#xff0c;还是主力工具更多一些&#xff1f; 2D 能力测试 我们就挑选一个著名的递归回溯问题—…

MySQL的知识点整理(学习笔记)

目录 一、认识数据库 1. 什么是数据库 2. 数据库类型 3. 常见的数据库管理系统 4. MySQL介绍 5. MySQL的安装&管理工具的安装 6. SQL概述 7. 在DOS系统中操作MySQL 8. MySql常用命令 二、操作数据库 1、使用navicat创建数据库 2、备份和还原数据库 3、MySQL数据…

医疗文本智能标注工具接连落地,景联文科技助力“GPT+健康医疗”稳步前行

随着医疗技术的飞速发展和普及&#xff0c;医疗数据量日益庞大&#xff0c;医疗数据的处理成为了一个极为重要的问题。医疗数据中包含着众多的病历记录、化验报告、影像资料等&#xff0c;这些数据需要专业人员运用专业的知识进行处理。目前&#xff0c;很多医院和相关研究机构…

懒人必备Jetpack MVVM框架

目录 效果图 项目依赖 使用介绍 项目使用的三方库及其简单示例和资料 网络请求相关使用介绍 谷歌Jetpack框架使用介绍 常见问题 github地址 Android Jetpack MVVM框架开发&#xff0c;基于AndroidX开发&#xff0c;傻瓜式使用&#xff0c;适用于所有项目 谷歌 Android…

mathtype7中文版下载安装后如何关联word

随着网络时代的发展&#xff0c;许多数据都需要上传网络。无论是否是数学专业的师生&#xff0c;在平时的学习中常需要输入数学公式。可数学公式中文字部分少&#xff0c;公式中常包含许多特殊符号&#xff0c;虽然通过输入法可以输入某些特殊公式符号&#xff0c;但不完美&…