金融信贷风控特征计算详解

news2024/11/18 9:49:49

特征的含义?

特征可以说是风控系统中的最小单元,是风控工具的重要组成部分,我们也可以理解成变量。不过叫什么问题不大,团队内有相同的共识就行。

风控特征是我们做数字化线上风控中的重要组成部分,几乎可以说没有风控特征我们将无法制作模型,无法指定策略,无法指定预警规则,无法测算额度,也就是说,风控特征是我们进行一切线上化风控的前提。

那么特征有哪些呢?
在这里插入图片描述

我们来稍微举几个例子,年龄、性别、年收入这些都属于特征,而这些特征我们需要给予他们对应的类型。从变量分类的角度来分类,可以有int、long、double、string、boolean等类型。但我是设计成了数值型(普通数值型/汇总数值型)、字符串型和枚举型这三种,做了一层归集和删减。

但是,无论采取哪种分类方式,后续的设计能够闭环即可。

To C 信贷业务风控特征数据源

对于银行业来说,根据个人信贷用途的不同,可以将 To C信贷业务分为个人购房贷款、汽车贷款、留学贷款、助学贷款、个人消费贷款、个人经营性贷款等。我们这里指的 To C 业务主要是指个人消费贷款及以个人为授信主体的个人经营性贷款,这其中可以使用到主流风控特征数据源包含以下几个维度:

数据源说明
人行个人征信中国人民银行包括报告头、个人基本信息、信息概要、信贷交易信息明细、非信贷交易信息明细、公共信息明细、其他标注及声明信息、查询记录
个人征信百行征信、朴道征信信用明细信息、授信明细信息、查询记录、特别关注名单等
多头百融、同盾多头借贷信息、借贷意向信息、借贷行为信息、特殊名单等
司法汇法、法海、中数司法详情、严重违法、执行公开信息、失信老赖名单等
反欺诈腾讯腾讯反欺诈分
SDK极光APP安装卸载、使用情况等
银行流水银行内部数据收入金额、支出金额、账户余额变动、现金交易金额、全部交易金额、工资奖金金额、投资理财交易、转账类交易信息、贷款还款信息

To B 信贷业务风控特征数据源

To B 信贷业务由于企业资金需求相对大于个人,一直以来都是银行业信贷类业务收入的大头,但授信金额大也伴随的较高风险,因此需要更为专业的风控手段来抵御风险事件的发生。对于线上化产品来说,线上化自动审批并不适用于所有 To B 信贷业务。

对于小微信贷业务来说,其风险很大一部分的来源都是法人或实控人,因此与个人信贷业务更为相近,比较适用线上化自动审批来进行快速决策,这样可以大大缩短客户从进入银行到最终拿到贷款的时间。

但对于大额公司信贷来说,由于大公司的个体差异的比较大,风险事件也更为复杂,因此很难通过数据来归纳并直观判断客户的风险水平。

针对 To B 信贷业务,市面上比较主流的风控特征数据源涵盖以下几个维度:

数据源说明
人行企业征信中国人民银行实际控制人信息、信贷交易提示信息、非信贷交易及公共信息、未结清借贷交易汇总信息、已结清借贷交易汇总信息、负债历史汇总信息、还款表现信息
工商信息企查查、天眼查企业经营异常、企业历史变更、企业对外投资信息等
税务数据税务局企业基础信息、企业申报信息、增值税申报信息、欠税信息等
发票数据百旺发票票面信息、开票频次、开票状态等
水电费公共信息企业水电煤气费等公共信息
银行流水银行内部数据收入金额、支出金额、账户余额变动、现金交易金额、全部交易金额、工资奖金金额、投资理财交易、转账类交易信息、贷款还款信息

规则管理

了解规则是由特征、逻辑运算符、比较运算符、阈值和触发结果组成,以及规则其实是在处理条件语句的本质之后,那么前端设计就万变不离其宗了
在这里插入图片描述
上图就是规则管理的部分页面内容,其中比较重要的功能是规则测试。规则测试主要面向对象是业务和测试人员。

  • 业务人员:能够就配置的规则,立马知道规则执行是否有问题。
  • 测试人员:上文说过特征来源可能是自有数据,也有可能是供应商的数据。规则的测试分为取值正确性和规则逻辑性验证。规则测试主要解决规则逻辑性验证,确定好这部分正确后,就可着重对取值进行验证,在规则的验证过程中有的放矢

特征计算平台 Feature Store 简介

在大型金融机构中,由于组织架构较为复杂,不同条线之间往往存在重复造“轮子”的情况,建模人员加工的风险特征仅仅在某个产品上进行使用,不同机构条线间缺乏对风控特征的共享,因此,需要一个统一的特征管理平台,来规范特征的衍生、存储、使用及更新迭代管理,特征平台 Feature Store也因此应运而生。

对于特征平台的能力与边界,各家定义略微不同,《Feature Stores - A Hierarchy of Needs》,文中将特征平台的能力分为以下几个层次:

  • 特征管理:特征抽取、处理、存储、元数据管理,以便于特征溯源、分享和复用;
  • 特征消费服务:为线上部署的模型,提供高吞吐、低延迟的特征获取能力;
  • 离线/在线特征一致性保证:避免 Training - Serving Skew问题导致模型效果劣化;
  • 便利:易用、简单的交互和API;
  • 自治:特征回填、数据质量监控、联动模型效果评估等。

总结

本期重点介绍一下信贷风控特征市面上的主流数据源和基于这些数据源所构建的特征平台 Feature Store。

参考来源:https://zhuanlan.zhihu.com/p/554201480、https://news.sohu.com/a/718419262_114819

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1438021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[C++]类和对象(下)

一:再谈构造函数 1.1 构造函数体赋值 在创建对象时,编译器通过调用构造函数,给对象中各个成员变量一个合适的初始值,虽然构造函数调用之后,对象中已经有了一个初始值,但是不能将其称为对对象中成员变量的初始化 构造函数体中的语…

Rust开发WASM,浏览器运行WASM

首先需要安装wasm-pack cargo install wasm-pack 使用cargo创建工程 cargo new --lib mywasm 编辑Cargo.toml文件,修改lib的类型为cdylib,并且添加依赖wasm-bindgen [package] name "mywasm" version "0.1.0" edition "…

精酿啤酒:使用全麦芽酿造的优点与挑战

全麦芽酿造是指使用全部麦芽而非仅使用部分麦芽进行啤酒酿造的过程。近年来,全麦芽酿造在啤酒行业中逐渐受到关注。对于Fendi Club啤酒来说,使用全麦芽酿造也带来了一些优点和挑战。 使用全麦芽酿造的优点首先体现在啤酒的口感和风味上。全麦芽含有更多的…

正点原子--STM32通用定时器学习笔记(2)

1. 通用定时器输入捕获部分框图介绍 捕获/比较通道的输入部分(通道1) 输入通道映射CC1S[1:0]→采样频率CKD[1:0]→滤波方式IC1F[3:0]→边沿检测方式CC1P→捕获分频ICPS[1:0]→使能捕获CC1E 输入部分对相应的TIx输入信号采样,并产生一个滤波后…

论文阅读-Transformer-based language models for software vulnerability detection

「分享了一批文献给你,请您通过浏览器打开 https://www.ivysci.com/web/share/biblios/D2xqz52xQJ4RKceFXAFaDU/ 您还可以一键导入到 ivySCI 文献管理软件阅读,并在论文中引用 」 本文主旨:本文提出了一个系统的框架来利用基于Transformer的语…

【教学类-47-01】UIBOT+IDM下载儿童古诗+修改文件名

背景需求: 去年12月,我去了其他幼儿园参观,这是一个传统文化德育教育特色的学校,在“古典集市”展示活动中,小班中班大班孩子共同现场念诵《元日》《静夜思》包含了演唱版本和儿歌念诵版本。 我马上也要当班主任了&a…

【OpenVINO™】在 MacOS 上使用 OpenVINO™ C# API 部署 Yolov5 (下篇)

在 MacOS 上使用 OpenVINO™ C# API 部署 Yolov5 (下篇) 项目介绍 YOLOv5 是革命性的 "单阶段"对象检测模型的第五次迭代,旨在实时提供高速、高精度的结果,是世界上最受欢迎的视觉人工智能模型,代表了Ult…

单片机学习笔记---串口通信(1)

目录 通信的基本概念 通信的方式 1.按照数据传送的方式,可分为串行通信和并行通信。 1.1串行通信 1.2并行通信 2.按照通信的数据同步方式,又可以分为异步通信和同步通信。 2.1 异步通信 2.2同步通信 3.按照数据的传输方向,又可以分为…

【JAVA WEB】Web标签

目录 注释标签 标题标签 h1-h6 段落标签 换行标签 格式化标签 加粗:strong 标签和 b 标签 倾斜:em 标签和 i 标签 删除线: del 标签 和 s 标签 下划线:ins 标签 和 u 标签 图片标签:img 单标签 src属性&#…

零基础学Python之网络编程

1.什么是socket 官方定义: 套接字(socket)是一个抽象层,应用程序可以通过它发送或接收数据,可对其进行像对文件一样的打开、读写和关闭等操作。套接字允许应用程序将I/O插入到网络中,并与网络中的其他应用…

外汇天眼:台中女老板扮演诈团「假币商」,诓134人投资吸金1.8亿

自从比特币问世以来,加密货币为金融领域带来极大的转变,而且随着区块链与各种技术发展,其影响力逐渐扩大,受到愈来愈多投资人重视,相关的金融商品与合约也愈来愈多元,更带起一波投资热潮。 然而&#xff0…

【开源】SpringBoot框架开发超市账单管理系统 JAVA+Vue+SpringBoot+MySQL

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、系统设计3.1 总体设计3.2 前端设计3.3 后端设计在这里插入图片描述 四、系统展示五、核心代码5.1 查询供应商5.2 查询商品5.3 新增超市账单5.4 编辑超市账单5.5 查询超市账单 六、免责说明 一、摘要 1.1 项目介绍 基于…

thinkadmin的form.html表单例子

<style>textarea {width: 100%;height: 200px;padding: 10px;border: 1px solid #ccc

基于 GPU 渲染的高性能空间包围计算

空间包围检测在计算机图形学、虚拟仿真、工业生产等有着广泛的应用。 现代煤矿开采过程中&#xff0c;安全一直是最大的挑战之一。地质空间中存在诸多如瓦斯积聚、地质构造异常、水文条件不利等隐蔽致灾因素&#xff0c;一旦被触发&#xff0c;可能引发灾难性的后果。因此在安…

LeetCode 200:岛屿数量(图的简化版之网格结构上的BFS、DFS)

图的BFS和DFS 首先让我们回顾一下图的BFS和DFS遍历。可以看到这种BFS和DFS板子适用于图形状&#xff0c;或者说结构已经确定&#xff0c;即我们遍历的时候只需要从根节点从上往下遍历即可&#xff0c;不用考虑这个节点有几个叶子节点&#xff0c;是否会遍历到空节点等边界情况…

如果品牌刚刚开始,切入私域社群团购,快团团是最好的选择

如果品牌刚刚开始&#xff0c;切入私域社群团购&#xff0c;快团团是最好的选择&#xff0c;借力新渠道社群团购&#xff0c;快团团&#xff0c;成就你的新品牌&#xff0c; 社群团购平台本身就有大量的信任你平台的流量&#xff0c;这个流量基数是巨大的。 你要知道的是&…

【DDD】学习笔记-服务行为模型

如果将服务视为一种行为&#xff0c;就必然需要考虑客户端与服务之间的协作。服务行为的调用者可以认为是服务消费者&#xff08;Service Consumer&#xff09;&#xff0c;提供服务行为的对象则是服务提供者&#xff08;Service Provider&#xff09;。为了服务消费者能够发现…

C++ STL: vector使用及源码剖析

vector使用 vector定义 语句 作用 vector<int> a(n); 指定容器大小为n vector<int> a(n, x); 指定容器大小为n&#xff0c;并初始化所有元素为x vector<vector<int>> a(m, vector<int>(n)); m行n列的二维数组&#xff0c;可以直接…

游戏开发-会飞的小鸟(已完结,附源码)

游戏开发-会飞的小鸟&#xff08;已完结&#xff0c;附源码&#xff09; 你将学到的课程链接详细介绍 你将学到的 掌握Java编程的基本技能开发出自己的“会飞的小鸟”游戏对面向对象编程有深刻的理解学会运用常见算法和数据结构解决问题能够独立调试和优化自己的代码 课程链接…

(2)(2.14) SPL Satellite Telemetry

文章目录 前言 1 本地 Wi-Fi&#xff08;费用&#xff1a;30 美元以上&#xff0c;范围&#xff1a;室内&#xff09; 2 蜂窝电话&#xff08;费用&#xff1a;100 美元以上&#xff0c;范围&#xff1a;蜂窝电话覆盖区域&#xff09; 3 手机卫星&#xff08;费用&#xff…