风控标签体系的使用与介绍

news2024/11/18 1:36:52

随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值。于是,用户画像的概念也就应运而生。

在推荐系统中,
【推荐系统内容,详情可以关注番茄风控往期课程:信贷风控也要学|智能推荐系统的应用】
做好了标签可以实现精准化营销和推送;在信贷行业,有了标签体系不仅可以帮我们实现客户分群,实现风险把控。业内,我们除了模型也一直在想方设法构建客群的标签体系,关于风险相关的标签情况,之前在风控风控往期的内容中也有跟大家介绍,今天我们再来谈谈相关内容。

一.系统功能架构
首先一个完整的标签体系,用户画像及应用项目包括底层数据源采集和存储、画像标签模型构建、数据模型应用三个层级,系统功能架构如下:
在这里插入图片描述

二.模型架构
画像标签模型分析主要分原始数据统计分析、统计标签建模分析、模型标签预测分析三块,具体如下:
在这里插入图片描述

三.用户画像模型
用户画像模型是结合用户基本属性分析,对互联网行为特征进行描述,包括用户登录、搜索、关注、消费等各方面数据,在信贷风控的全流程中,我们就会除了会判断客户的档案信息也更会参考他的征信情况、还款行为、催收数据,以标签方式展示每个用户的个性化特征,画像是系统分析结果的总结,是系统数据挖掘的起始。目前在画像中所用到的一些分析方法如下:
聚类分析
聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的.聚类结果要求组内对象相似性较高,组间对象相似性较低.在用户研究中,很多问题可以借助聚类分析来解决,比如用户活跃度行为聚类、用户消费情况聚类等.
分类算法
分类是按照某种标准给用户贴标签,再根据标签来区分归类,分类是事先定义好类别,类别数不变.根据用户群的文化观念,订单消费、行为习惯等不同细分新的类别,企业根据用户的不同制定品牌推广战略和营销策略,将资源针对目标用户集中使用.
时间序列分析
时间序列分析是一种动态的数据统计方法.该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题.比如用户的周期性行为分析、因子回归分析建模等.
RFM模型
RFM模型较为动态地显示一个用户的全部轮廓,R表示用户购买的时间有多远,F表示用户在时间内购买的次数,M表示用户在时间内购买的金额,加权得到RFM得分.
推荐系统算法
利用用户的一些行为,通过一些算法(协同过滤、LFM、打分模型、关联分析等),推测出用户可能喜欢的东西.推荐讲究准确性,提高用户-内容(订单、知识等)等组合的匹配度,提升服务质量.
关联分析
关联分析就是在关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构,挖掘潜在的行为和消费关联特征.

四.贷款属性标签
因为篇幅有限,本文稍微列出跟风险标签稍微相关的贷款情况的标签内容,另外还有更详细的档案情况跟贷后表现数据标签,请参考知识星球上的内容:
在这里插入图片描述

还有关于标签的相关的图表、热力图、词云就不做过多展示:
在这里插入图片描述
在这里插入图片描述

以上说的各种高大上的标签体系的内容,相信各位童鞋多多少少都会遇到,但并不一定适合各位金融机构,特别是因为个人隐私保护,许多方面的标签内容早已获取不到。特别是在金融科技助贷等场景中,许多助贷的业务中标签的确实是常见的现象。
这种情况下,我们常常借助三方数据的标签标识,来获取相关的数据从而协助我们建模。

五.常见的一些三方数据返回的标签数据
比如在助贷类公司A与资金类公司B在合作过程中,A公司常常需要对B公司要求返回的用户群体进行风控筛选,这里的风险筛选工作其中一个工作便是建模。但B公司常规上,不会返回相关的标签给到A。于是A公司如何在缺乏数据标签情况下建模呢?
常常用的一个方法就是调取第三方数据厂商,希望返回类催收数据作为Y标签。什么是类催收数据,就是跟催收相似的数据。比如催收次数、催收时长、催收等,具体的类催收数据可以参考:
在这里插入图片描述

使用类催收数据的逻辑是,客户是因为表现不好才会进入到贷后催收,所以才有跟贷后相关的数据。
最后A公司决定使用催收次数作为相关标签进行定义,该数据标签也是很明显的数值。那我们就可以根据具体的业务情况,把这个客户在最近1个月内被催收了10次,把这个客户定义为坏客户。
解决了用什么样的数据去定义标签是一个非常重要的问题,随之,又伴随着另一个问题就是如何怎么选取客户样本?
假设根据B公司的使用情况来分析,B公司一个月调用的数据量在十万+的数量级的用户,因为存在数据成本调用,总不能所有的数据都来调用。常规上,大家想到的是随机抽取的方法,将样本压缩在1万条左右。
因随机抽取是可以将成本大幅降低了,但因为抽取过程中,会将B公司调用样本的过程中,拒绝的客户也抽取到。假设B公司的拒绝量达到90%左右,那也就是说,我们抽取的客户数,有很大一部分是混淆着拒绝客户的。在模型里有个概念:拒绝的坏跟进件后逾期的坏客群是不一样的坏,这得分属两种不同的范畴。
拒绝掉的客群,肯定是黑名单或者某些准入的关系被拒之门外的。所以这部分客群被拒是跟政策或者欺诈类相关的。在风控系统里,最外层的也是拒绝规则。客户准入后,又是因为信用情况烂掉被归为坏的,又属于信用风险的范畴。这是两类不同的风险。
所以在抽取中,我们需要在自己的业务系统跑完通用的规则如黑名单库、准入规则再进行抽取,这样总比随机抽取的客群来的好。后续便是用用这波客群进入贷后再去查询相关的贷后数据。之后便是计算模型验证指标,后续持续滚动模型,再去纠正之前的数据情况不断建立模型,监控模型效果,一直迭代模型直到最优。

以上内容参考:
①第80期课程信贷风控也要学|智能推荐系统的应用
②第49期课程《 策略分析之数据监控与用户标签画像》

~原创文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/30015.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

弘玑Cyclone2022产品发布会:全新上线智能文档处理交互平台——尚书台

近日,在弘玑Cyclone“智无边界,数字未来”发布会上,弘玑Cyclone2022年超级自动化系列产品全新亮相,首席产品官贾岿博士带领产品团队以创新技术对新时代语境下的数字生产力进行了全新解读。 上期为大家介绍了人人可用的数字化工作…

Java工具库Guava的数学运算常用方法示例代码

场景 Java核心工具库Guava介绍以及Optional和Preconditions使用进行非空和数据校验: Java核心工具库Guava介绍以及Optional和Preconditions使用进行非空和数据校验_霸道流氓气质的博客-CSDN博客_guava 校验 为什么使用 Guava Math 1、Guava Math 针对各种不常见…

web网页设计期末课程大作业:美食餐饮文化主题网站设计——中华美德6页面HTML+CSS+JavaScript

🎀 精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

MCE | 表观遗传:YTHDF蛋白调节 m6A-RNA

近期,美国康奈尔大学 Samie R. Jaffrey 研究组在 Cell 上发表了题为 “A Unified Model for the Function of YTHDF Proteins in Regulating m6A-Modified mRNA” 的研究,揭示了 YTHDF 蛋白调节 m6A 修饰的 mRNA 的功能统一模型。与“不同的 m6A 位点结合…

反向传播——机器学习

目录 一、实验内容 二、实验过程 1、算法思想 2、算法原理 3、算法分析 三、源程序代码 四、运行结果及分析 五、实验总结 一、实验内容 掌握线性反向传播的原理;掌握线性反向传播的算法Python实现;熟悉非线性反向传播的原理;掌握非线性…

图的存储方式

一、邻接矩阵 图的邻接矩阵存储方式就是用两个数组来表示图。一个一维数组存储图的顶点信息,另一个二维数组存储图中边的信息。 对于无向图来说,我们可以用1表示两顶点相连,用0表示两顶点不相连。任意顶点的度为邻接矩阵中该节点的行或列的…

pytorch案例代码-2

循环神经网络——基础知识 适合前后有联系的连续数据预测,比如天气预测、股市预测、自然语言等,而这些用DNN、CNN来做计算量就太大或者没法做,h0是先验,也可以前面接上CNNFC后面连上RNN,就可以完成图像到文本的转换&am…

AE VAE 代码和结果记录

Auto Encoder 在MNIST 上记录 直接上代码 import os os.chdir(os.path.dirname(__file__)) import torch import torch.nn as nn import torch.nn.functional as F import torchvision from torchvision import transforms from torchvision.utils import save_image from to…

数据结构-学习-01-线性表之顺序表-初始化、销毁、清理、获取长度、判断为空、获取元素等实现

一、测试环境 名称值cpu12th Gen Intel Core™ i7-12700H操作系统CentOS Linux release 7.9.2009 (Core)内存3G逻辑核数2gcc 版本4.8.5 20150623 二、个人理解 数据结构分为逻辑结构和物理结构(也称为存储结构)。 1、逻辑结构 逻辑结构又可以分为以下…

JS 事件

事件 事件是 JS 和 HTML 交互的桥梁。采用“观察者模式”,使用仅在事件发生时执行的监听器(也叫处理程序)订阅事件 事件流 事件流描述的是页面接收事件的顺序。分为 3 各阶段: 事件捕获:最先触发,可以做…

致敬经典 睛彩再现——AVS产业联盟和中国移动咪咕公司携手推动AVS3视频、音频标准

2022年11月14日,中国移动咪咕公司首发AVS3移动端规模化商用版本咪咕视频6.0.7.00,该版本下设的“致敬经典 睛彩再现”专区、以及“菁彩视听”双Vivid直播视角(Audio Vivid & HDR Vivid),通过国家自主的AVS3、Audio…

回顾复习【矩阵分析】初等因子 和 矩阵的相似 || 由不变因子求初等因子 || 由初等因子和秩求Smith标准形(不变因子)

目录 1. 由不变因子,引出 初等因子的概念2. 【必看】例子:已知 不变因子,求初等因子。3.【必看】 例子:已知 秩和初等因子,求史密斯标准形(不变因子)4. 分块矩阵 初等因子的 求法5. 数字矩阵的相似 与 入-矩阵的等价1. 由不变因子,引出 初等因子的概念 例如,下面两个矩阵…

Kotlin 开发Android app(十):Android控件绑定ViewBinding

上一节中,我们知道了Android的布局,这种把界面和逻辑控制分开,是编程里很好的分离方式,也大大的解耦了界面和逻辑控制,使得编程的逻辑不在和界面挂钩。 有了界面的布局,我们需要把界面和代码部分进行绑定&…

OpenPose训练教程

找遍全网都没有非常完整的OpenPose训练教程 决定自己摸索并且记录下来 openpose作者发布了一份训练代码,下面根据这个来操作 GitHUB地址: openpsoe_train 环境:ubuntu 执行matklab脚本的时候懒得下载新的matlab 就在windows下运行的 感觉没…

品质为先,服务不停,广州流辰信息公司恪守初心,匠心为民!

随着互联网技术的蓬勃发展,越来越多的企业也感受到了日益激烈的竞争,也意识到墨守成规的发展模式必当会让企业停滞不前,只有一步一个脚印,始终跟随市场的脚步创新升级,才有可能在汹涌的市场洪流中站稳脚跟。广州流辰信…

精简 Windows10

下载链接文后评论里找: 旧机福音 极限精简Win10系统Tiny10https://baijiahao.baidu.com/s?id1743901721464184983不想成天折腾操作系统,一直以来都认为跟着微软每月升级就好了。但是现实啪啪的打脸:升级到Windows11 22H2 后, 连…

常见算法设计与分析的简单C++代码实现(排列、二分法搜索、Dijkstra算法、元素换位、单调子序列、硬币问题、运动员最佳匹配问题)

常见算法设计与分析的简单C代码实现(排列、二分法搜索、Dijkstra算法、元素换位、单调子序列、硬币问题、运动员最佳匹配问题)1 一些简单排列问题2 二分法查找3 前后元素换位4 找最长单调递增子序列(O(n2)复杂度)5最小硬币问题一、…

c3p0,DBCP,Druid(德鲁伊)数据库连接池

c3p0,DBCP,Druid(德鲁伊)数据库连接池 每博一文案 佛说:前世 500 次的回眸,才换来今生的一次擦肩而过。 人与人之间的缘分,真的无需强求,并不是所有的感情都能天长地久,…

C#压缩图片

SqlSer数据库设置保存图片字段类型为Image类型 对应保存 方法参数为图片路径&#xff0c;压缩后路径&#xff0c;压缩最大宽度&#xff0c;压缩最大高度 引用类型using System.Data; using System.Drawing; using System.IO; \完整类 /// <summary> /// 按比例缩放&…

七牛qshell 批量上传 mac 本地目录

七牛qshell 批量上传 mac 本地目录下载路径及使用方法(官方)下载到自己指定的文件夹添加环境变量,使qshell在任意地方可以执行添加密钥 生成账户文件下载路径及使用方法(官方) https://developer.qiniu.com/kodo/1302/qshell记录自己部署遇到的问题及操作步骤 下载到自己指定…