金融信用评分卡建模项目1:工具雏形

news2024/11/25 6:45:02

        最近我一直忙着开发一个信用评分卡建模工具,所以没有时间更新示例或动态。今天,我很高兴地跟大家分享,这个工具的基本框架已经完成了,并且探索性的将大语言模型(AI)整合了进去。目前ai在工具中扮演智能助手,完成用户解答功能,帮助用户更好地理解和使用信用评分卡建模信息。整个过程中遇到了不少挑战。

        下面向大家介绍下工具的主要板块和功能,希望得到大家的宝贵指导意见。

        1、数据探索

        主要实现加载源数据和可视化的功能,开发采用的样本数据是开源的德国信用数据集:GermanCredit。

cc1799b1e813462ea434cc860696f92b.png

        项目采用嵌入pygwalker的方式对源数据进行可视化,用户可以自行组合分析数据内容。pygwalker示例如下:

 引用:https://zhuanlan.zhihu.com/p/682465515

d635d496a9fd4788827df0ab9203cd75.gif

        2、特征分析

        对源数据的特征进行分析,主要采用以下算法来实现

  •    箱线图:分析异常样本
  •   卡方检验(Chi-Squared Test):适用于分类任务和离散特征
  •   t-检验(t-test):适用于分类任务和连续特征
  •   方差分析(ANOVA):适用于多类别分类任务和连续特征
  •   Pearson 相关系数:适用于连续特征和标签
  • ......

aca25865aec14a388179a2346d37be6e.png

 

        3、抽样

        对源数据进行抽样,目前采用的是分层抽样方式,根据目标变量,进行分层抽样。

0df88da2757840b2aab46de5e30138e8.png

        4、WOE转换

        金融信用评分卡要求比较稳健及可解释性强,所以woe转换是必不可少步骤。

        ‌‌WOE(Weight of Evidence)转换是一种将分类变量的每个类别映射到一个连续的数值的方法,这个数值反映了该类别相对于参考类别(通常是目标事件发生率最低的类别)对目标事件发生概率的影响强度‌。WOE转换的公式通常是对数变换,其值可以为正、负或零,代表了该特征值对“好客户”和“坏客户”的影响程度。

WOE转换在数据分析和建模中有多种用途和好处:

  • ‌处理异常值‌:WOE转换可以处理数据中的异常值,通过将极端值分组到单独的类别中,避免对模型产生负面影响。
  • ‌处理缺失值‌:缺失值可以单独分组,从而不影响模型的训练。
  • ‌处理分类变量‌:WOE转换帮助处理分类变量,无需虚拟变量,可以直接用于逻辑回归等模型中。
  • ‌提升模型效果‌:通过标准化特征值,WOE转换可以提高模型的预测效果和可解释性。

71b686e175084d01a489dbfddfefb10f.png

        5、模型评估

        模型评估板块前面是模型训练,目前该板块没有提前输出信息,所以没有展示。模型评估主要是常用的一些模型评估指标,目前想到的是:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、ROC-AUC/Gini、F1 Score、KS、以及Lift图、AUC-ROC等。

17f13c8c54f546ea82a97281eb79a5cc.png

        6、评分卡生成

        这是评分卡建模最后一步,生成评分卡,及评分的PSI值评估,目前看模型生成的评分卡PSI是接近正太分布,而且PSI=0.0097,这个数值非常好的。

454e86134d834601a529516681356e32.png

 

          7、大语言模型ai助手

        这是此项目唯一的亮点和创新性,将llm融入评分卡建模的过程,目前市场上是不多见的。虽然作用和价值不知能能有多少,但是这是一个让我学习,不断进步的过程。

        急着分享,目前ai只实现了读取样本数据的特征列表和目标值,以下的与与助手聊天的过程。

f990b9d3d0704272b3c52a7123b6d60d.png

907d8942f6ff47f5bf54bd0c8bd0bbcc.jpeg

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2212212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣面试150 从中序与后序遍历序列构造二叉树 递归

Problem: 106. 从中序与后序遍历序列构造二叉树 👨‍🏫 参考题解 🍻 Code 1 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNo…

前端的AI工具:ChatGPT Canvas与Claude Artifacts对比 -仅仅是OpenAI一个迟来的追赶吗?- 贺星舰五飞试验成功

如果你对OpenAI的ChatGPT Canvas和Anthropic的Claude Artifacts有所耳闻,可能会想知道这两个工具有何不同,以及哪个能让你的工作流程更加顺畅。这两个工具旨在提升生产力,但侧重点各异——编码、写作、创意和实时反馈。 本文将深入探讨ChatG…

STM32传感器模块编程实践(四)舵机+MPU6050陀螺仪模块融合云台模型

文章目录 一.概要二.实验模型原理1.硬件连接原理框图2.控制原理 三.实验模型控制流程四.云台模型程序五.实验效果视频六.小结 一.概要 云台主要用来固定摄像头。准确地说,云台是一种可以多角度调节的支撑设备,类似于人的脖子可以支撑着脑袋,…

C++STL--------vector

文章目录 一、vector常用接口介绍1、initializer_list2、接口有很多类似3、typeid(类型).name()4、find() 函数5、内置类型构造 二、vector()常用接口模拟实现 截图来源网站:https://legacy.cplusplus.com/reference/vector/vector/ 一、vector常用接口介绍 是一个…

架构设计笔记-8-系统质量属性与架构评估

目录 知识要点 案例分析 1.质量属性 2.非功能性需求 3.质量属性效用树,风险点/敏感点/权衡点,设计策略 4.管道过滤器/仓库风格,质量属性 5.质量属性效用树 6.质量属性 7.质量属性效用树 8.质量属性效用树,风险点/敏感点…

架构师备考-背诵精华(架构开发方法)

软件架构风格 类型 子类型 说明 数据流风格 批处理 每个处理步骤是一个单独的程序,每一步必须在前一步结束后才能开始,而且数据必须是完整的,以整体的方式传递。 管道过滤器 把系统分解为几个序贯的处理步骤,这些步骤之间…

目标检测系统【环境详细配置过程】(CPU版本)

(如果你使用的是笔记本电脑,没有比较好的GPU,可以配置CPU运行环境) 链接:上百种【基于YOLOv8/v10/v11的目标检测系统】目录(pythonpyside6界面系统源码可训练的数据集也完成的训练模型) 1.安装…

leetcode热题100.编辑距离

题目 72. 编辑距离 - 力扣(LeetCode) 给你两个单词 word1 和 word2, 请返回将 word1 转换成 word2 所使用的最少操作数 。 你可以对一个单词进行如下三种操作: 插入一个字符删除一个字符替换一个字符 示例 1: 输…

Spring Web MVC快速入门:掌握Java Web开发基础

White graces:个人主页 🙉专栏推荐:Java入门知识🙉 🐹今日诗词:桃李春风一杯酒,江湖夜雨十年灯🐹 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主🙏 ⛳️点赞 ☀️收藏⭐️关注&#x1f4…

基于Arduino的红外遥控智能小车实现方法

一、简介 使用红外遥控器实现智能小车前进、后退、左转、右转、停止运动五种动作。 二、控制方法 使用红外遥控器遥控智能小车运行之前,需要使用红外线接收电路来读取红外线遥控器的按键代码,将获取的按键代码定义为控制智能小车前进、后退、左转、右…

Web Socket 使用详解

在信息爆炸的时代,用户对网页的期待早已超越了静态内容的展示。实时聊天、股票报价、协同编辑等功能的实现,都离不开服务器与客户端之间持续、高效的数据交互。传统的HTTP请求-响应模型难以满足这种需求,而WebSocket的出现,为构建…

个人健康系统|个人健康数据管理系统|基于小程序+java的个人健康数据管理系统设计与实现(源码+数据库+文档)

个人健康数据管理系统 目录 基于小程序java的个人健康数据管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂码农|毕设布道师…

C语言刷题 LeetCode 删除单链表的重复节点 双指针法

题目要求 链表结构:题目中提到的是未排序的链表,链表是由一系列节点组成的,每个节点包含一个值(数据)和一个指向下一个节点的指针。去重:我们需要遍历链表,删除所有重复的节点,只保…

开源新生活,社区齐乐活:COSCon'24 社区合作和开源集市招募中,诚邀广大社区参与!...

一年一度的开源盛会,COSCon24第九届中国开源年会暨开源社10周年嘉年华,将于11月2-3日,在北京•中关村国家自主创新示范区展示中心召开!本次大会的主题是:「Open Source,Open Life | 开源新生活」&#xff0…

react antd redux 全局状态管理 解决修改菜单状态 同步刷新左侧菜单

npm i react-redux1.src新建两个文件 globalState.js 全局状态定义 store.js 全局存储定义 2.globalState.js import { createSlice } from "reduxjs/toolkit";export const globalState createSlice({name: "globalState",initialState: { data: {} },r…

Qt 学习第 天:QPainter类

一、先创建一个widget窗口 二、包含头文件 #include <QPainter> #include <QFont> 三、在widget.h中声明paintEvent函数 使用画家类在窗口中画图, 操作必须在paintEvent函数中完成 #ifndef WIDGET_H #define WIDGET_H#include <QWidget>namespace Ui { cla…

Spring Boot框架下的知识管理自动化

3系统分析 3.1可行性分析 通过对本知识管理系统实行的目的初步调查和分析&#xff0c;提出可行性方案并对其一一进行论证。我们在这里主要从技术可行性、经济可行性、操作可行性等方面进行分析。 3.1.1技术可行性 本知识管理系统采用JAVA作为开发语言&#xff0c;Spring Boot框…

C语言题目练习3

这一篇博客也来看看和链表有关的题目~ 反转链表 反转链表&#xff1a; https://leetcode.cn/problems/reverse-linked-list/description/ 这个题目已经十分清晰了&#xff0c;那我们可以怎么做呢&#xff1f; 结合前面单链表的知识点&#xff0c;我们很容易可以想到第一个思路…

RTC -

RTC 目录 RTC 回顾 RTC 如何实现RTC制作一个时钟日历 代码编写 rtc.c完整代码 模块开发的步骤&#xff1a; 1、找文档 2、 在文档里面找通信方式&#xff0c;通信过程&#xff08;协议&#xff09; 3、代码> -- 前面学的是模块的开发&#xff0c;串口类&#xff0c;I…

决策树和集成学习的概念以及部分推导

一、决策树 1、概述 决策树是一种树形结构&#xff0c;树中每个内部节点表示一个特征上的判断&#xff0c;每个分支代表一个判断结果的输出&#xff0c;每个叶子节点代表一种分类结果 决策树的建立过程&#xff1a; 特征选择&#xff1a;选择有较强分类能力的特征决策树生成…