算法专利复现_基于ngboost和SHAP值可解释预测方法

news2024/9/20 13:17:36

大家好,我是重庆未来之智的Toby老师,最近看到一篇专利,名称是《基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法》。该专利申请工日是2021年3月2日。

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

专利复现

我看了这专利申请文案后,文章整体布局和文字内容结构不错,就是创新点半天找不到。我们公司之前申请专利至少还有算法创新点,不由感叹现在专利局审核尺度也太松弛了。

ngboost是2019年出来的算法,SHAP是博弈论中经典算法。两者组合还算不错,今天就为大家复现基于ngboost和SHAP值可解释预测方法。

NGboost概述

NGBoost(Natural Gradient Boosting)是一种基于梯度提升框架的集成学习算法,它通过自然梯度优化来更新模型参数。NGBoost结合了梯度提升决策树(GBDT)的预测能力与自然梯度的优化优势,尤其在处理高维数据和复杂模型时表现出色。

斯坦福 ML Group最近在他们的论文 Duan et al., 2019 中发表了一种新算法,其实现称为 NGBoost。该算法通过使用自然梯度将不确定性估计包括在梯度提升中。这篇文章试图理解这个新算法,并与其他流行的增强算法 LightGBM 和 XGboost 进行比较,看看它在实践中是如何工作的。

斯坦福ngboost官网如下
https://stanfordmlgroup.github.io/projects/ngboost/

图片

自然梯度使学习高效且有效

什么是自然梯度提升?

NGBoost 是一种新的提升算法,它使用自然梯度提升,一种用于概率预测的模块化提升算法。该算法由基学习器、参数概率分布和评分规则组成。

图片

图片

普通梯度可能非常不适合学习多参数概率分布(例如正态分布)。如上面的概率回归示例所示,使用自然梯度的训练动态往往更加稳定并产生更好的拟合。

在不确定性估计和传统指标方面的竞争表现

与竞争方法相比,NGBoost 所需的专业知识要少得多,并且在常见的基准测试中表现同样出色。NGBoost 在较小的数据集上具有特别强的性能。

图片

在一个回归模型的实验中,我们发现ngboost获得更低的rmse.

图片

SHAP概述


SHAP(SHapley Additive exPlanations)是一种解释机器学习模型预测的方法,它基于博弈论中的Shapley值概念。SHAP值提供了一种公平的方法来量化每个特征对模型预测结果的贡献。以下是SHAP的关键特点和概述:

  1. 基于Shapley值

    • SHAP值基于Shapley值,这是一种在合作游戏中分配支付的标准方法,确保每个玩家(在这里是特征)获得其“公平”的份额。

  2. 可解释性

    • SHAP值提供了一种直观的方式来理解模型的预测,通过分解预测结果并将其归因于各个特征。

  3. 特征贡献度量

    • 对于给定的预测,SHAP值可以量化每个特征对预测结果的正面或负面影响。

  4. 一致性和公平性

    • SHAP值满足一致性、公平性等博弈论的公理,确保了特征贡献的合理分配。

  5. 多种模型支持

    • SHAP可以解释多种类型的机器学习模型,包括决策树、随机森林、梯度提升机、线性模型、深度神经网络等。

  6. 可视化工具

    • SHAP提供了丰富的可视化工具,如力导向图(force plot)和汇总图(summary plot),帮助用户直观地理解模型预测。

  7. Python实现

    • SHAP有Python库支持,可以方便地集成到现有的Python机器学习工作流程中。

  8. 交互式解释

    • SHAP值的计算可以是交互式的,允许用户探索不同特征组合对模型预测的影响。

  9. 适用于复杂模型

    • 尽管SHAP值的计算对于复杂的模型可能很耗时,但它提供了一种强大的方法来解释这些模型的决策过程。

  10. 理论和实践结合

    • SHAP结合了理论基础和实际应用,使得即使是非技术背景的用户也能够理解模型的工作原理。

  11. 开源和社区支持

    • SHAP是一个开源项目,得到了数据科学和机器学习社区的广泛支持。

SHAP值是解释机器学习模型的重要工具,尤其适用于需要模型透明度和可解释性的场景。通过SHAP值,研究人员和实践者可以更好地理解模型的行为,提高模型的信任度,并做出更明智的决策。

专利复现-基于ngboost和SHAP值可解释预测方法

前期理论知识给大家说清楚了,现在Toby老师用15万真实金融风控数据来复现基于ngboost和SHAP值可解释预测方法。下图是建模数据集,模型通过喂养数据,训练数据,最终生成具有预测能力的AI大模型。

图片

下图是我方已经建立好ngboost预测模型。

图片

下图是我方计算的SHAP values值。

图片

通过SHAP values值,我们计算变量重要性,并从大到小排序。如下图,SHAP+ngboost分析得出Revolving Utilization of Unsecured Lines变量是最重要变量。

"Revolving Utilization of Unsecured Lines"(未担保循环信用额度的使用率)是一个金融术语,通常用于个人信用报告和信贷分析中。它指的是借款人在循环信用账户(如信用卡)上使用的信用额度与可获得的总信用额度的比例。

该变量计算公式=(当期未偿还余额 / 信用额度上限) * 100%。

Revolving Utilization of Unsecured Lines对信用评分有重要影响:

该变量高使用率可能会对个人的信用评分产生负面影响,因为这表明借款人可能面临较高的财务压力。

金融机构和贷款人使用这一指标来评估借款人的信用风险。较高的使用率可能表明借款人依赖信贷来维持消费,这可能增加违约风险。

借款人可以通过降低使用率来提高信用评分,例如通过支付下账单或要求提高信用额度。

图片

SHAP除了横向比较变量重要性,还可以纵向分析变量解释性。如下图,Revolving Utilization of Unsecured Lines值越高,SHAP值越高,违约风险也相应提高,反之亦然。age年龄分析得到相反结论,年龄越小信用风险越高,反之亦然。

图片

如果是金融小白不懂风控,不懂编程,不懂金融,不懂业务,没时间学习没有关系。重庆未来之智信息技术咨询服务有限公司帮助用户设计好零基础操作界面。审批人员无需风控建模知识,无需编程知识,只需要输入用户信息,鼠标点击预测,工具就为显示预测结果。接下来为大家展示。

图片

该功能对小白友好,可以增强该专利的功能。

算法专利复现_基于ngboost和SHAP值可解释预测方法 就为大家介绍到这里,有商务需求的可以留言联系。

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2094756.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

算法基础-区间合并

1、按照区间的左端点排序 2、 左端点小于等于ed,只需要更新ed和右端点的最大值 左端点大于ed,存入res中,并更新st和ed,最后一组数据手动插入res public class Main {public static void main(String[] args) {Scanner in new S…

Pinterest账号被封?试试这几种解封方法

Pinterest作为一个充满创意与灵感的视觉社交平台,吸引着大量用户和企业前来展示、收藏和分享他们的作品。然而,如同其他社交媒体平台一样,Pinterest也设立了一套严格的使用规则和监测机制,以保障平台内容的质量和用户的良好体验。…

景联文科技提供运动数据采集服务

运动数据的重要性 运动数据的收集与分析对于提升个人健康管理和运动表现具有重要意义。 通过收集心率、步态、速度等生理和运动参数,不仅可以为运动员提供个性化的训练方案,帮助其优化表现,还能早期发现并预防伤病。对于普通健身者而言&…

MVC架构模式

MVC(ModelView Controller)是软件工程中的一种软件架构模式 ,它把软件系统分为模型、 视图和 控制器 三个基本部分。用一种业务逻辑、数据、界面显示分离的方法组织代码,将业务逻辑聚集到一个部件里面,在改进和个性化定制界面及用户交互的同时…

华为OD机试真题 - 字符成环找偶数O - 滑动窗口(Python/JS/C/C++ 2024 E卷 100分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试真题(Python/JS/C/C++)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、…

KTV结算源码--SAAS本地化及未来之窗行业应用跨平台架构

一、代码 function 未来之窗_人工智能_KTV结账(title,桌台id,类型id,类型名称){if(room_status0){alert("空房不可操作");return "空房";}if(room_status1){alert("空房不可操作");}else if(room_status2){//alert("结账");var 未来之…

图像识别智能垃圾桶项目开发

一、项目思维导图 二、语音模块配置信息 三、项目程序 main.c garbage.c garbage.h uartTool.c //串口发送数据 uartTool.h

4款pdf在线编辑工具,带你搞定PDF

作为一个在办公室里日夜奋斗的文案策划人员,我深知在工作中,效率和工具的重要性。PDF文件的编辑是我们工作中不可或缺的一部分,而选择一款合适的PDF编辑器,就像是找到了一把打开效率之门的钥匙。今天,我就来和大家分享…

深度学习-HW3(CNN)卷积神经网络-图像分类-【Datawhale X 李宏毅苹果书 AI夏令营】

分类实际上是一个回归问题。 登录阿里云的账号,才发现有3个账号,要认证学生身份,试遍了3个账号后才试出学生认证号。打开看了一下,居然还有高校教师优惠申请,努力搞一个(最近是想薅一把教师资格证的福利&a…

中仕公考怎么样?省考笔试成绩什么时候出?

根据往年的经验,省考笔试的成绩通常在考试后的大约一个月左右公布,但具体日期会根据各省份的公告而有所差异,不同省份具体时间不同,以2024年的为例: 广东省预计于笔试后约30天发布、山东省预计于笔试后约35天发布、浙…

操心没小课堂第一节 协同过滤算法

协同过滤算法 协同过滤算法(Collaborative Filtering)是推荐系统中一种广泛应用的技术,它主要依赖于用户的行为数据来预测用户可能感兴趣的内容。协同过滤算法可以分为两大类:基于用户的协同过滤(User-Based Collabor…

【论文阅读】LJP法律判决预测论文笔记

[大模型 | 类案检索] Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model Collaboration key point 会议:EMNLP2023 贡献:提出了一个结合领域模型和大模型的先例增强的LJP框架,其实主要是用到的大模型,比…

Python画笔案例-024 绘制八圆围正方

1、绘制八圆围正方 通过 python 的turtle 库绘制八圆围正方的图案,如下图: 2、实现代码 绘制一个八圆围正方,以下为实现代码: """八圆围正方.py """ from turtle import Turtle # 从海龟模块导入…

阶段二 - 小程序反编译及调试

在打开小程序后,小程序的apkg会放在以下目录中: 使用解包工具对小程序进行解包: 解包工具:链接: https://pan.baidu.com/s/1KLDbivGPCPhqt1nbLVbhXA?pwdkckq 提取码: kckq 解包后会生成一个这样的文件: 在这里输…

【Netty】FastThreadLocal比ThreadLocal快之源码解析

ThreadLocal 【并发设计模式】聊聊线程本地存储模式如何实现的线程安全 【Java并发】从simpleDateFormart聊聊threadlocal原理机制 前两篇中已经从源码角度进行剖析,本篇主要从设计角度剖析。 在并发中为了保证数据安全,可以采用数据隔离的方式 也就是…

微信视频号 点赞+关注+喜欢+发布评论

微信视频号 点赞关注喜欢发布评论 微信视频号 点赞关注喜欢发布评论

3127. 构造相同颜色的正方形(24.8.31)

题目 给你一个二维 3x3 的矩阵 grid,每个格子都是一个字符,要么是 B ,要么是 W。字符 W 表示白色,字符 B 表示黑色。 你的任务是改变至多一个格子的颜色,使得矩阵中存在一个 2x2 颜色完全相同的正方形。 如果可以得到…

这位沉默寡言忠厚老实的商人遇到了哪位神奇女子搭救?

这位沉默寡言忠厚老实的商人遇到了哪位神奇女子搭救? 接下来,我将为你讲述一个关于侠女的故事,她救助了一个落难之人,并发表了许多关于剑侠的独特见解,这些都是前所未有的,简直精彩绝伦。有诗为证&#xff…

APP、3D动画效果统计图、WEB页面自定义、电话短信通知、告警等级自动升级、告警短视频、人工巡查等功能介绍的智慧矿山多模态智能分析预警平台

智慧矿山多模态预警平台是一个集成了多种实用功能和先进技术的综合管理系统,目标是提高矿山的安全性和管理效率。下面介绍多模态智能分析预警平台的特色功能: 智慧矿山多模态首页 首先看看智慧矿山多模态首页 智慧矿山多模态首页包含了很多内容&#x…

MySQL查询全解

接下来我们就要进入重中之重-----MySQL查询的学习中了.激动激动!!!!!! 1 聚合查询 常见的统计总数、计算平局值等操作,可以使用聚合函数来实现,常见的聚合函数有: COUN…