树模型详解2-GBDT算法

树模型详解2-GBDT算法

news2025/6/30 4:20:18

与adaboost一样，GBDT也是采用前向分步算法，只是它会用决策树cart算法作为基学习器，因此先要从分类树和回归树讲起

决策树-提升树-梯度提升树

决策树cart算法

回归树：叶子结点的值是所有样本落在该叶子结点的平均值

如何构建：1.深度？2.划分结点如何选取3.叶子结点cm值

1的方法：深度/子结点包含样本数/精度

3的方法:取均值损失最小

2的方法：找到一个划分条件使得cm求和最小

采用的损失：平方损失

分类树：结点不止有特征，还有特征的属性

特征选择方式：选择gini值最小的特征作为划分标准

GBDT：梯度提升树，基分类器是决策树，且权重均为1

二分类问题的提升树：

是adaboost的特殊情况：基分类器为二类分类树，且权重为1，损失函数用指数损失函数

回归问题的提升树：让当前树拟合残差

GBDT:作用：考虑一般问题，解决不管损失函数是什么都能求解

方法：泰勒展开推导：由此得到步骤为：

1.计算当前损失函数的负梯度

2.将xi，yi带入损失函数，得到第m轮的训练数据集Tm={（x1，rm1），（x2，rm2）...}

3.让当前的基学习器拟合上述样本

如何用它解释回归问题的提升树？

L=1/2(Y-F(X))2，对fx求导得y-f（x）=rm残差

那么GBDT如何解决二分类问题？回归树能不能做二分类？

问题：无法直接输出类别或者概率预估

解决方案：通过sigmoid函数将加法模型映射到0-1的空间中，再用交叉熵损失进行学习

损失函数：

负梯度为Y-1/（1+e-fm(x)）=Y-Ym-1

所以rmi=yi-ym-1，i来构造训练样本

损失函数决定了cm的取值，所以损失函数最好是能最大程度地拟合残差，最终我们得到的最优损失函数（用总体损失）和它对应的cm为

但这个cmj无法解出，通过二阶泰勒展开得到其解

但是，使用总体损失对回归树进行优化，计算过于复杂，而使用MSE划分得到的树的结构是一样的，因此实际步骤为：

1、用传统回归数构建好回归树的结构

2、用总体损失中的方式计算树的叶子节点中的cmj

为了避免过拟合，有时也加上一个学习率，让它不要学的太满

最后讲GBDT+LR:

那么如何用决策树构造新特征呢？

构建完所有叶子节点后，再送到逻辑回归中，进行CTR预估，注意这两步是独立的，因此不用将LR的梯度传回到GBDT

优点：自动做特征工程缺点：容易过拟合

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1900862.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

NTP协议格式解析

NTP协议格式解析

1. NTP时间戳格式 SNTP使用在RFC 1305 及其以前的版本所描述标准NTP时间戳的格式。与因特网标准标准一致， NTP 数据被指定为整数或定点小数，位以big-endian风格从左边0位或者高位计数。除非不这样指定，全部数量都将设成unsigned的类型&#…

阅读更多...

收银系统源码-收银台副屏广告

1. 功能描述门店广告：双屏收银机，副屏广告，主屏和副屏同步，总部可统一控制广告位，也可以给门店开放权限，门店独立上传广告位； 2.适用场景新店开业、门店周年庆、节假日门店活动宣传&#x…

阅读更多...

笔记15：while语句编程练习

笔记15：while语句编程练习

练习一： 编写程序，求 2^24^26^2...n^2? -直到累加和大于或等于 10000 为止，输出累加和 -输出累加式中的项数，以及最大的数 n #include<stdio.h> int main() {int sum 0;int i 1;int n 0;while(sum < 10000)//将sum…

阅读更多...

CVPR 2024最佳论文分享：通过解释方法比较Transformers和CNNs的决策机制

CVPR 2024最佳论文分享：通过解释方法比较Transformers和CNNs的决策机制

CVPR（Conference on Computer Vision and Pattern Recognition）是计算机视觉领域最有影响力的会议之一，主要方向包括图像和视频处理、目标检测与识别、三维视觉等。近期，CVPR 2024 公布了最佳论文。共有10篇论文获奖，其…

阅读更多...

基于Maximin的异常检测方法（MATLAB）

基于Maximin的异常检测方法（MATLAB）

异常存在于各个应用领域之中，往往比正常所携带的信息更多也更为重要。例如医疗系统中疾病模式，信用卡消费中的欺诈行为，数据库中数据泄露，大型机器故障，网络入侵行为等。大数据技术体系的快速兴起与发展，加…

阅读更多...

奥威BI方案：多行业、多场景，只打高端局

奥威BI方案：多行业、多场景，只打高端局

奥威BI方案，确实以其卓越的性能和广泛的应用领域，在高端数据分析市场中占据了一席之地。以下是对奥威BI方案的详细解析。奥威BI方案是一款针对多行业、多场景的全面数据分析解决方案，它结合了大数据、云计算等先进技术，为企业提…

阅读更多...

2024年地理信息技术与应用技能大赛·决赛（2024年地理信息技术与应用能力水平考试·中级）

2024年地理信息技术与应用技能大赛·决赛（2024年地理信息技术与应用能力水平考试·中级）

目录 1 请将所有数据的空间参考统一。（2分） 1.1 题目要求 1.2 详细解析 2 制作台风轨迹图。（10分） 2.1 题目要求 2.2 详细解析 3 分析台风影响城市，并将结果以独立专题图的形式展示。（13分&#xff…

阅读更多...

固态继电器的未来浅析

固态继电器的未来浅析

固态继电器(SSR)已成为传统机电继电器的可靠替代品，具有开关速度更快、使用寿命更长、电磁干扰更少等诸多优势。随着技术的不断进步，SSR的未来有望在设计和应用的各个方面实现更显著的改进和创新。 1.小型化和集成化： 固态继电器开发的主要趋…

阅读更多...

django高校教务系统-计算机毕业设计源码81661

django高校教务系统-计算机毕业设计源码81661

目录摘要 1 绪论 1.1 研究背景 1.2目的及意义 1.3论文结构与章节安排 2 高校教务系统设计分析 2.1 可行性分析 2.1.1 技术可行性分析 2.1.2 经济可行性分析 2.1.3 法律可行性分析 2.2 系统功能分析 2.2.1 功能性分析 2.2.2 非功能性分析 2.3 系统用例分析 2.4…

阅读更多...

Windows 玩转大模型第一天：大模型本地部署，调用大模型API可直接工程化应用（全部代码和详细部署流程）

Windows 玩转大模型第一天：大模型本地部署，调用大模型API可直接工程化应用（全部代码和详细部署流程）

Ollama 是一个开源框架，专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计。以下是其主要特点和功能概述： 1. 简化部署：Ollama 目标在于简化在 Docker 容器中部署大型语言模型的过程，使得非专业用…

阅读更多...

全能PDF工具集 -- PDF Shaper Professional v14.3 特别版

全能PDF工具集 -- PDF Shaper Professional v14.3 特别版

软件简介 PDF Shaper是一款功能强大的PDF工具集，它提供了一系列用于处理PDF文档的工具。这款软件使用户能够轻松地转换、分割、合并、提取页面以及旋转和加密PDF文件。PDF Shaper的界面简洁直观，使得即使是新手用户也能快速上手。它支持广泛的功能&…

阅读更多...

Stream练习

Stream练习

运用点： 流内数据类型转换(map)、filter、limit、skip、concat(让两个流合并) 题目： 操作1、2： ArrayList<String> manList new ArrayList<>();ArrayList<String> womanList new ArrayList<>();Collections.addAl…

阅读更多...

新产品或敏捷项目过程 SOP，附带流程图及流程规范

新产品或敏捷项目过程 SOP，附带流程图及流程规范

一、项目启动项目背景和目标明确市场调研结果分析，确定新产品的需求和市场机会。制定明确的项目目标，包括产品特性、上市时间、预期收益等。组建项目团队确定项目经理、产品经理、开发人员、测试人员、市场人员等角色。明确各成员的职责和权限。项目…

阅读更多...

STL--求交集，并集，差集（set_intersection，set_union，set_difference）

STL--求交集，并集，差集（set_intersection，set_union，set_difference）

set_intersection(重要) 求两个有序的序列的交集. 函数声明如下: template<class InputIterator1, class InputIterator2, class OutputIterator>OutputIterator set_intersection(InputIterator1 _First1, //容器1开头InputIterator1 _Last1, //容器2结尾(不包含)Inp…

阅读更多...

阿里云OSS文件上传不配置环境变量使用显式AccessKey验证

阿里云OSS文件上传不配置环境变量使用显式AccessKey验证

问题背景在中阿里云官方文档中介绍文件上传时，推荐配置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。这里用简单的方法，直接在Demo.java中显式指定accessKeyId和accessKeySecret，同时修改OSSClientBuilder()的入参。解决方法首先…

阅读更多...

秒杀圣经：10Wqps高并发秒杀，16大架构杀招，帮你秒变架构师

秒杀圣经：10Wqps高并发秒杀，16大架构杀招，帮你秒变架构师

高并发下，如何设计秒杀系统？这是一个高频面试题。在40岁老架构师尼恩的读者交流群(50)中，最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、shein 希音、shopee、百度、网易的面试资格，遇到很多很重要的面试题…

阅读更多...

如何选择TikTok菲律宾直播网络？

如何选择TikTok菲律宾直播网络？

为了满足用户对于实时互动的需求，TikTok推出了直播功能，让用户能够与粉丝即时交流。本文将探讨如何选择适合的TikTok菲律宾直播网络，并分析OgLive是否是值得信赖的选择。 TikTok菲律宾直播网络面临的挑战作为全球领先的短视频平台&#xff…

阅读更多...

Redis 中 Set 和 Zset 类型

Redis 中 Set 和 Zset 类型

目录 1.Set类型 1.1 Set集合 1.2 普通命令 1.3 集合操作 1.4 内部编码 1.5 使用场景 2.Zset类型 2.1 Zset有序集合 2.2 普通命令 2.3 集合间操作 2.4 内部编码 2.5 使用场景 1.Set类型 1.1 Set集合集合类型也是保存多个字符串类型的元素，但是和列表类型不同的是&…

阅读更多...

【Android】自定义换肤框架01之皮肤包制作

【Android】自定义换肤框架01之皮肤包制作

前言目前为止，市面上主流的安卓换肤方案，其实原理都是差不多的虽然大多都号称一行代码集成，但其实想要做到完全适配，并不简单这个系列，就是让大家从零开始，完全掌握这方面知识，这样才能对…

阅读更多...

理解MySQL核心技术：存储过程与函数的强大功能

理解MySQL核心技术：存储过程与函数的强大功能

在大型应用程序和复杂的数据库操作中，存储过程与函数扮演着至关重要的角色。它们不仅可以提高代码的可维护性，还能加强数据库的安全性和性能。本篇文章将深入探讨MySQL存储过程与函数的基础知识、创建、管理及其在实际应用中的优势。什么是存储过程和函…

阅读更多...

推荐文章

最新文章