集成学习boosting、bagging、stacking

集成学习boosting、bagging、stacking

news2024/12/25 9:26:26

目录

一、介绍

二、三种架构学习

（1）boosting

（2）bagging

（3）stacking

一、介绍：

对于单个模型来说很难拟合复杂的数，模型的抗干扰能力较低，所以我们希望可以集成多个模型，结合多个模型的优缺点提高模型的泛化能力。

针对于集成学习方式：

第一种为Boosting架构，利用基学习器之间串行的方式进行构造强学习器。

第二种是Bagging架构，通过构造多个独立的模型，然后通过选举或者加权的方式构造强学习器。

第三种是Stacking架构，它结合了Boosting和Bagging两种集成方式，它是利用多个基学习器学习原数据，然后将这几个基学习学习到的数据交给第二层模型进行拟合。说白了就是将第一层模型的输出作为第二层模型的输入。

二、三种架构学习

（1）boosting

训练过程为阶梯状，基模型按次序一一进行训练（实现上可以做到并行），基模型的训练集按照某种策略每次都进行一定的转化。对所有基模型预测的结果进行线性综合产生最终的预测结果

第一步：初始化训练数据的权重，w1=w2=...=wn=1/N，N为样本的数量。

第二步：训练第一个基模型，计算模型的错误率，计算模型的系数。

第三步：更新数据集的权重，误分类数据的权重调大，分类正确的数据权值调小。在训练一个基类模型。依次进行

第四步：每个模型对测试数据，进行预测。

第五部：对所有基模型的预测结果进行加权求和。准确率高的模型调大权值，准确率低的模型减小权值。

下图为架构图

【参考学习】：集成学习--Bagging、Boosting、Stacking、Blending - 知乎 (zhihu.com)

（2）bagging

从训练集从进行子抽样组成每个基模型所需要的子训练集，对所有基模型预测的结果进行综合产生最终的预测结果

下图为架构图

【参考学习】：集成学习--Bagging、Boosting、Stacking、Blending - 知乎 (zhihu.com)

（3）stacking

将训练好的所有基模型对训练基进行预测，第j个基模型对第i个训练样本的预测值将作为新的训练集中第i个样本的第j个特征值，最后基于新的训练集进行训练。同理，预测的过程也要先经过所有基模型的预测形成新的测试集，最后再对测试集进行预测。

第一步：使用训练数据，训练T个不同的模型，得到T个基模型。

第二步：使用T个基模型，分别对训练数据进行预测，与原始训练数据的标签一起组成新的训练数据。

第三步：使用T个基模型，分别对测试数据进行预测，生成新的测试数据。

第四步：使用新的训练数据，训练一个元模型。

第五部：使用元模型对测试数据进行预测，得到最终结果。

下图为架构图

【参考学习】：集成学习--Bagging、Boosting、Stacking、Blending - 知乎 (zhihu.com)

【参考学习】【机器学习】集成学习——Stacking模型融合（理论+图解）_stacking集成模型_༺࿈ 海洋༒之心 ࿈༻的博客-CSDN博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/392873.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

ElasticSearch 8 学习笔记总结(五)

ElasticSearch 8 学习笔记总结(五)

文章目录一、ElasticSearch 8 版本二、ES8 集群环境安装1. 生成安全证书2. 生成http证书3. 配置第一个节点4. 配置其他节点三、ES集群关联问题解决四、 Kibana 安装和使用五、kibana 基础操作1. 索引操作2. 文档操作3. 文档搜索4. 索引模板六、分词器七、文档评分机制1. 什么…

阅读更多...

上拉电阻与下拉电阻总结

上拉电阻与下拉电阻总结

文章目录相关概念介绍IO引脚的三态输出之高阻态---将逻辑门与系统其他部分隔离，电平外部控制IO引脚输出模型推挽电路与开漏电路---单独开漏无高电平驱动能力原理介绍什么是上下拉电阻？---把IO口用电阻拉到正压VCC（上拉） 或接地…

阅读更多...

如何使用Docker容器部署O2OA(翱途)开发平台与OnlyOffice的集成版本？

如何使用Docker容器部署O2OA(翱途)开发平台与OnlyOffice的集成版本？

O2OA(翱途)开发平台[下称O2OA平台或者O2OA]默认可以和OnlyOffice进行集成来实现在线文档编辑以及流程集成。开发者可以直接安装O2OA官网的OnlyOfficeO2Server的Docker版本用于体验。本文将详细介绍如何安装O2OA OnlyOffice的Docker版本。OnlyOffice Docs Sever可以单独安装,O2…

阅读更多...

aws apigateway 使用httpapi私有集成ecs服务

aws apigateway 使用httpapi私有集成ecs服务

参考资料 https://docs.aws.amazon.com/zh_cn/apigateway/latest/developerguide/http-api-private-integration.htmlhttps://docs.aws.amazon.com/zh_cn/apigateway/latest/developerguide/http-api-develop-integrations-private.html 在《aws apigateway 基础概念和入门示…

阅读更多...

Vue2.0开发之——购物车案例-Goods组件封装-把购买数量传给counter组件(52)

Vue2.0开发之——购物车案例-Goods组件封装-把购买数量传给counter组件(52)

一概述 Goods组件中导入Counter组件设置Counter组件的数量二 Goods组件中导入Counter组件 2.1 Goods组件中导入Counter组件 import Counter from "/components/Counter/Counter.vue";2.2 Goods组件中注册Counter组件 components:{Counter }2.3 Goods组件中使用…

阅读更多...

GDKOI2023游记+一周模拟赛题解

GDKOI2023游记+一周模拟赛题解

温馨提示： 1)有些链接需要在本校OJ上的博客里才能打开。2)没更新完。 Day -6（3.4） 晚上打了场AtCoder，rank1515rank 1515rank1515，切了5题，信心。 zswangziye的atcoder账号打T5的时候心态不稳&#xff…

阅读更多...

2022年MathorCup数学建模A题大规模指纹图像检索的模型与实现解题全过程文档加程序

2022年MathorCup数学建模A题大规模指纹图像检索的模型与实现解题全过程文档加程序

2022年第十二届MathorCup高校数学建模 A题大规模指纹图像检索的模型与实现原题再现在生物特征识别领域，指纹作为最具独特性与持久性的生物特征之一，被广泛应用于身份识别。指纹识别过程分为特征提取和比对两个环节。其中特征提取环节会提取用于…

阅读更多...

matplotlib: 绘制柱状图

matplotlib: 绘制柱状图

通过matplotlib绘制柱形图第一个例子 from matplotlib import pyplot as plty [10, 11, 12, 11, 9, 8, 13, 10] # 创建y轴坐标 x list(range(1,9)) # 创建x轴坐标# 创建x轴显示的参数（此功能在与在图像中x轴仅显示能被10整除的刻度，避免刻度过多分…

阅读更多...

比亚迪：全球最大电动汽车制造商的坎坷成长之路

比亚迪：全球最大电动汽车制造商的坎坷成长之路

来源：猛兽财经作者：猛兽财经特斯拉（TSLA）首席执行官埃隆马斯克表示，特斯拉最接近的竞争对手可能是一家中国电动汽车公司。猛兽财经认为，沃伦•巴菲特支持的比亚迪（0211）可能是马斯…

阅读更多...

在ubuntu上部署与使用docker（python）

在ubuntu上部署与使用docker（python）

1.安装Docker首先，更新现有的包列表sudo apt update接下来安装一些允许童HTTPS才能使用的软件包：sudo apt install apt-transport-https ca-certificates curl software-properties-common然后将官方Docker存储库的GPG秘钥添加到您的系统curl -fsSL http…

阅读更多...

关于 C# 引用参数和值参数

关于 C# 引用参数和值参数

关于 C# 引用参数和值参数 C# 数据类型分为值类型和引用类型，两者的区别在于值类型的数据存储在栈中，而引用类型的数据存储在堆中，但是栈中会存放指向存储数据的堆的位置。传递参数时，传递的是数据栈中的值，实参将数…

阅读更多...

高等数学——一元函数微分学

高等数学——一元函数微分学

文章目录导数与微分概念几何意义连续、可导、可微之间的关系求导法则基本初等函数的导数公式有理运算法则复合函数求导法奇偶性和周期性隐函数求导反函数求导参数方程求导对数求导法高阶导数概念常用的高阶导数公式微分中值定理和导数的应用微分中值定理导数的应用函数的单调性…

阅读更多...

巾帼绽芬芳一起向未来(下篇)

巾帼绽芬芳一起向未来(下篇)

编者按：为了隆重纪念纪念“三八”国际妇女节113周年，快来与你全方位、多层次分享交流“三八”国际妇女节的前世今生。分上篇（节日简介、节日发展和节日意义）、中篇（节日活动宗旨和世界各国庆祝方式）和下篇&…

阅读更多...

Linux学习第二十节-NTP网络时间协议

Linux学习第二十节-NTP网络时间协议

1.概念 NTP(Network Time Protocol）网络时间协议基于UDP用于网络时间同步的协议，使网络中的计算机时钟同步到UTC(世界统一时间)，再配合各个时区的偏移调整就能实现精准同步对时功能。 chrony是网络时间协议NTP的实现方式， Chron…

阅读更多...

three.js 纹理贴图的使用

three.js 纹理贴图的使用

刚刚入门的小伙伴请先查看 three.js 基础认识与简单应用本文章中的两个注意点，下面也有提到，分别是： 1、 vue项目中使用的贴图路径-->需要把 static文件夹放到 public文件夹下,并使用 static 开头的绝对路径。 2、使用环境遮挡贴图时&a…

阅读更多...

Air780E|阿里云|AT命令|物联网|三元组|鉴权|算法|密钥生成-阿里云物联网手动接入步骤

Air780E|阿里云|AT命令|物联网|三元组|鉴权|算法|密钥生成-阿里云物联网手动接入步骤

基础资料基于Air780E开发板：Air780E文档中心简介：AT开发探讨重点本系列主要探讨MQTT手动接入腾讯云物理网平台的基本操作及手动鉴权步骤、信息订阅及发布的基本原理。参考阅读：物联网模组AT命令接入云平台（1）-MQTT基本…

阅读更多...

移动硬盘怎么恢复数据？怎么恢复硬盘删除的数据

移动硬盘怎么恢复数据？怎么恢复硬盘删除的数据

移动硬盘可以随时插上或拔下，小巧而便于携带的硬盘存储器，以较高的速度与系统进行数据传输。由于其存储空间较大，性价比较高，存储和传输数据快速简便，是很多职场人士必备的外置设备之一。移动硬盘怎么恢复数据&#xf…

阅读更多...

cuda代码高效策略--b站看课的笔记

cuda代码高效策略--b站看课的笔记

1.1 高效公式要么增大数据量，要么减少每个线程的内存（每个线程读取的数据量变少，每个线程的读取数据的速度变快（转变存储方式，对读取慢的地方做优化–合并全局内存）） 1.2 合并全局内存一个线…

阅读更多...

电子台账：模板制作之二——行过滤（垂直过滤）

电子台账：模板制作之二——行过滤（垂直过滤）

1 简介大部分情况下，企业数据源表格中，只有部分行的数据可用于电子台账。例如，一共100行数据，我们只要取得其中20行即可。如果所有数据一股脑全部导入到台账中，再手工删除不需要的行，太麻烦了，有…

阅读更多...

js变量和函数提升

js变量和函数提升

1、变量提升变量提升是JavaScript 中比较“奇怪”的现象，它允许在变量声明之前即被访问 (仅存在于var声明变量) 注意: 1.变量在未声明即被访问时会报语法错误 2.变量在var声明之前即被访问，变量的值为 undefined 3.let/const声明的变量不存在变量提升…

阅读更多...

推荐文章

最新文章