【机器学习】Yellowbrick 包的理解和说明

news2025/1/18 20:10:38

文章目录

  • 一、介绍
  • 二、Visualizers
    • 2.1 Classification Visualization
    • 2.2 Clustering Visualization
    • 2.3 Feature Visualization
    • 2.4 Model Selection Visualization
    • 2.5 Regression Visualization
    • 2.6 Target Visualization
    • 2.7 Text Visualization

一、介绍

首先是包的安装过程:

pip install --user yellowbrick

Yellowbrick 是一套视觉分析和诊断工具,旨在通过 scikit-learn 促进机器学习。

该库实现了一个新的核心 API 对象,Visualizer,它是一个 scikit-learn 估计器—一个从数据中学习的对象。

与转换器或模型类似,可视化工具通过创建模型选择工作流程的可视化表示来从数据中学习。

Visualizer 允许用户引导模型选择过程,围绕特征工程、算法选择和超参数调整建立直觉。

例如,它们可以帮助诊断围绕模型复杂性和偏差、异方差性、欠拟合和过度训练或类别平衡问题的常见问题。

通过将可视化工具应用于模型选择工作流程,Yellowbrick 允许您更快地引导预测模型获得更成功的结果。

完整的文档可以在 scikit-yb.org 上找到,其中包括面向新用户的快速入门指南。

在这里插入图片描述

二、Visualizers

可视化工具是估算器—从数据中学习的对象—其主要目标是创建可视化效果,以便深入了解模型选择过程。

在 scikit-learn 术语中,它们在可视化数据空间时类似于转换器,或者包装类似于 ModelCV(例如 RidgeCV、LassoCV)方法工作方式的模型估计器。

Yellowbrick 旨在创建一个类似于 scikit-learn 的敏感 API。 我们最受欢迎的一些可视化工具包括:

2.1 Classification Visualization

  1. Classification Report:一个视觉分类报告,以热图的形式显示模型的精度、召回率和 F1 每类分数;
  2. Confusion Matrix:多类分类中类对混淆矩阵的热图视图;
  3. Discrimination Threshold:精度、召回率、F1 分数和排队率相对于二元分类器的辨别阈值的可视化;
  4. Precision-Recall Curve:绘制不同概率阈值的精度与召回分数;
  5. ROC / AUC:绘制接受者操作特征 (ROC) 和曲线下面积 (AUC)。

2.2 Clustering Visualization

  1. Intercluster Distance Maps:可视化集群的相对距离和大小;
  2. KElbow Visualizer:根据指定的评分函数可视化集群,寻找曲线中的“弯头”。
  3. Silhouette Visualizer:通过可视化单个模型中每个簇的轮廓系数分数来选择 k。

2.3 Feature Visualization

  1. Manifold Visualization:具有流形学习的高维可视化;
  2. Parallel Coordinates: 实例的水平可视化;
  3. PCA Projection:基于主成分的实例投影;
  4. RadViz Visualizer:围绕圆形图分离实例;
  5. Rank Features:特征的单一或成对排序以检测关系。

2.4 Model Selection Visualization

  1. Cross Validation Scores:将交叉验证分数显示为条形图,平均分数绘制为水平线;
  2. Feature Importances:根据模型内性能对特征进行排名;
  3. Learning Curve:显示模型是否可以从更多数据或更少复杂性中受益;
  4. Recursive Feature Elimination:根据重要性找到最好的特征子集;
  5. Validation Curve:根据单个超参数调整模型。

2.5 Regression Visualization

  1. Alpha Selection:显示 alpha 的选择如何影响正则化;
  2. Cook’s Distance:显示实例对线性回归的影响;
  3. Prediction Error Plots:沿目标域查找模型故障;
  4. Residuals Plot:显示训练和测试数据的残差差异。

2.6 Target Visualization

  1. Balanced Binning Reference:生成带有垂直线的直方图,显示建议值点将 bin 数据放入均匀分布的 bin 中;
  2. Class Balance:通过以条形图形式显示每个类出现的频率,显示训练数据和测试数据中每个类的支持关系 类在数据集中的表示频率;
  3. Feature Correlation:可视化因变量和目标之间的相关性。

2.7 Text Visualization

  1. Dispersion Plot:可视化关键术语如何分散在整个语料库中;
  2. PosTag Visualizer:绘制整个标记语料库中不同词性的计数;
  3. Token Frequency Distribution:可视化语料库中术语的频率分布;
  4. t-SNE Corpus Visualization:使用随机邻居嵌入来投影文档;
  5. UMAP Corpus Visualization:将相似的文档更靠近地绘制在一起以发现集群。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/532551.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Reid strong baseline 代码详解

本项目是对Reid strong baseline代码的详解。项目暂未加入目标检测部分,后期会不定时更新,请持续关注。 本相比Reid所用数据集为Markt1501,支持Resnet系列作为训练的baseline网络。训练采用表征学习度量学习的方式。 目录 训练参数 训练代…

前端开发之this.$options.data的使用

前端开发之this.$options.data的使用 前言效果图vue2中使用vue3中使用 前言 this.$options.data:初始化对象 效果图 vue2中使用 this.$options这是一个Vue的特性,它可以让你访问组件的选项对象。你可以使用this.$options.data.call(this)来获取组件的初始数据&am…

pytorch模型转ONNX

目录 1. ONNX 2. pytorch 转 ONNX 3. 加载 ONNX 文件 4. Netron 1. ONNX 一般来说,pytorch训练好的模型是不能够直接用于生产环境,有很多的地方没有优化 而ONNX 格式可以兼顾不同框架的模型,相当于一个中间人的角色。这样部署到不同的环…

msvcr120.dll丢失怎样修复,学这三招就可以修复好

年前才买的新电脑,今天在打开软件ps软件的时候,电脑就提升msvcr120.dll文件丢失,无法执行此代码。刚刚开始以为是电脑的系统没有装好,经过我一下午时间的研究,原来是电脑msvcr120.dll文件丢失一般都是下载到垃圾软件&a…

软件测试后浪太强了,前浪有点顶不住啊,真难受...

想和大家说的话 8年前军哥刚进入到IT行业,现在发现学习软件测试的人越来越多,今天想根据军哥的行业经验再结合自己的一些看法给大家提一些建议。 最近聊到软件测试的行业内卷,越来越多的转行和大学生进入测试行业,导致软件测试已…

证件照片如何换背景底色,3个免费制作证件照的方法,简单易学

在日常生活中,我们经常需要用到证件照,比如:找工作需要简历上附带有证件照,还有办理学生证、身份证也需要提交证件照。 不同的平台有时候提交的要求(背景底色、大小等)也不一样,如果你不想每次…

缺少dll文件怎么办?修复dll文件的多种方法

缺少dll文件怎么办?当您试图启动某个应用程序或游戏时,可能会遇到“缺少DLL文件”的错误提示。DLL文件是动态链接库文件的缩写,它们包含在计算机上的许多应用程序和游戏中,并且是确保这些应用程序和游戏正常运行的重要部分。当出现…

秒懂!项目安全问题-SM4加解密

项目安全问题一直被人们研究,当前端路径上通过?status这种拼接参数时,参数的值在浏览器路径栏上非常醒目,是很容易被人恶意修改的,比如该用户并没有编辑权限,但有心之人却可以通过修改参数status的值把see改成edit&am…

【DataX】将hive表数据导入ES

目录 一、环境 二、创建hive测试表 三、Es写入插件包 四、配置json 五、数据同步 1、执行命令 2、查看es结果 一、环境 DataX:windows安装 Es版本:7.9.0 二、创建hive测试表 CREATE TABLE teacher(name string,age int )row format del…

抖音未来的发展趋势|成都欢蓬信息

抖音未来的发展趋势,近年来随着互联网技术的发展,小视频app也逐渐走入大家的日常生活中,闲着的时候打开手机抖音APP,就可以刷到世界各地人们分享的视频和直播,下面一起看看抖音未来的发展趋势 一、抖音的现状   据权…

【 五子棋对战平台(java_gobang) 】

文章目录 一、核心功能及技术二、效果演示三、创建项目扩展:WebSocket 框架知识 四、需求分析和概要设计五、数据库设计与配置 Mybatis六、实现用户模块功能6.1 数据库代码编写6.2 前后端交互接口6.3 服务器开发6.4 客户端开发 七、实现匹配模块功能7.1 前后端交互接…

构建新一代智慧园区移动应用以推动数字转型

随着智慧城市的建设和智慧园区的崛起,智慧园区数字一体化建设成为园区发展的重心,当然数字转型离不开移动应用的整合服务。 在过去的几年中,智慧园区移动应用已经发展成为园区管理和服务的重要手段之一,为企业和员工提供了更加便…

知行之桥EDI系统2023版功能介绍——概览页面

登录知行之桥EDI系统2023版,即可看到概览页面。默认情况下,会显示过去7天的各项指标。用户可以在页面右上角:显示过去的数据 下拉列表中手动选择需要的时间段,如:24小时、3天、7天等。 关键指标的自定义配置 概览页面…

如何将exe注册为windows服务,直接从后台运行

如何将exe注册为windows服务,直接从后台运行 使用instsrvsrvanywindow64位系统安装配置 window32位系统安装 使用instsrvsrvany 这是地址:链接: 网盘地址 提取码: h2za 复制这段内容后打开百度网盘手机App,操作更方便哦 window64位系统 安…

[OOD设计] - 电梯系统设计

明确主要需求 首先需要设计电梯系统的基本工作流程,一个简单电梯系统主要就是两个主要功能: 乘客在电梯外按下按钮时,电梯系统会驱动一个电梯来接人乘客在电梯内部按下楼层按钮时,电梯系统会驱动该电梯到达指定楼层 根据需求来…

泰克Tektronix AFG31021 任意波函数发生器产品资料

AFG31021是一款高质量、多功能的任意波形发生器,可以生成高精度、高分辨率的波形信号。该产品的主要特点包括: 可以生成任意波形信号,内置多种标准波形,如正弦波、方波、三角波、锯齿波等,也可以通过用户自定义来生成…

支付从业者转型路在何方?

近来,整个支付行业,已经“卷”出了新高度。 营销上电销卷地推,工单卷电销,POS机具则是退押金卷不退押金,无押金卷退押金”,互相“卷”得不亦乐乎。 与此同时,支付圈子里聊的永远是“成本上升”…

微信小程序是怎么做的?

微信小程序是一种轻量级的应用,它可以在微信内部直接使用,无需下载和安装。那么,微信小程序是怎么做的呢? 微信小程序制作的大概步骤 微信小程序制作主要包括以下几个步骤: ①注册小程序账号 ②在小程序制作工具创…

5th-Generation Mobile Communication Technology(一)

目录 一、5G/NR 1、 快速参考(Quick Reference) 2、5G Success 3、5G Challenges 4、Qualcomm Videos 二、PHY and Protocol 1、Frame Structure 2、Numerology 3、Waveform 4、Frequency Band 5、BWP 6、Synchronization 7、Beam Management 8、CSI Fra…

matmul/mm 函数用法介绍

介绍torch.matmul之前先介绍torch.mm函数, mm和matmul都是torch中矩阵乘法函数,mm只能作用于二维矩阵,matmul可以作用于二维也能作用于高维矩阵 mm函数使用 x torch.rand(4, 9) y torch.rand(9, 8) print(torch.mm(x,y).shape)torch.Size([4, 8]) m…