【Python机器学习】决策树——树的特征重要性

【Python机器学习】决策树——树的特征重要性

news2026/2/16 8:53:00

利用一些有用的属性来总结树的工作原理，其中最常用的事特征重要性，它为每个特征树的决策的重要性进行排序。对于每个特征来说，它都是介于0到1之间的数字，其中0代表“根本没有用到”，1代表“完美预测目标值”。特征重要性的求和为1。

将特征重要性进行可视化：

import mglearn.datasets
import numpy as np
from sklearn.tree import DecisionTreeClassifier,export_graphviz
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.datasets import load_breast_cancer


def plot_importances(model):
    n_feature=cancer.data.shape[1]
    plt.barh(range(n_feature),model.feature_importances_,align='center')
    plt.yticks(np.arange(n_feature),cancer.feature_names)
    plt.xlabel('特征重要性')
    plt.ylabel('特征')

plt.rcParams['font.sans-serif'] = ['SimHei']

cancer=load_breast_cancer()
X_train,X_test,y_train,y_test=train_test_split(
    cancer.data,cancer.target,stratify=cancer.target,random_state=42
)
tree=DecisionTreeClassifier(max_depth=4,random_state=0)
tree.fit(X_train,y_train)

plot_importances(tree)
plt.show()

可以看到，“worst radius” 是最重要的特征。

如果某个特征的feature_importance_很小，不代表这个特征没有提供任何信息，只能说明这个特征没有被树选中，可能是因为另一个特征也包含的同样的信息。

与线性模型的系数不同，决策树的特征重要性一定为正数。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1368572.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

微创新与稳定性的权衡

微创新与稳定性的权衡

之前做过一个项目，业务最高峰CPU使用率也才50%，是一个IO密集型的应用。里面涉及一些业务编排，所以为了提高CPU使用率，我有两个方案：一个是简单的梳理将任务可并行的采用并行流、额外线程池等方式做并行；另外…

阅读更多...

安科瑞ACX10S-YHW新能源智能电瓶车充电桩户外充电桩 ——安科瑞顾烊宇

安科瑞ACX10S-YHW新能源智能电瓶车充电桩户外充电桩 ——安科瑞顾烊宇

1.产品简介 ACX10S-YHW新能源智能电瓶车充电桩户外充电桩具有交流输出电源远程通断控制、充电安全控制、电度计量、按时计费功能于一体的交流供电装置，该装置能通过电动自行车的车配充电器为电动自行车充电。支付方式可选择刷卡、扫码使用，设备内部可…

阅读更多...

有什么不同种类的葡萄酒？

有什么不同种类的葡萄酒？

当大自然完成了它的工作，葡萄收获了，酒窖主人的任务就是把葡萄园里达到的高质量带给成品酒。《葡萄酒法》将优质葡萄酒分为三类，白葡萄酒、红葡萄酒和玫瑰红葡萄酒，葡萄品种和生产流程被精确定义。白葡萄酒新鲜，果香浓…

阅读更多...

STM32F103C8T6内部自带Bootloader模式之使用FlyMcu烧写程序

STM32F103C8T6内部自带Bootloader模式之使用FlyMcu烧写程序

简介实现自己的Bootloader前, 使用一下STM32内部自带的Bootloader对STM进行烧写步骤下载FlyMCU 参考普中STM32-PZ6806L 使用FlyMcu串口烧录程序 Boot选择 Boot0->1 , Boot1->0 进到系统存储器打开FlyMCU 1 选择串口波特率 2 选择程序 3 不需要使用辅助引脚 4 开…

阅读更多...

【Codelab】如此简单！一文带你学会 15 个 HarmonyOS JS 组件

【Codelab】如此简单！一文带你学会 15 个 HarmonyOS JS 组件

🧑‍🎓 个人主页：《爱蹦跶的大A阿》 🔥当前正在更新专栏：《VUE》、《JavaScript保姆级教程》、《krpano》目录 ✨ 前言工程代码的结构编辑页面构建及组件使用详解 homepage代码文件商品陈列页面 …

阅读更多...

工业异常检测AnomalyGPT-Demo试跑

工业异常检测AnomalyGPT-Demo试跑

写在前面：如果你有大的cpu和gpu可以使用，直接根据官方的安装说明就可以，如果没有，可以点进来试着看一下我个人的安装经验。一、试跑环境 NVIDIA4090显卡24g,cpu内存33G，交换空间8g,操作系统ubuntu22.04(试跑过程cpu…

阅读更多...

FDA食品接触材料测试项目接触

FDA食品接触材料测试项目接触

1. FDA介绍： 美国食品和药品管理局（FDA）负责监管食品接触材料，此类材料必须经过检测，确保达到食品接触安全标准。美国联邦法规（CFR）第21章对此类材料作出具体规定，并将此类材料视…

阅读更多...

spring boot 自动扫描Controller、Service、Component原理

spring boot 自动扫描Controller、Service、Component原理

项目里面为什么不加上ComponentScan("com.yym.*")注解，也能加载到子目录里面的Controller，Service，Component的bean呢？ 启动类没有ComponentScan注解 SpringBootApplication public class BootStrap {public static v…

阅读更多...

SpringMVC工作原理

SpringMVC工作原理

Spring MVC 概述 SpringMVC是一个基于MVC模式的Web框架，它是Spring Framework的一部分。SpringMVC主要用于在Java Web应用程序中实现Web层，提供了一套与平台无关的、可重用的Web组件。 Spring MVC是Spring框架提供的一个实现webMVC设计模式的轻量级框架…

阅读更多...

11.文件和异常

11.文件和异常

文件和异常实际开发中常常会遇到对数据进行持久化操作的场景，而实现数据持久化最直接简单的方式就是将数据保存到文件中。说到“文件”这个词，可能需要先科普一下关于文件系统的知识，但是这里我们并不浪费笔墨介绍这个概念，请大…

阅读更多...

Python自动化测试面试题分享（含答案）

Python自动化测试面试题分享（含答案）

1、如果页面元素经常发生需求变化，你是如何做? 利用po模式，业务逻辑和测试逻辑相分离，当某个页面经常发生变化只需要维护页面，包括元素定位表达式，封装业务方法；不需要修改测试逻辑； 页面经常…

阅读更多...

什么是SEO？SEO还存在吗？

什么是SEO？SEO还存在吗？

曾经火热的seo，至今为啥很少人知道呢？为啥说seo是曾经的火热，这还得从那时百度的算法来说起了，曾经的百度可以通过seo优化自己的网站来获得百度爬虫的爬取，从而在百度获得更高的排名和权重。现在我们打开百度随便搜索…

阅读更多...

C语言中常用的字符串函数（strlen、sizeof、sscanf、sprintf、strcpy）

C语言中常用的字符串函数（strlen、sizeof、sscanf、sprintf、strcpy）

C语言中常用的字符串函数文章目录 C语言中常用的字符串函数1 strlen函数2 sizeof函数2.1 sizeof介绍2.2 sizeof用法 3 sscanf函数3.1 sscanf介绍3.2 sscanf用法3.3 sscanf高级用法 4 sprintf函数4.1 背景4.2 sprintf用法 5 strcpy函数5.1 strcpy介绍5.1 strcpy用法 1 strlen函…

阅读更多...

【C语言题解】 | 572. 另一棵树的子树

【C语言题解】 | 572. 另一棵树的子树

572. 另一棵树的子树 572. 另一棵树的子树代码 572. 另一棵树的子树该题目需要判断一二叉树是否为另一二叉树的子树像此类，就不算是root的子树此题的思路为： 传入subRoot，与root相比较，判断二者是否相同若与root不相同&#…

阅读更多...

Java学习笔记-day02-Flowable基础API小结

Java学习笔记-day02-Flowable基础API小结

1.创建ProcessEngine 使用编码创建 Testpublic void processEngine01(){// 获取 ProcessEngineConfiguration 对象ProcessEngineConfiguration configuration new StandaloneProcessEngineConfiguration();// 配置相关的数据库的连接信息configuration.setJdbcDriver("…

阅读更多...

网安入门12-文件上传（黑白名单，00截断）

网安入门12-文件上传（黑白名单，00截断）

黑名单绕过 Pass-03 有的时候后端限制了一些黑名单，比如过滤后缀名.php 我们就可以用黑名单里没有的后缀名进行绕过，例如： 大小写：.phP .pHp .AsPphp1 .php2 .php3 .php9 .phtml（成功率较高）特殊文件名绕…

阅读更多...

TypeScript基础（三）扩展类型-接口和类型兼容性

TypeScript基础（三）扩展类型-接口和类型兼容性

✨ 专栏介绍 TypeScript是一种由微软开发的开源编程语言，它是JavaScript的超集，意味着任何有效的JavaScript代码都是有效的TypeScript代码。TypeScript通过添加静态类型和其他特性来增强JavaScript，使其更适合大型项目和团队开发。在TypeS…

阅读更多...

一文详解VScode 的远程开发

一文详解VScode 的远程开发

VS code登录服务器后进行编码和调试，VS code上的所有功能都可以使用，和在本地开发基本无区别。一、配置免密远程登录因为是要远程登录，那么需要通过使用ssh进行密钥对登录，这样每次登录服务器就可以不用输入密码了。先来一句官…

阅读更多...

【复习】人工智能第2章知识表示

【复习】人工智能第2章知识表示

一、知识的概念 （1）知识：把有关信息关联在一起所形成的信息结构。注：事实与规则的区别： 事实 —— “雪是白色的” 大自然自带的规则 —— “如果头痛且流涕，则有可能患了感冒” 有点推理意味的 &…

阅读更多...

服务器监控软件夜莺使用（二）

服务器监控软件夜莺使用（二）

文章目录一、采集器安装1. Categraf简介2. Categraf部署3. 测试服务器部署4. 系统监控插件5. 显卡监控插件6. 服务监控插件二、监控仪表盘1. 机器列表2. 系统监控3. 服务监控三、告警配置1. 邮件通知2. 告警规则3. 告警自愈一、采集器安装 1. Categraf简介 Categraf 需要…

阅读更多...

推荐文章

最新文章