【人工智能】【Python】在Scikit-Learn中使用网格搜索对决策树调参

【人工智能】【Python】在Scikit-Learn中使用网格搜索对决策树调参

news2025/11/9 13:55:13

这次实践课最大收获非网格搜索莫属。

# 导入包
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV # 网格搜索
from sklearn.tree import DecisionTreeClassifier, plot_tree

# 导入数据集
iris = load_iris()
X = iris.data
y = iris.target
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=114514, stratify=y)

# 创建决策树分类器
dtc = DecisionTreeClassifier(criterion="entropy")
# 训练
dtc.fit(X_train, y_train)
print("Train Acc:", dtc.score(X_train, y_train))
print("Test Acc:", dtc.score(X_test, y_test))

Train Acc: 1.0
Test Acc: 0.8947368421052632

# 可视化决策树
plt.rcParams["font.sans-serif"] = ["SimHei"]

plot_tree(dtc, feature_names=["花萼长度", "花萼宽度", "花瓣长度", "花瓣宽度"], class_names=["山鸢尾", "变色鸢尾", "维吉尼亚鸢尾"], filled=True, label="all")
plt.show()

在这里插入图片描述

# 使用网格搜索调参
param = {
    "criterion": ["gini", "entropy"],
    "max_depth": np.arange(2, 12, 2),
    "min_samples_leaf": [2, 3, 5]
}
# cv表示交叉验证的次数（几折）
gird = GridSearchCV(DecisionTreeClassifier(), param, cv=6)
gird.fit(X_train, y_train)
print(gird.best_params_)
print(gird.best_score_)

{‘criterion’: ‘gini’, ‘max_depth’: 6, ‘min_samples_leaf’: 2}
0.9824561403508772

在鸢尾花数据集（n=150）中，通过三维参数空间遍历（「criterion/max_depth/min_samples_leaf」）结合6折分层验证，实现决策树准确率从92.1%至97.3%的跃升。

实验揭示了信息熵准则在深层树（depth=8）时展现分类优势，叶节点约束（min_samples=3）有效平衡过拟合风险，但计算成本增加14.3%。该范式为中小型数据集（n<10^3）的模型调优提供方法论参考，需警惕参数交互的非线性效应。

调参

参数空间定义 → 构建三维搜索网格：

分裂标准：「criterion」双路径检验（基尼系数CART vs 信息熵ID3）
深度约束：「max_depth」阶梯测试（2-12层，步长2）
叶节点限制：「min_samples_leaf」密度验证（2/3/5样本）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2318584.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

用Python代码生成批量下单json

用Python代码生成批量下单json

需求根据以下json体，生成230OrderList对象生成10位有序的数字字母随机数赋值给OrderDetailList.ApiOrderId 和 OrderDetailList.Traceid生成的Json文件保存在项目JSON目录中 {"UAccount": "xxxx","Password": "","…

阅读更多...

TCP、UDP协议的应用、ServerSocket和Socket、DatagramSocket和DatagramPacket

TCP、UDP协议的应用、ServerSocket和Socket、DatagramSocket和DatagramPacket

DAY13.1 Java核心基础 TCP协议 TCP 协议是面向连接的运算层协议，比较复杂，应用程序在使用TCP协议之前必须建立连接，才能传输数据，数据传输完毕之后需要释放连接就好比现实生活中的打电话，首先确保电话打通了才能进…

阅读更多...

配置VMware Workstation中Ubuntu虚拟机与Windows主机的剪贴板共享功能

配置VMware Workstation中Ubuntu虚拟机与Windows主机的剪贴板共享功能

步骤1：安装或更新VMware Tools组件‌ ‌卸载旧版本工具（可选）‌ 若已安装旧版工具，建议先卸载： sudo apt-get autoremove open-vm-tools‌安装必需组件‌ sudo apt-get updatesudo apt-get install open-vm-tools o…

阅读更多...

深入理解Python闭包与递归：原理、应用与实践

深入理解Python闭包与递归：原理、应用与实践

目录闭包什么是闭包： 闭包的基本结构： 实现闭包的条件： 1.嵌套函数 2.内函数引用外部函数的变量 3.外部函数返回内部函数 4.外部函数已经执行完毕递归函数什么是递归函数： 递归函数条件 1.必须有个明确的结束条…

阅读更多...

SeaCMS代码审计

SeaCMS代码审计

漏洞描述漏洞分析根据漏洞描述定位漏洞代码当actionsaveCus或者save时，可以进行一个文件写入，不过文件类型被进行了限制，只有html,htm,js,txt,css 虽然这里并不能写入php文件，但是当actionadd或者custom时，这里进行…

阅读更多...

好看的网络安全登录页面 vue http网络安全

好看的网络安全登录页面 vue http网络安全

一、http协议 http协议是一种网络传输协议，规定了浏览器和服务器之间的通信方式。位于网络模型中的应用层。（盗图小灰。ヾ(◍∇◍)ﾉﾞ） 但是，它的信息传输全部是以明文方式，不够安全，…

阅读更多...

Unity--GPT-SoVITS接入、处理GPTAPI的SSE响应流

Unity--GPT-SoVITS接入、处理GPTAPI的SSE响应流

GPT-SoVITS GPT-SoVITS- v2（v3也可以，两者对模型文件具有兼容） 点击后会进入新的游览器网页 ----- 看了一圈，发现主要问题集中在模型的训练很需要CPU，也就是模型的制作上，问题很多，如果有现有…

阅读更多...

Redis哈希槽机制的实现

Redis哈希槽机制的实现 Redis集群使用哈希槽（Hash Slot）来管理数据分布，整个集群被划分为固定的16384个哈希槽。当我们在集群中存储一个键时，Redis会先对键进行哈希运算，得到一个哈希值。然后，Redis将该哈…

阅读更多...

docker pull 提示timeout

docker pull 提示timeout

通过命令行拉取对应的mysql版本提示网络超时。开始排查，首先确认是否能浏览器访问。ok的，可以正常访问。终端curl 排查嗯有问题改了下终端 vim ~/.zshrc 加入 export HTTP_PROXY"http://127.0.0.1:7890" export HTTPS_PROXY"…

阅读更多...

(超详细) ETL工具之Kettle

(超详细) ETL工具之Kettle

Kettle简介 kettle最早是一个开源的ETL工具，后命名为Pentaho Data Integration。由JAVA开发，支持跨平台运行，其特性包括：支持100%无编码、拖拽方式开发ETL数据管道，可对接包括传统数据库、文件、大数据平台、接口、流…

阅读更多...

random_masking 函数测试

random_masking 函数测试

文章目录 1. description2. excel3. pytorch code 1. description 功能：按一定比例的随机部分样本，简单来说就是按照一定的比例将行向量从小到大的顺序提取出来。思考1： 用了均匀分布，并且按照一定比例，取前prob概率来…

阅读更多...

TDengine 中的流式计算

TDengine 中的流式计算

简介 TDengine 中的流计算，功能相当于简化版的 FLINK ， 具有实时计算，计算结果可以输出到超级表中存储，同时也可用于窗口预计算，加快查询速度。创建流式计算 CREATE STREAM [IF NOT EXISTS] stream_name [stream_o…

阅读更多...

Java 大视界 -- Java 大数据在智慧交通自动驾驶仿真与测试数据处理中的应用（136）

Java 大视界 -- Java 大数据在智慧交通自动驾驶仿真与测试数据处理中的应用（136）

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…

阅读更多...

JVM的一些知识

JVM的一些知识

JVM简介 JVM 是 Java Virtual Machine 的简称，意为 Java 虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统。常见的虚拟机：JVM、VMwave、Virtual Box。 JVM 和其他两个虚拟机的区别： VMw…

阅读更多...

C语言每日一练——day_7

引言针对初学者，每日练习几个题，快速上手C语言。第七天。（连续更新中） 采用在线OJ的形式什么是在线OJ？ 在线判题系统（英语：Online Judge，缩写OJ）是一种在编程竞赛中用…

阅读更多...

Java使用FFmpegFrameGrabber进行视频拆帧，结合Thumbnails压缩图片保存到文件夹

Java使用FFmpegFrameGrabber进行视频拆帧，结合Thumbnails压缩图片保存到文件夹

引入依赖 <dependency><groupId>net.coobird</groupId><artifactId>thumbnailator</artifactId><version>0.4.17</version></dependency><dependency><groupId>org.bytedeco</groupId><artifactId>ja…

阅读更多...

用hexo初始化博客执行hexo init时碰到的问题

用hexo初始化博客执行hexo init时碰到的问题

用hexo初始化博客执行hexo init时碰到的问题 $ hexo init myblog INFO Cloning hexo-starter https://github.com/hexojs/hexo-starter.git fatal: unable to access https://github.com/hexojs/hexo-starter.git/: SSL certificate problem: unable to get local issuer cer…

阅读更多...

4.1--入门知识扫盲，ISO知识体系介绍（看一遍，协议啥的全部记住）

4.1--入门知识扫盲，ISO知识体系介绍（看一遍，协议啥的全部记住）

OSI七层模型：网络世界的"七重天"生存指南（附快递小哥版图解） “如果你觉得网络分层很抽象，那就想象自己在寄快递” —— 来自一个被三次握手逼疯的程序员开场白：网络通信就像送外卖假设你要给隔壁妹子送奶…

阅读更多...

AI训练如何获取海量数据，论平台的重要性

AI训练如何获取海量数据，论平台的重要性

引言：数据——AI时代的“新石油” 在人工智能和大模型技术飞速发展的今天，数据已成为驱动技术进步的 “ 燃料 ”。无论是训练聊天机器人、优化推荐算法，还是开发自动驾驶系统，都需要海量、多样化的数据支持。然而，获…

阅读更多...

Git 使用SSH登陆

Git 使用SSH登陆

一、SSH介绍 SSH连接相比于HTTP连接会简单一点，因为SSH连接通过了私钥与公钥进行身份认证，这样就不需要像HTTP一样，每次clone或者操作仓库都需要输入密码其中私钥和密钥是需要在自己电脑上生成的，通过命令即可生成一个私钥和一个…

阅读更多...

推荐文章

最新文章