2023大唐杯学习笔记——人工智能与机器学习—决策树

news2026/2/10 4:00:22

决策树知识点

在这里插入图片描述

这个表也是一个数据集
问题：以什么作为划分呢？第一次是以年龄，还是以工作房子信贷情况…
这里的熵与中文里的其他东西没有实际对应，就是一个定义
H（p）=1最大时，p=0.5，这表示既可能p1也可能是p2，两种可能性一样，或者说不确定性最大。
当H（p)减小时，p的值改变了，更加趋向于一个确定的可能
一般我们希望，熵越来越小，以得到一个确定的结果。

在这里插入图片描述

C1是选项C1的个数，C2是选项C2的个数…,D是所有选项的总数
在这里，以类别为例子，C1=类别为是的个数=9 ，C2=类别为否的个数=6 ，只有这两种C， D=总数=15
于是计算出数据集的熵 H(D)

在这里插入图片描述

我们想要的是条件熵，在给定数据集某一个条件X下的熵。
比如以年龄/工作/房子/信贷情况为条件，算出来的条件熵。这个条件熵越大，表示在这个条件下这个数据集越不确定。然后就可以以这个最不确定的条件作为第一个划分。

在这里插入图片描述

信息增益是知道了某个条件后，事件的不确定性下降的程度
图中的H（D1）就是给定A1为条件时的条件熵，即H(D|A1)
图中A3（房子）是最大的，可以说A3是不确定性最高，最适合做第一个划分点的
划分完后，将划分过来的数据集进行第二次划分，对划分过来的数据集再次进行计算，得到其中条件熵最大的特征，作为第二次的划分点
如此递归进行，直到所有数据都分到了叶子节点，或者定义一个深度进行到该深度后停止

在这里插入图片描述

算法解析

定义数据集

在这里插入图片描述

计算数据集的熵

在这里插入图片描述

数据集划分

在这里插入图片描述

输入数据集要划分的类型划分的参数

选择最优特征值

在这里插入图片描述

类别投票表决

在这里插入图片描述

训练一颗递归树

在这里插入图片描述

预测

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/623262.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

串口助手(串口发送接收数据, 定时, 清空, hex显示)

串口助手(串口发送接收数据, 定时, 清空, hex显示)

文章目录前言一、串口接收数据1. 默认接收，换行，hex显示2. 清空接收区数据3. 保存接受区数据二、串口发送数据1. 默认发送2. 定时发送三、串口助手优化1. 设置组合框当前内容。2. 未检测到串口，弹出警告。3. 载入文件总结前言这篇文章…

阅读更多...

ESP32-S3 使用指定 key 来进行 secure boot 签名并进行 OTA 测试

ESP32-S3 使用指定 key 来进行 secure boot 签名并进行 OTA 测试

文档说明 Secure Boot V2 测试准备： 硬件准备：ESP32-S3 开发板或模组软件准备：esp-idf v5.0 版本 SDK 测试步骤： 生成指定 secure boot 签名 key软件开启 secure boot 配置烧录被签名的固件对新的 app.bin 使用指定 key 进行…

阅读更多...

【006 Linux内核】应用程序中open()在linux中执行过程中是如何从用户空间到内核空间？

【006 Linux内核】应用程序中open()在linux中执行过程中是如何从用户空间到内核空间？

一、前言应用程序运行在用户空间，而 Linux 驱动运行于内核空间。当我们在用户空间想要实现对内核的操作，比如使用 open 函数打开/dev/led 这个驱动，由于用户空间不能直接对内核进行操作，因此必须使用一个叫做 “系统调用” 的方…

阅读更多...

论文阅读 (90)：Proposal-based Multiple Instance Learning (P-MIL, 2023CVPR)

论文阅读 (90)：Proposal-based Multiple Instance Learning (P-MIL, 2023CVPR)

文章目录 1 要点1.1 概述1.2 一些概念1.3 主要步骤 2 方法2.1 候选提案生成2.2 提案特征提取和分类2.2.1 周围对比特征提取2.2.2 分类头 2.3 提案微调2.3.1 提案完备性评估2.3.2 实例级秩一致性 2.4 网络训练和推理2.4.1 网络训练2.4.2推理 3 实验3.1 数据集即评估标准3.1.1 数…

阅读更多...

一线大厂Java 面试题大全1100+ 面试题附答案详解（2023最新整理）

一线大厂Java 面试题大全1100+ 面试题附答案详解（2023最新整理）

写在前面今年的面试比往年要难得多，各个互联网企业对于 Java 岗位的要求越来越多，也越来越高，主要是初级岗位已经趋近饱和，但高级岗位又相对来说缺乏，这类的人才偏少，因此作为 Java 开发人员，…

阅读更多...

【新星计划回顾】第四篇学习计划-自定义函数、存储过程、随机值知识点

【新星计划回顾】第四篇学习计划-自定义函数、存储过程、随机值知识点

🏆🏆时间过的真快，这是导师回顾新星计划学习的第四篇文章！ 最近这段时间非常忙，虽然导师首次参与新星计划活动已经在4月16日圆满结束，早想腾出时间来好好整理活动期间分享的知识点。 🏆&#x1…

阅读更多...

【TiDB Future App Hackathon 2023 】TiDB 首届全球黑客马拉松，开发者的狂欢夏日盛会！快来一起 Coding 吧！...

【TiDB Future App Hackathon 2023 】TiDB 首届全球黑客马拉松，开发者的狂欢夏日盛会！快来一起 Coding 吧！...

作者： Billmay表妹原文来源： https://tidb.net/blog/cf364859 2023 TiDB Future App Hackathon 来啦！本届 Hackathon 的主题为：Code, Innovate & Build Amazing Data Applications —— 释放你的创造力、构建突破性的应用…

阅读更多...

JS逆向之大众点评mtgsig

JS逆向之大众点评mtgsig

本教程仅限于学术探讨，也没有专门针对某个网站而编写，禁止用于非法用途、商业活动、恶意滥用技术等，否则后果自负。观看则同意此约定。如有侵权，请告知删除，谢谢！ 目录前言一、先分析下接口参数二、开导…

阅读更多...

不懂这个118358-80-8甘露糖丝氨酸？看看Fmoc-Ser(Ac4Manα)-OH的全面解析吧！

不懂这个118358-80-8甘露糖丝氨酸？看看Fmoc-Ser(Ac4Manα)-OH的全面解析吧！

Fmoc-Ser(Ac4Manα)-OH，甘露糖丝氨酸Product structure： Product specifications： 1.CAS No：118358-80-8 2.Molecular formula：C32H35NO14 3.Molecular weight：657.63 4.Packaging specification&#xff1…

阅读更多...

浅谈响应式网页设计 —— 测试该知道的二三事

浅谈响应式网页设计 —— 测试该知道的二三事

😏作者简介：博主是一位测试管理者，同时也是一名对外企业兼职讲师。 📡主页地址：【Austin_zhai】 🙆目的与景愿：旨在于能帮助更多的测试行业人员提升软硬技能，分享行业相关最新信息。…

阅读更多...

【LeetCode】每日一题 -- 1240. 铺瓷砖 -- Java Version

【LeetCode】每日一题 -- 1240. 铺瓷砖 -- Java Version

题目链接：https://leetcode.cn/problems/tiling-a-rectangle-with-the-fewest-squares/ 1. 题解（1240. 铺瓷砖） 23.05.31 华为机试第二题 1.1 暴力深搜 – DFS NP-Complete 问题题解参考：Java DFS暴力递归（详细注释&…

阅读更多...

LeetCode 2352. Equal Row and Column Pairs【模拟,哈希表,前缀树】中等

LeetCode 2352. Equal Row and Column Pairs【模拟,哈希表,前缀树】中等

本文属于「征服LeetCode」系列文章之一，这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁，本系列将至少持续到刷完所有无锁题之日为止；由于LeetCode还在不断地创建新题，本系列的终止日期可能是永远。在这一系列刷题文章…

阅读更多...

100G QSFP28光模块类型和使用场景

100G QSFP28光模块类型和使用场景

100G QSFP28光模块是当前数据中心和通信网络中广泛应用的高速光模块之一。本文将详细介绍100G QSFP28光模块的类型、应用场景以及市场发展前景，并引用相关产品参数和行业统计数据，为读者提供全面的了解。一、100G QSFP28光模块类型 100G QSFP28光模块…

阅读更多...

开源 API 网关的访问策略（一）

开源 API 网关的访问策略（一）

许多企业和组织面临着网关访问控制的挑战，因为传统的访问控制方法往往过于笨重和繁琐。这些方法可能涉及复杂的规则集、繁琐的手动配置过程、缺乏灵活性和可扩展性等问题。此外，随着云计算和移动设备的广泛应用，访问控制的复杂性和挑战程度也…

阅读更多...

stable-diffusion-webui 安装采坑日记

stable-diffusion-webui 安装采坑日记

这里写自定义目录标题安装容易采坑的点效果测试安装容易采坑的点 1、不愿安装大佬的整合包。在自己时间足够多的情况下，可以尝试自己搭环境。但是自己安装的时间成本真的非常高，环境配置报错会让人陷入崩溃，如果没有代码排错能力&#xff…

阅读更多...

sw2urdf导出的urdf文件中的惯性参数（inertial）错误的问题

sw2urdf导出的urdf文件中的惯性参数（inertial）错误的问题

现象描述有时候，当我们使用solidworks建好我们的模型，然后利用【sw2urdf】导出后，发现其中的惯性参数，似乎不正确，ixx、izz这些参数都是很接近0的： 资料查找其实这个不是我们设置的问题，而…

阅读更多...

蓝牙耳机什么牌子好？无线蓝牙耳机品牌推荐

蓝牙耳机什么牌子好？无线蓝牙耳机品牌推荐

相信很多人都有过这样的经历，早晚高峰像沙丁鱼般被挤在公交或地铁上，嘈杂的环境、工作的劳累让你只想听听音乐追追剧，给自己一些放松的时光。可拿出有线耳机却常常被挤掉，更有被扯到耳朵的时候。想换一款蓝牙耳机，但面…

阅读更多...

做连接中国企业出海的全球技术桥梁，亚马逊云科技出海日盛夏盛启

做连接中国企业出海的全球技术桥梁，亚马逊云科技出海日盛夏盛启

出海路漫漫，企业开拓全球市场而孤军奋战，常常会感到力不从心。好的产品有了，渠道有了，供应链有了，还要自己从0-1搭建存储、网络和架构？营销季来了想趁机冲一波销量，还要自己运维本地IDC、大促来…

阅读更多...

docker-compose 部署zookeeper集群 —— 筑梦之路

docker-compose 部署zookeeper集群 —— 筑梦之路

1. zookeeper介绍 Zookeeper是一个开源的分布式协调服务中间件，它提供了一种分布式数据管理服务，能够实现分布式锁、命名服务、配置管理、集群管理等功能，从而帮助用户构建高可用、高性能的分布式系统。以下是Zookeeper的一些主要特点和功能&…

阅读更多...

Java注解的入门学习

Java注解的入门学习

一、概念 Java注解是一种元数据形式，可以被添加到Java代码中的各种元素（类、方法、字段等）上，以提供关于这些元素的额外信息。注解是在Java 5中引入的一项特性，它们不直接影响代码的执行，而是提供了一种机…

阅读更多...

推荐文章

最新文章