DataWhale-吃瓜教程学习笔记 (五）

DataWhale-吃瓜教程学习笔记 (五）

news2026/2/14 22:00:55

学习视频：第4章-决策树_哔哩哔哩_bilibili
西瓜书对应章节：第四章 4.1；4.2

决策树算法原理

- 逻辑角度

if...else.. 语句的组合，不断的选择

- 几何角度

根据某种准则划分特征空间

最终目的：提高分类样本的纯度

ID3 决策树

- 自信息

- 信息熵（自信息的期望）

其中 X 作为随机变量，假设可能有 a, b, c 3种可能的状态：

p（a|b|c)=1 是最确定的，信息熵最小
p(a) = p(b) = p© 时可能性相同， X是最不确定的，信息熵最大

将样本类别标记视作随机变量，各个类别在样本集合中的占比视作各类别取值的概率，此时信息熵的 不确定性 可以转化为 集合内样本的纯度

- 条件熵（ Y 的信息熵关于概率分布 X 的期望）

在已知 X 后 Y 的不确定性

- 信息增益

已知属性特征 a 的取值后， y 的不确定减少的量

- ID3 决策树

以信息增益为准则选择划分属性的决策树

- 问题

信息增益可能对取值数目多的属性有偏好（比如编号）

C4.5决策树

- 增益率

– 属性固有值

a 可能取值的个数 V 越多，则通常其固有值 IV（a）越大

- 缺点

增益率可能对取值数目少的属性有偏好

C45算法 并未完全使用 “增益率”替代 “信息增益”。采用启发式算法：先选出信息增益高出平均水平的属性，然后从中选择增益率最高的。

CART 决策树

- 基尼值

从样本集合D中随机抽取两个样本，其类别标记不一致的概率

- 属性的基尼指数

- CART 决策树的实际构造算法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1876270.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Qt开发笔记：Qt3D三维开发笔记（一）：Qt3D三维开发基础概念介绍

Qt开发笔记：Qt3D三维开发笔记（一）：Qt3D三维开发基础概念介绍

若该文为原创文章，转载请注明原文出处本文章博客地址：https://blog.csdn.net/qq21497936/article/details/140059315 长沙红胖子Qt（长沙创微智科）博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、O…

阅读更多...

java第二十九课 —— 断点 | 零钱通项目

java第二十九课 —— 断点 | 零钱通项目

断点调试（debug） 实际需求在开发中，新手程序员在查找错误时，这时老程序员就会温馨提示，可以用断点调试步一步的看源码执行的过程，从而发现错误所在。重要提示：在断点调试过程中，…

阅读更多...

如何安装和卸载软件？

如何安装和卸载软件？

如何安装和卸载软件？ 💻 如何安装和卸载软件？——默语的详细教程摘要引言正文内容🖥️ 在Windows上安装和卸载软件安装软件卸载软件 🍏 在Mac上安装和卸载软件安装软件卸载软件 🤔 QA环节📝 表格…

阅读更多...

【nvm】如何使用nvm优雅的管理Node.js

【nvm】如何使用nvm优雅的管理Node.js

希望文章能给到你启发和灵感～ 如果觉得文章对你有帮助的话，点赞关注收藏支持一下博主吧～ 阅读指南开篇说明一、基础环境说明1.1 硬件环境1.2 软件环境二、什么是nvm?2.1 概念2.1 安装2.1.1 对于Mac系统2.1.2 对于Windows系统2.1.3 对于…

阅读更多...

完全离线的本地问答模型LocalGPT如何实现无公网IP远程连接提问

完全离线的本地问答模型LocalGPT如何实现无公网IP远程连接提问

文章目录前言环境准备1. localGPT部署2. 启动和使用3. 安装cpolar 内网穿透4. 创建公网地址5. 公网地址访问6. 固定公网地址前言本文主要介绍如何本地部署LocalGPT并实现远程访问，由于localGPT只能通过本地局域网IP地址端口号的形式访问，实现远程访问…

阅读更多...

基于OrangePi AIpro + owncloud 5分钟搭建一个私有网盘

基于OrangePi AIpro + owncloud 5分钟搭建一个私有网盘

OrangePi AIpro自带镜像系统已预装了docker，这里我们直接基于docker安装owncloud。准备切换用户： HwHiAiUser 默认密码：Mind123 su HwHiAiUser 创建文件夹 sudo mkdir /home/SummerGao/owncloud-docker-server 切换至刚创建的文件夹下…

阅读更多...

使用 Compose Multiplatform Media Player 实现跨平台媒体播放

使用 Compose Multiplatform Media Player 实现跨平台媒体播放

使用 Compose Multiplatform Media Player 实现跨平台媒体播放在跨平台开发中，媒体播放功能是一个常见且重要的需求。Compose Multiplatform Media Player 是一个专为 Compose Multiplatform 项目设计的强大媒体播放器库，它可以在 iOS 和 Android 平台上无缝实现视频播放、…

阅读更多...

Prism 目录方式加载插件，提示`xxx.resources.dll`找不到

Prism 目录方式加载插件，提示`xxx.resources.dll`找不到

问题场景前置条件使用Prism 实现的目录配置方式加载插件； 有两个模块插件：ModuleA 以及 MouduleB。问题现象独立项目作为插件被加载时，加载指定模块中的用户控件，程序能正常运行，点击模块进行加载。但输出窗…

阅读更多...

cartographer从入门到精通（一）：cartographer介绍

cartographer从入门到精通（一）：cartographer介绍

一、cartographer重要文档有关cartographer的资料有2个比较重要的网站，我们的介绍也是基于这两个网站，其中会加入自己的一些理解，后续也有一些对代码的修改，来实现我们想完善的功能。 1-Cartographer 2-Cartographer ROS 第1个…

阅读更多...

Python 面试【★★★★★】

Python 面试【★★★★★】

欢迎莅临我的博客 💝💝💝，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:「stormsha的主页」…

阅读更多...

STM32第九课：DHT11温湿度传感器

STM32第九课：DHT11温湿度传感器

文章目录需求一、DHT11温湿度传感器二、模块配置流程1.配置时钟和IO2.读取数据3.数据处理三、导入语音模块四、关键代码总结需求 1.完成DHT11温湿度检测模块的配置。 2.处理DHT11获取的数据，在串口打印处理后的实时数据。 2.通过Su-03t语音识别模块实现实时温湿…

阅读更多...

WLAN 4-Way Handshake如何生成GTK？

WLAN 4-Way Handshake如何生成GTK？

关于Wi-Fi的加密认证过程，可以参考如下链接，今天我们来理解如何生成GTK。 WLAN数据加密机制_tls加密wifi-CSDN博客 1 GTK GTK（Group Temporal Key）是由AP通过GMK生成，长度为128位，并在四次握手的第三步中…

阅读更多...

哈尔滨高校大学智能制造实验室数字孪生可视化系统平台项目的验收

哈尔滨高校大学智能制造实验室数字孪生可视化系统平台项目的验收

哈尔滨高校大学智能制造实验室数字孪生可视化系统平台项目的验收，标志着这一技术在教育领域的应用取得了新的突破。项目旨在开发一个数字孪生可视化系统平台，用于哈尔滨高校大学智能制造实验室的设备模拟、监测与数据分析。项目的主要目标包括&#xff1…

阅读更多...

$数据结构_线性表$

数据结构_线性表

线性表的定义和特点线性表是具有相同特性的数据元素的一个有限序列 :线性起点/起始节点 :的直接前驱 :的直接后继 :线性终点/终端节点 n:元素总个数,表长下标:是元素的序号,表示元素在表中的位置 n0时称为空表线性表由n(n>0)个数据元素(结点),组成的有限序列将…

阅读更多...

Quantlab5.0：一切围绕可实盘策略驱动开发

Quantlab5.0：一切围绕可实盘策略驱动开发

原创文章第573篇，专注“AI量化投资、世界运行的规律、个人成长与财富自由"。 2024年上半年即将结束，开始准备星球下半年的工作。目前设想的——Quantlab5.0，之所以升级一个大版本，与4.x有很大不同。 5.0专注策略开发&…

阅读更多...

负载均衡器有什么用？

负载均衡器有什么用？

负载均衡器有什么用？ 负载均衡器是一种在多个服务器之间分配网络或应用程序流量的设备或软件应用程序。其主要目的是确保没有一台服务器承担过多的需求，从而提高应用程序的响应速度和可用性。在计算机发展的早期，负载均衡是一个手动过程。…

阅读更多...

【Sublime】Sublime Text 中运行终端

【Sublime】Sublime Text 中运行终端

Sublime Text 本身并不是一个终端仿真器，可以使用插件来在 Sublime Text 中集成终端功能。最常用的插件之一是“Terminal”。使用“Terminal”插件在 Sublime Text 中启动终端以下是安装和使用该插件的步骤： 安装 Package Control： 如果你…

阅读更多...

【自动驾驶汽车通讯协议】深入理解PCI Express（PCIe）技术

【自动驾驶汽车通讯协议】深入理解PCI Express（PCIe）技术

文章目录 0. 前言1. PCIe简介1.1 PCIe外观1.2 PCIe的技术迭代 2. PCIe的通道（lane）配置2.1 通道配置详解2.2 通道配置的影响 3. PCIe的架构3.1 架构层次3.2 核心组件 4. PCIe的特性5. PCIe在自动驾驶中的应用 0. 前言按照国际惯例，首先声明&…

阅读更多...

mybatis框架介绍 , 环境的搭建和代码实现

mybatis框架介绍 , 环境的搭建和代码实现

1.mybatis框架介绍 mybatis框架介绍 mybatis是Apache软件基金会下的一个开源项目，前身是iBatis框架。2010年这个项目由apache 软件基金会迁移到google code下，改名为mybatis。2013年11月又迁移到了github(GitHub 是一个面向开源及私有软件项目的托管平…

阅读更多...

40V 60V 80V 100V 400V高压LDO三端稳压器选择,技术参数

40V 60V 80V 100V 400V高压LDO三端稳压器选择,技术参数

40V 60V 80V 100V 400V高压LDO三端稳压器选择,技术参数

阅读更多...

推荐文章

最新文章