【机器学习西瓜书学习笔记——模型评估与选择】

【机器学习西瓜书学习笔记——模型评估与选择】

news2026/2/8 13:25:16

机器学习西瓜书学习笔记【第二章】

第二章模型评估与选择
- 2.1训练误差和测试误差
- - - 错误率
    - 误差
- 欠拟合和过拟合
- 2.2评估方法
- - - 留出法
    - 交叉验证法
    - 自助法
- 2.3性能度量
- - 查准率、查全率与F1
  - - 查准率
    - 查全率
    - F1
  - P-R曲线
  - ROC与AUC
  - - ROC
    - AUC
  - 代价敏感错误率与代价曲线
  - - 代价曲线
- 2.4比较检验
- - 假设检验（二项检验）

第二章模型评估与选择

2.1训练误差和测试误差

错误率

在分类任务中，通常把错分的样本数占样本总数的比例称为错误率。比如：m个样本有a个预测错了，错误率就是 E = a/m；与错误率相对的 1 - a/m 称为精度。

误差

我们通常会把学习器的实际预测输出与样本的真实输出之间的差异称为误差。学习器在训练集上的误差称为训练误差或者经验误差。而在新样本上的误差则称为泛化误差或者测试误差。

训练误差

泛化误差（测试误差）

欠拟合和过拟合

欠拟合：模型对训练数据的拟合程度不足或不够好的情况。
过拟合：模型过度学习了训练数据中的噪声和细节，导致对训练样本的拟合过于精确。

2.2评估方法

留出法

①直接将数据集D划分为两个互斥的集合。

②注意训练集和测试集同分布

③进行多次随机划分，训练出多个模型，最后取平均值

交叉验证法

①原始数据分为K份，K-1份作为训练集，甚于的作为测试集。

②K-1部分训练模型，对所有的测试结果取平均值。

自助法

①从原始数据集中随机选择n个样本构成一个新的数据集。
②使用新的数据集训练模型。
③使用原始数据集测试模型，计算模型的各项性能指标，再对每个性能指标取平均值和标准偏差。

2.3性能度量

查准率、查全率与F1

查准率

①预测结果中真正例（TP）占所有预测结果中正例（TP+FP）的比例。

②公式：Precision = TP / (TP + FP)

③查准率越高，说明模型预测结果中真正例的比例越高，模型对于正样本的识别能力越强。

查全率

①预测结果中真正例（TP）占所有实际正例（TP+FN）的比例。

②公式为：Recall = TP / (TP + FN)。

③查全率越高，说明模型能够成功预测出的正样本比例越高，模型的识别能力越全面。

F1

①查准率和查全率的调和均值，用于综合评价模型的性能。

②公式为：F1 = 2 * (Precision * Recall) / (Precision + Recall)。

③F1值越高，说明模型在准确性和可靠性方面的表现都较好。

P-R曲线

查准率和查全率是一对矛盾的度量.一般来说，查准率高时，查全率往往偏低;而查全率高时,查准率往往偏低。

以查准率为纵轴、查全率为横轴作图,就得到了查准率-查全率曲线,简称**“P-R曲线”**，显示该曲线的图称为“P-R图”.

ROC与AUC

ROC曲线和AUC常被用来评价一个二值分类器的优劣。

ROC

它通过将真正例率和假正例率作为横纵坐标来描绘分类器在不同阈值下的性能。

AUC

进行学习器的比较时，与P-R 图相似。

若一个学习器的 ROC 曲线被另个学习器的曲线完全“包住”，则可断言后者的性能优于前者; 若两个学习器的 ROC 曲线发生交叉，则难以一般性地断言两者孰优敦劣。此时如果一定要进行比较.则较为合理的判据是比较 ROC 曲线下的面积即AUC。

代价敏感错误率与代价曲线

代价曲线

目的：对于一个模型，根据p不同，找到使得代价总期望最小的模型的阈值。

横轴：归一化的整改率代价期望。

纵轴：归一化的总代价期望。

2.4比较检验

评估学习性能的因素：泛化能力、测试集的选择、算法的随机性。

假设检验（二项检验）

泛化错误率e，是指学习器在一般情况下，对一个样本分类出错的概率（实际无法得知它的准确值）
测试错误率e ′ ，即学习器在测试一个m大小的样本集时恰好有e ′ m 个样本被分错类了（一般情况下只能获得这个值）

假设检验的方法就是用e’估计e的值。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1962047.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

VSCode+Vue3无法找到模块“../components/xxxxx.vue”的声明文件的错误

VSCode+Vue3无法找到模块“../components/xxxxx.vue”的声明文件的错误

莫名奇妙的错误今天用Vue3写个demo，在components下面新建了一个DeviceList.Vue的文件，在HomeView引用它后居然报错，提示：无法找到模块“…/components/DeviceList.vue”的声明文件，真是离了个大谱，文件明…

阅读更多...

【Redis】拓展：Redis - BigKey方案探讨

【Redis】拓展：Redis - BigKey方案探讨

BigKey: 用户越多，redis数据越多，bigkey会使得缓存数据更大，网络带宽会被占用，执行效率就低下，高并发的时候吞吐量QPS也会下降。产生原因： 看如下list： 一个key的内容太大，比如1M&…

阅读更多...

VR舒适度术语表与检查表：为MR和空间计算应用创业者准备

VR舒适度术语表与检查表：为MR和空间计算应用创业者准备

随着混合现实（MR）和空间计算应用的发展，确保用户在虚拟环境中的舒适度变得尤为重要。本文将介绍一套专门针对VR舒适度的术语表，并提供两个知名VR游戏作为示例，来展示如何应用这些术语。这些术语和示例可以帮助开发者更…

阅读更多...

基于Hadoop的服装电商数据分析系统【Hdfs、flume、HIve、sqoop、MySQL、echarts】

基于Hadoop的服装电商数据分析系统【Hdfs、flume、HIve、sqoop、MySQL、echarts】

文章目录有需要本项目的代码或文档以及全部资源，或者部署调试可以私信博主项目介绍总体研究方向数据集介绍配置flume文件HIve建表HIveSQL大数据分析MySQL建表Sqoop命令导出数据到MySQL数据可视化店铺销售情况.......等总结每文一语有需要本项目的代码或文档以及全…

阅读更多...

【面向就业的Linux基础】从入门到熟练，探索Linux的秘密（十四）-租云服务器及配环境、docker基本命令

【面向就业的Linux基础】从入门到熟练，探索Linux的秘密（十四）-租云服务器及配环境、docker基本命令

主要介绍了租云服务器和docker配置、基本命令！！！ 文章目录前言一、云平台二、租云服务器及安装docker 1.阿里云 2.安装docker 三、docker命令将当前用户添加到docker用户组镜像（images） 容器(container) 四、实战…

阅读更多...

Vue3-18 组件基础

Vue3-18 组件基础

组件的定义我们在项目的src/components种定义组件，vue提供了几种简单的组件的定义方式在单文件种定义组件 <script setup> import { ref } from vue const count ref(0) </script> <template><div>第一种<button click"count…

阅读更多...

系统测试：验证系统整体行为的关键环节

系统测试：验证系统整体行为的关键环节

目录前言1. 系统测试的概念2. 系统测试的主要作用2.1 验证需求实现2.2 发现集成问题2.3 提高系统质量2.4 评估系统性能 3. 系统测试在整个测试过程中的地位3.1 单元测试3.2 集成测试3.3 系统测试3.4 验收测试 4. 常用的系统测试工具4.1 Selenium4.2 JMeter4.3 LoadRunner4.4 T…

阅读更多...

高等数学第七讲一元函数积分学的概念和性质_不定积分_定积分_变限积分_反常积分

高等数学第七讲一元函数积分学的概念和性质_不定积分_定积分_变限积分_反常积分

1.不定积分文章目录 1.不定积分1.1 原函数1.1.1 原函数与不定积分的定义1.1.2 原函数存在定理 2.定积分2.1 定积分的定义2.2 定积分的精确定义2.3 定积分的几何意义2.4 定积分的存在定理2.5 定积分的性质 3.变限积分3.1 变限积分的定理3.2 变限积分的性质 4.反常积分(待更新) …

阅读更多...

springboot集团门户网站--论文源码调试讲解

springboot集团门户网站--论文源码调试讲解

第2章开发环境与技术开发集团门户网站需要搭建编程的环境，也需要通过调查，对各个相关技术进行分析，选取适合本系统开发的技术与工具。 2.1 MySQL数据库 MySQL是一种具有安全系数、安全系数、混合开发性、高效化等特征的轻量关联数据库智…

阅读更多...

2024.07纪念一 debezium ： spring-boot结合debezium

2024.07纪念一 debezium ： spring-boot结合debezium

使用前提： 一、mysql开启了logibin 在mysql的安装路径下的my.ini中【mysqlid】下添加 log-binmysql-bin # 开启 binlog binlog-formatROW # 选择 ROW 模式 server_id1 # 配置 MySQL replaction 需要定义，不要和 canal 的 slaveId 重复参考gitee的项目…

阅读更多...

mysql超大分页问题处理~

mysql超大分页问题处理~

大家好，我是程序媛雪儿，今天咱们聊mysql超大分页问题处理。超大分页问题是什么？ 数据量很大的时候，在查询中，越靠后，分页查询效率越低例如 select * from tb_sku limit 0,10; select * from tb_sku lim…

阅读更多...

专治408开始的晚！8月一定要完成这些事！

专治408开始的晚！8月一定要完成这些事！

八月份才开始408，那到考试最多也只有4-5个月的时间别担心，可以复习两轮！ 其实我一直建议大家408复习三轮，但是如果时间不够，那就要在复习质量上下功夫！ 考408有一个好处，就是不用先确定学校…

阅读更多...

【错误总结】Ubuntu系统中执行 sudo apt-get update报错

【错误总结】Ubuntu系统中执行 sudo apt-get update报错

Ubuntu系统中执行 sudo apt-get update报错命令行描述升级sudo报错并解决错误描述错误解决原因1：系统网络问题原因2：设置清华源后/etc/apt/sources.list不匹配原因3：ubuntu自带的源/etc/apt/sources.list有问题 apt-get update成功log参考 …

阅读更多...

【Story】《程序员面试的“八股文”辩论：技术基础与实际能力的博弈》

【Story】《程序员面试的“八股文”辩论：技术基础与实际能力的博弈》

目录程序员面试中的“八股文”：助力还是阻力？1. “八股文”的背景与定义1.1 “八股文”的起源1.2 “八股文”的常见类型 2. “八股文”的作用分析2.1 理论基础的评价2.1.1 助力2.1.2 阻力 3. 实际工作能力的考察3.1 助力3.2 阻力 4. 面试中的背题能力4.…

阅读更多...

利用代理IP助力社媒营销的指南来了！

利用代理IP助力社媒营销的指南来了！

文章目录前言一、有效数据收集二、建立流量矩阵三、精准定制内容选择正确的代理类型定时监测和更新代理IP遵守平台政策总结前言在当今数字化时代，社交媒体营销已成为企业推广品牌、增强用户互动不可或缺的一环。从本质上看，社媒营销是公共关系和客户…

阅读更多...

借助 NGINX 对本地的 Kubernetes 服务进行自动化的 TCP 负载均衡

借助 NGINX 对本地的 Kubernetes 服务进行自动化的 TCP 负载均衡

原文作者：Chris Akker - F5 技术解决方案架构师，Steve Wagner - F5 NGINX 解决方案架构师原文链接：借助 NGINX 对本地的 Kubernetes 服务进行自动化的 TCP 负载均衡转载来源：NGINX 中文官网 NGINX 唯一中文官方社区 &#xff0c…

阅读更多...

Windows11安装MongoDB7.0.12详细教程

Windows11安装MongoDB7.0.12详细教程

下载地址：https://www.mongodb.com/try/download/community 我使用的是迅雷下载： 安装选择自定义安装： 选择安装目录： 开始安装： 这个玩意会卡比较长的时间： 最后这一步如果没有科学上网&#…

阅读更多...

虾皮笔试0620-选择题

虾皮笔试0620-选择题

虚拟存储的基础是程序局部性理论，它的基本含义是程序执行时对内存访问的不均匀性。这一理论具体体现在两个方面： 时间局部性：时间局部性是指如果程序中的某个数据项被访问，那么在不久的将来它可能再次被访问。这通常是因为程序存在…

阅读更多...

thinkphp框架远程代码执行

thinkphp框架远程代码执行

一、环境 vulfocus网上自行下载启动命令： docker run -d --privileged -p 8081:80 -v /var/run/docker.sock:/var/run/docker.sock -e VUL_IP192.168.131.144 8e55f85571c8 一定添加--privileged不然只能拉取环境首页不显示二、thinkphp远程代码执行首页&a…

阅读更多...

【吊打面试官系列-Dubbo面试题】Dubbo SPI 和 Java SPI 区别？

大家好，我是锋哥。今天分享关于【Dubbo SPI 和 Java SPI 区别？】面试题，希望对大家有帮助； Dubbo SPI 和 Java SPI 区别？ JDK SPI JDK 标准的 SPI 会一次性加载所有的扩展实现，如果有的扩展吃实话很耗时&…

阅读更多...

推荐文章

最新文章