机器学习---经验误差与过拟合、方差与偏差、性能度量、比较检验

机器学习---经验误差与过拟合、方差与偏差、性能度量、比较检验

news2025/7/18 3:12:24

1. 经验误差与过拟合

第三张图建立的模型，在训练集中通过x可以很好的预测y，然而我们不能预期该模型能够很好的预

测集外的数据，换句话说，这个模型没有很好的泛化能力。

第一张图建立了一个线性模型，但是该模型并没有精确地捕捉到训练集数据的结构，我们称具有第

一张图较大的偏倚（bias），也称欠拟合。

第三张图通过5次多项式函数很好的对样本进行了拟合，然而，如果将建立的模型进行泛化，并不

能很好的对训练集之外的数据进行预测，也称过拟合。

机器学习的主要挑战在于在未见过的数据输入上表现良好，这个能力称为泛化能力

（generalization）。

误差：学习器实际预测输出与样本真实输出的差异。

训练集误差：训练误差

训练集的补集：泛化误差

测试集误差：测试误差

我们希望得到泛化误差小的学习器。

过拟合：训练过度使泛化能力下降。

欠拟合：未能学好训练样本的普遍规律。

过拟合是机器学习的关键障碍，且不可避免。

模型误差包含了数据误差，或者说模型信息中包含了噪声。

过拟合的例子：比如在考试之前，有人采取题海战术，把每个题目都背下来，但是题目变化就答

不上来，因为这种方法并没有抽象出一般的规则。

训练集S和测试集T组成数据集D。

假设测试样本是从真实分布中采样而得，避免因数据划分引入偏差。

测试集应与训练集互斥。

学习器泛化评估的测试方法：

2. 方差与偏差

想象你开着一架直升机，攻击地面上一只敌军部队，于是你连打数十梭子，结果有一下几种情况：

1. 子弹基本上都打在队伍经过的一棵树上了，这就是方差小（子弹打得很集中），偏差大（跟目的

相距甚远）。

2. 子弹打在了树上，石头上，花花草草也都中弹，但是敌军安然无恙，这就是方差大（子弹到处都

是），偏差大（同1）。

3. 子弹打死了一部分敌军，但是也打偏了些打到花花草草了，这就是方差大（子弹不集中），偏差

小（已经在目标周围了）。

4. 子弹一颗没浪费，每一颗都打死一个敌军，跟抗战神剧一样，这就是方差小（子弹全部都集中在

一个位置），偏差小（子弹集中的位置正是它应该射向的位置）.

3. 性能度量

性能度量（performance measure）：衡量模型泛化能力的评价标准。

回归：均方误差

分类：错误率和精度

混淆矩阵（confusion matrix）：

查准率P与查全率R：

P-R曲线面积与平衡点：

F1度量：

ROC(受试者工作特征曲线）：

考虑ROC曲线图中的四个点和一条线。（见下图）

第一个点，（0，1），即FPR＝0，TPR＝1，这意味着FN（false negative）＝0，并且FP

（false positive）＝0。这是一个完美的分类器，它将所有的样本都正确分类。

第二个点，（1，0），即FPR＝1，TPR＝0，类似地分析可以发现这是一个最糟糕的分类器，因

为它成功避开了所有的正确答案。

第三个点，（0,0），即FPR＝TPR＝0，即FP（false positive）＝TP （true positive）＝0，可以

发现该分类器预测所有的样本都为负样本（negative）。

第四个点（1，1），分类器实际上预测所有的样本都为正样本。

经过以上的分析，我们可以断言，ROC曲线越接近左上角，该分类器的性能越好。

根据下图，将每个测试样本属于正样本的概率值从大到小排序。图中共有20个测试样本，“Class”

一栏表示每个测试样本真正的标签（p表示正样本，n表示负样本），“Score”表示每个测试样本属

于正样本的概率。

接下来，从高到低，依次将“Score”值作为阈值。

当测试样本属于正样本的概率大于或等于这个阈值时，我们认为它为正样本，否则为负样本。

举例来说，对于图中的第4个样本，其“Score”值为0.6，那么样本1，2，3，4都被认为是正样本，

因为它们的“Score”值都大于等于0.6，而其他样本则都认为是负样本。

每次选取一个不同的阈值，我们就可以得到一组FPR和TPR，即ROC曲线上的一点

4. 比较检验

统计假设检验（hypothesis test）：根据测试错误率估计推断泛化错误率的分布。

提出假设→找到符合某种概率分布的中间变量→利用该概率分布确定在某个置信度（confidence）

下是否接受该假设。

单个学习器的情况：

做了多次留出法或者交叉验证法之后，会有多个测试误差率，此时使用”t检验“（t-test）来检验单

个学习。

根据预先设定的显著度α，以及自由度k-1，查表可得临界值b，如果Tt小于临界值b则接受，否则，

拒绝。

一个数据集多个学习器：

对一组样本D，进行k折交叉验证，会产生k个测试误差率，将两个学习器都分别在每对数据子集上

进行训练与测试，会分别产生两组测试误差率，对每对结果求差值。若两个学习器的性能相同，则

相对应的两个误差率的差值应该为0。先计算出差值的均值μ与方差σ^2，在显著度α下，若变量根

据预先设定的显著度α，以及自由度k-1，查表可得临界值b，若Tt小于临界值则接受，否则拒绝。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/777574.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

PHP中常用数组排序算法

PHP中常用数组排序算法

一：冒泡排序 1：算法步骤比较相邻项的值，如果前者比后者大，交换顺序。进行一轮比较后，最后一个值为最大的值。进行下一轮比较，比上次少比较一项。以此类推，比较剩下最后一项的时候&#…

阅读更多...

【Hive】group by 分组聚合后使用窗口函数

【Hive】group by 分组聚合后使用窗口函数

文章目录 1. group by 分组聚合后使用排序窗口函数1.1 两种思路与简单例子1.2 新思路的解释 2. group by 分组聚合后使用聚合窗口函数3. group by 分组聚合后使用分析窗口函数 1. group by 分组聚合后使用排序窗口函数 1.1 两种思路与简单例子 group by 之后，…

阅读更多...

AI时代带来的图片造假危机，该如何解决

AI时代带来的图片造假危机，该如何解决

一、前言当今，图片造假问题非常泛滥，已经成为现代社会中一个严峻的问题。随着AI技术不断的发展，人们可以轻松地通过图像编辑和AI智能生成来篡改和伪造图片，使其看起来真实而难以辨别，之前就看到过一对硕士夫妻为了骗…

阅读更多...

【Linux】进程信号 -- 信号保存与递达 | 信号捕捉 | 僵尸进程的信号处理方法

【Linux】进程信号 -- 信号保存与递达 | 信号捕捉 | 僵尸进程的信号处理方法

阻塞信号信号相关概念内核中的表示sigset_t信号集操作函数sigprocmasksigpending 小实验 - 观察pending表信号的捕捉流程sigaction1.小实验：如果进程在处理2号信号，那我们继续发送2号信号会怎么样？2.如何正在处理这个信号，同时屏…

阅读更多...

js - 关于防抖和节流函数的使用和细节

js - 关于防抖和节流函数的使用和细节

文章目录一、什么是防抖二、应用场景三、实现原理1，第一个问题：为什么使用了闭包（也就是说timer为什么定义到了外面）2，第二个问题：防抖函数中this的指向问题： 四、节流函数一、什么是防抖事…

阅读更多...

【【51单片机的I2C总线】】

【【51单片机的I2C总线】】

51单片机的I2C总线学会总线，掌控芯片。了解串口，真理全有。 I２C时序 １.起始条件：　 SCL在高电平期间，SDA从高电平切换到低电平终止条件： SCL在高电平期间，SDA从低电平切换为高电…

阅读更多...

【go语言学习笔记】01 Go语言快速入门

【go语言学习笔记】01 Go语言快速入门

文章目录一、基础入门1. 示例程序2. 安装与环境变量设置3. 项目构建和编译发布3.1 go build和go install对比3.2 跨平台编译二、数据类型1. 基础类型1.1 整型1.2 浮点数1.3 布尔型1.4 字符串1.5 零值 2. 变量2.1 变量声明2.1.1 指定变量类型2.1.2 根据值自行判定变量类型2.1.…

阅读更多...

深入学习 Redis - 深挖经典数据类型之 list

深入学习 Redis - 深挖经典数据类型之 list

目录前言一、list 类型 1.1、操作命令 lpush / rpush（插入元素） lrange（查看范围元素） lpushx / rpushx （有约束的插入） lpop / rpop（头删尾删） lindex（获取下…

阅读更多...

2023年第三届能源、电力与电气工程国际会议 (CoEEPE 2023)

2023年第三届能源、电力与电气工程国际会议 (CoEEPE 2023)

会议简介 Brief Introduction 2023年第三届能源、电力与电气工程国际会议(CoEEPE 2023) 会议时间：2023年11月22日-24日召开地点：澳大利亚墨尔本大会官网：www.coeepe.org 2023年第三届能源、电力与电气工程国际会议(CoEEPE 2023)由安徽大学、…

阅读更多...

使用GGML和LangChain在CPU上运行量化的llama2

使用GGML和LangChain在CPU上运行量化的llama2

Meta AI 在本周二发布了最新一代开源大模型 Llama 2。对比于今年 2 月发布的 Llama 1，训练所用的 token 翻了一倍，已经达到了 2 万亿，对于使用大模型最重要的上下文长度限制，Llama 2 也翻了一倍。在本文，我们将紧跟趋…

阅读更多...

JavaScript基础语法及小案例

JavaScript基础语法及小案例

目录 JavaScript基础语法1. 变量声明和赋值2. 数据类型1) 基本数据类型2) 复合数据类型(引用类型)3) 特殊数据类型 3. 运算符1) 算术运算符2) 赋值运算符3) 比较运算符4) 逻辑运算符5) 三元运算符 4. 控制流程1) 条件语句2) 循环语句 5. 函数1) 函数的基本使用① 什么是函数② …

阅读更多...

DXFReader.NET 2023 Crack

DXFReader.NET 2023 Crack

DXFReader.NET 是一个 .NET 组件，允许直接从 AutoCAD 图形文件格式 DXF（也称为图形交换格式）查看、操作和打印。 DXFReader.NET 之 DXF 是 Drawing eXchange Format 的首字母缩写。DXF 是图形文件内容的复制，支持将文件从一个 CA…

阅读更多...

机器学习深度学习——预备知识（上）

机器学习深度学习——预备知识（上）

深大的夏令营已经结束，筛选入营的保研er就筛选了1/3，280多的入营总人数里面双非只有30左右。最终虽然凭借机试拿到offer了，但是我感受到了自己的明显短板，比如夏令营的舍友就都有一篇核心论文，甚至还有SCI一区一作的。…

阅读更多...

Mac应用程序因“来自身份不明的开发者”无法打开如何解决

Mac应用程序因“来自身份不明的开发者”无法打开如何解决

相信不少mac电脑用户在安装应用程序时经常会遇到“xxx.app已损坏，打不开。这是mac系统的新的安全机制，安装 App 时提示： 常见的几种报错提示 xxx 已损坏，无法打开。您应该将它移到废纸篓打不开 xxx，因为它来自身份不明…

阅读更多...

旋翼式水表安装注意事项

旋翼式水表安装注意事项

旋翼式水表是一种常用的水流计量设备，适用于小口径管道的单向水流总量的计量。如果你正在考虑安装旋翼式水表，以下是一些需要注意的事项： 1.安装位置的选择：旋翼式水表应该安装在管道的垂直方向上，并且水流方向必须与水…

阅读更多...

探秘ArrayList源码：Java动态数组的背后实现

探秘ArrayList源码：Java动态数组的背后实现

探秘ArrayList源码：Java动态数组的背后实现一、成员变量二、构造器1、默认构造器2、带初始容量参数构造器3、指定collection元素参数构造器三、add()方法扩容机制四、场景分析1、对于ensureExplicitCapacity（）方法1.1 add 进第 1 个元素到 …

阅读更多...

MQTT的理解和使用

MQTT的理解和使用

MQTT是一种基于发布/订阅模式的轻量协议，该协议基于TCP/IP协议上，由IBM在1999年发布。流程理解：订阅者在订阅时会选择主题（Topic）和服务质量（QoS），然后发布者发布消息&#xff0c…

阅读更多...

matlab超前-滞后校正

matlab超前-滞后校正

1控制系统的校正系统性能稳定性、准确性、快速性动态性能-超前校正阶跃曲线、频域（bode图）、根轨迹（增加零点-根轨迹左移稳定性提高）、PID控制（PD） 静态性能-滞后校正阶跃曲线、频域&#xff08…

阅读更多...

Flink CDC MongoDB 联合实时数仓的探索实践

Flink CDC MongoDB 联合实时数仓的探索实践

摘要：本文整理自 XTransfer 技术专家, Flink CDC Maintainer 孙家宝，在 Flink Forward Asia 2022 数据集成专场的分享。本篇内容主要分为四个部分： MongoDB 在实时数仓的探索 MongoDB CDC Connector 的实现原理和使用实践 FLIP-262 MongoDB…

阅读更多...

Spring MVC拦截器和跨域请求

Spring MVC拦截器和跨域请求

一、拦截器简介 SpringMVC的拦截器（Interceptor）也是AOP思想的一种实现方式。它与Servlet的过滤器（Filter）功能类似，主要用于拦截用户的请求并做相应的处理，通常应用在权限验证、记录请求信息的日志、判断用…

阅读更多...

推荐文章

最新文章