机器学习---经验误差与过拟合、方差与偏差、性能度量、比较检验

news2024/11/23 19:14:42

1. 经验误差与过拟合

第三张图建立的模型,在训练集中通过x可以很好的预测y,然而我们不能预期该模型能够很好的预

测集外的数据,换句话说,这个模型没有很好的泛化能力。

第一张图建立了一个线性模型,但是该模型并没有精确地捕捉到训练集数据的结构,我们称具有第

一张图较大的偏倚(bias),也称欠拟合。

第三张图通过5次多项式函数很好的对样本进行了拟合,然而,如果将建立的模型进行泛化,并不

能很好的对训练集之外的数据进行预测,也称过拟合。

机器学习的主要挑战在于在未见过的数据输入上表现良好,这个能力称为泛化能力

(generalization)。

误差:学习器实际预测输出与样本真实输出的差异。

训练集误差:训练误差

训练集的补集:泛化误差

测试集误差:测试误差

我们希望得到泛化误差小的学习器。

过拟合:训练过度使泛化能力下降。

欠拟合:未能学好训练样本的普遍规律。

过拟合是机器学习的关键障碍,且不可避免。

模型误差包含了数据误差,或者说模型信息中包含了噪声。

过拟合的例子:比如在考试之前,有人采取题海战术,把每个题目都背下来,但是题目变化就答

不上来,因为这种方法并没有抽象出一般的规则。

 训练集S和测试集T组成数据集D。

假设测试样本是从真实分布中采样而得,避免因数据划分引入偏差。

测试集应与训练集互斥。

学习器泛化评估的测试方法:

2. 方差与偏差

想象你开着一架直升机,攻击地面上一只敌军部队,于是你连打数十梭子,结果有一下几种情况:

1. 子弹基本上都打在队伍经过的一棵树上了,这就是方差小(子弹打得很集中),偏差大(跟目的

相距甚远)。

2. 子弹打在了树上,石头上,花花草草也都中弹,但是敌军安然无恙,这就是方差大(子弹到处都

是),偏差大(同1)。

3. 子弹打死了一部分敌军,但是也打偏了些打到花花草草了,这就是方差大(子弹不集中),偏差

小(已经在目标周围了)。

4. 子弹一颗没浪费,每一颗都打死一个敌军,跟抗战神剧一样,这就是方差小(子弹全部都集中在

一个位置),偏差小(子弹集中的位置正是它应该射向的位置).

3. 性能度量

性能度量(performance measure):衡量模型泛化能力的评价标准。

回归:均方误差

分类:错误率和精度

混淆矩阵(confusion matrix):

 查准率P与查全率R:

 P-R曲线面积与平衡点:

F1度量: 

ROC(受试者工作特征曲线):

考虑ROC曲线图中的四个点和一条线。(见下图)

第一个点,(0,1),即FPR=0,TPR=1,这意味着FN(false negative) =0, 并且FP 

(false positive) =0。 这是一个完美的分类器,它将所有的样本都正确分类。

第二个点,(1,0),即FPR=1,TPR=0,类似地分析可以发现这是一个最糟糕的分类器,因

为它成功避开了所有的正确答案。

第三个点,(0,0),即FPR=TPR=0,即FP(false positive)=TP (true positive)=0,可以

发现该分类 器预测所有的样本都为负样本(negative)。

第四个点(1,1),分类器实际上预测所有的样本都为正样本。

经过以上的分析,我们可以断言,ROC曲线越接近左上角,该分类器的性能越好。

根据下图,将每个测试样本属于正样本的概率值从大到小排序。图中共有20个测试样本,“Class”

一栏表示每个测试样本真正的标签(p表示正样本,n表示负样本),“Score”表示每个测试样本属

于正样本的概率。

接下来,从高到低,依次将“Score”值作为阈值。

当测试样本属于正样本的概率大于或等于这个阈值时,我们认为它为正样本,否则为负样本。

举例来说,对于图中的第4个样本,其“Score”值为0.6,那么样本1,2,3,4都被认为是正样本,

因为它们的“Score”值都大于等于0.6,而其他样本则都认为是负样本。

每次选取一个不同的阈值,我们就可以得到一组FPR和TPR,即ROC曲线上的一点

 

 4. 比较检验

统计假设检验(hypothesis test):根据测试错误率估计推断泛化错误率的分布。

提出假设→找到符合某种概率分布的中间变量→利用该概率分布确定在某个置信度(confidence)

下是否接受该假设。

单个学习器的情况:

做了多次留出法或者交叉验证法之后,会有多个测试误差率,此时使用”t检验“(t-test)来检验单

个学习。

根据预先设定的显著度α,以及自由度k-1,查表可得临界值b,如果Tt小于临界值b则接受,否则,

拒绝。

一个数据集多个学习器:

对一组样本D,进行k折交叉验证,会产生k个测试误差率,将两个学习器都分别在每对数据子集上

进行训练与测试,会分别产生两组测试误差率,对每对结果求差值。若两个学习器的性能相同,则

相对应的两个误差率的差值应该为0。先计算出差值的均值μ与方差σ^2,在显著度α下,若变量根

据预先设定的显著度α,以及自由度k-1,查表可得临界值b,若Tt小于临界值则接受,否则拒绝。

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/777574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PHP中常用数组排序算法

一:冒泡排序 1:算法步骤 比较相邻项的值,如果前者比后者大,交换顺序。 进行一轮比较后,最后一个值为最大的值。 进行下一轮比较,比上次少比较一项。 以此类推,比较剩下最后一项的时候&#…

【Hive】group by 分组聚合后使用窗口函数

文章目录 1. group by 分组聚合后使用排序窗口函数1.1 两种思路 与 简单例子1.2 新思路的解释 2. group by 分组聚合后使用聚合窗口函数3. group by 分组聚合后使用分析窗口函数 1. group by 分组聚合后使用排序窗口函数 1.1 两种思路 与 简单例子 group by 之后,…

AI时代带来的图片造假危机,该如何解决

一、前言 当今,图片造假问题非常泛滥,已经成为现代社会中一个严峻的问题。随着AI技术不断的发展,人们可以轻松地通过图像编辑和AI智能生成来篡改和伪造图片,使其看起来真实而难以辨别,之前就看到过一对硕士夫妻为了骗…

【Linux】进程信号 -- 信号保存与递达 | 信号捕捉 | 僵尸进程的信号处理方法

阻塞信号信号相关概念内核中的表示sigset_t信号集操作函数sigprocmasksigpending 小实验 - 观察pending表 信号的捕捉流程sigaction1.小实验:如果进程在处理2号信号,那我们继续发送2号信号会怎么样?2.如何正在处理这个信号,同时屏…

js - 关于防抖和节流函数的使用和细节

文章目录 一、什么是防抖二、应用场景三、实现原理1,第一个问题:为什么使用了闭包(也就是说timer为什么定义到了外面)2,第二个问题:防抖函数中this的指向问题: 四、节流函数 一、什么是防抖 事…

【【51单片机的I2C总线】】

51单片机的I2C总线 学会总线,掌控芯片。了解串口,真理全有。 I2C时序 1.起始条件:  SCL在高电平期间,SDA从高电平切换到低电平 终止条件: SCL在高电平期间,SDA从低电平切换为高电…

【go语言学习笔记】01 Go语言快速入门

文章目录 一、基础入门1. 示例程序2. 安装与环境变量设置3. 项目构建和编译发布3.1 go build和go install对比3.2 跨平台编译 二、数据类型1. 基础类型1.1 整型1.2 浮点数1.3 布尔型1.4 字符串1.5 零值 2. 变量2.1 变量声明2.1.1 指定变量类型2.1.2 根据值自行判定变量类型2.1.…

深入学习 Redis - 深挖经典数据类型之 list

目录 前言 一、list 类型 1.1、操作命令 lpush / rpush(插入元素) lrange(查看范围元素) lpushx / rpushx (有约束的插入) lpop / rpop(头删尾删) lindex(获取下…

2023年第三届能源、电力与电气工程国际会议 (CoEEPE 2023)

会议简介 Brief Introduction 2023年第三届能源、电力与电气工程国际会议(CoEEPE 2023) 会议时间:2023年11月22日-24日 召开地点:澳大利亚墨尔本 大会官网:www.coeepe.org 2023年第三届能源、电力与电气工程国际会议(CoEEPE 2023)由安徽大学、…

使用GGML和LangChain在CPU上运行量化的llama2

Meta AI 在本周二发布了最新一代开源大模型 Llama 2。对比于今年 2 月发布的 Llama 1,训练所用的 token 翻了一倍,已经达到了 2 万亿,对于使用大模型最重要的上下文长度限制,Llama 2 也翻了一倍。 在本文,我们将紧跟趋…

JavaScript基础语法及小案例

目录 JavaScript基础语法1. 变量声明和赋值2. 数据类型1) 基本数据类型2) 复合数据类型(引用类型)3) 特殊数据类型 3. 运算符1) 算术运算符2) 赋值运算符3) 比较运算符4) 逻辑运算符5) 三元运算符 4. 控制流程1) 条件语句2) 循环语句 5. 函数1) 函数的基本使用① 什么是函数② …

DXFReader.NET 2023 Crack

DXFReader.NET 是一个 .NET 组件,允许直接从 AutoCAD 图形文件格式 DXF(也称为图形交换格式)查看、操作和打印。 DXFReader.NET 之 DXF 是 Drawing eXchange Format 的首字母缩写。DXF 是图形文件内容的复制,支持将文件从一个 CA…

机器学习深度学习——预备知识(上)

深大的夏令营已经结束,筛选入营的保研er就筛选了1/3,280多的入营总人数里面双非只有30左右。 最终虽然凭借机试拿到offer了,但是我感受到了自己的明显短板,比如夏令营的舍友就都有一篇核心论文,甚至还有SCI一区一作的。…

Mac应用程序因“来自身份不明的开发者”无法打开如何解决

相信不少mac电脑用户在安装应用程序时经常会遇到“xxx.app已损坏,打不开。这是mac系统的新的安全机制,安装 App 时提示: 常见的几种报错提示 xxx 已损坏,无法打开。您应该将它移到废纸篓打不开 xxx,因为它来自身份不明…

旋翼式水表安装注意事项

旋翼式水表是一种常用的水流计量设备,适用于小口径管道的单向水流总量的计量。如果你正在考虑安装旋翼式水表,以下是一些需要注意的事项: 1.安装位置的选择:旋翼式水表应该安装在管道的垂直方向上,并且水流方向必须与水…

探秘ArrayList源码:Java动态数组的背后实现

探秘ArrayList源码:Java动态数组的背后实现 一、成员变量二、构造器1、默认构造器2、带初始容量参数构造器3、指定collection元素参数构造器 三、add()方法扩容机制四、场景分析1、对于ensureExplicitCapacity()方法1.1 add 进第 1 个元素到 …

MQTT的理解和使用

MQTT是一种基于发布/订阅模式的轻量协议,该协议基于TCP/IP协议上,由IBM在1999年发布。 流程理解:订阅者在订阅时会选择主题(Topic)和服务质量(QoS),然后发布者发布消息&#xff0c…

matlab超前-滞后校正

1控制系统的校正 系统性能 稳定性、准确性、快速性 动态性能-超前校正 阶跃曲线、频域(bode图)、根轨迹(增加零点-根轨迹左移稳定性提高)、PID控制(PD) 静态性能-滞后校正 阶跃曲线、频域&#xff08…

Flink CDC MongoDB 联合实时数仓的探索实践

摘要:本文整理自 XTransfer 技术专家, Flink CDC Maintainer 孙家宝,在 Flink Forward Asia 2022 数据集成专场的分享。本篇内容主要分为四个部分: MongoDB 在实时数仓的探索 MongoDB CDC Connector 的实现原理和使用实践 FLIP-262 MongoDB…

Spring MVC拦截器和跨域请求

一、拦截器简介 SpringMVC的拦截器(Interceptor)也是AOP思想的一种实现方式。它与Servlet的过滤器(Filter)功能类似,主要用于拦截用户的请求并做相应的处理,通常应用在权限验证、记录请求信息的日志、判断用…