深度学习篇---模型训练评估参数

news2025/4/5 17:46:21

文章目录

  • 前言
  • 一、Precision(精确率)
    • 1.1定义
    • 1.2意义
    • 1.3数值接近1
    • 1.4数值再0.5左右
    • 1.5数值接近0
  • 二、Recall(召回率)
    • 2.1定义
    • 2.2意义
    • 2.3数值接近1
    • 2.4数值在0.5左右
    • 2.5数值接近0
  • 三、Accuracy(准确率)
    • 3.1定义
    • 3.2意义
    • 3.3数值接近1
    • 3.4数值接近0.5左右
    • 3.5数值接近0
  • 四、F1 值
    • 4.1定义
    • 4.2意义
    • 4.3数值接近1
    • 4.4数值0.5左右
    • 4.5数值接近0
  • 五、ROC 曲线与 AUC
    • 5.1ROC曲线
    • 5.2AUC
    • 5.3AUC接近1
    • 5.4AUC接近0.5
    • 5.5AUC小于0.5
  • 六、平均绝对误差(MAE)
    • 6.1定义
    • 6.2意义
    • 6.3数值接近0
    • 6.4数值较大
  • 七、均方误差(MSE)
    • 7.1定义
    • 7.2意义
    • 7.3数值接近0
    • 7.4数值较大


前言

本文简单介绍了深度学习中模型训练好坏的评估参数。


一、Precision(精确率)

1.1定义

定义:预测为正例的样本中,真正为正例的比例。计算公式为:
Precision= TP/(TP+FP)
其中TP(True Positive)表示真正例,即实际为正例且被预测为正例的样本数量;FP(False Positive)表示假正例,即实际为负例但被预测为正例的样本数量。

1.2意义

意义:精确率反映了模型预测出的正例中真正正确的比例,用于衡量模型预测正例的准确性。例如,在垃圾邮件分类中,精确率高意味着模型预测为垃圾邮件的邮件中,确实是垃圾邮件的比例较高,可减少将正常邮件误判为垃圾邮件的情况。

1.3数值接近1

数值接近 1:说明模型预测为正例的样本中,真正为正例的比例很高。例如在文本分类任务中,若精确率达到 0.9 以上,表明模型预测为某一类别的文本,绝大部分确实属于该类别,模型在识别正例时具有较高的准确性,误判为正例的情况很少。

1.4数值再0.5左右

数值在 0.5 左右:表示模型预测正例的准确性一般,有一半左右预测为正例的样本可能是错误的判断。这意味着模型在区分正例和负例时,存在较大的混淆,可能需要进一步调整模型参数或特征工程,以提高其对正例的精确识别能力。

1.5数值接近0

数值接近 0:说明模型几乎无法准确识别正例,预测为正例的样本中大部分是错误的,模型在正例识别方面表现很差,可能存在严重的过拟合或欠拟合问题,或者数据集中存在噪声干扰等因素影响了模型的判断。

二、Recall(召回率)

2.1定义

定义:实际为正例的样本中,被预测为正例的比例。计算公式为:
Recall= TP/(TP+FN),其中FN(False Negative)表示假反例,即实际为正例但被预测为负例的样本数量。

2.2意义

意义:召回率体现了模型能够正确识别出的正例的能力。在一些场景中,如疾病检测,希望尽可能多地检测出真正患病的人,即使可能会有一些误判,此时召回率就非常重要。较高的召回率表示模型能够找到大部分实际为正例的样本,不会遗漏太多真正的正例。

2.3数值接近1

数值接近 1:表明模型能够几乎找出所有实际为正例的样本。例如在疾病检测场景中,召回率接近 1 意味着几乎所有患病的样本都被模型检测出来了,很少有漏检的情况,模型在捕捉正例方面具有很强的能力。

2.4数值在0.5左右

数值在 0.5 左右:说明模型只能识别出一半左右的实际正例样本,存在较多的漏检情况。这可能是因为模型对正例的特征学习不够充分,或者正例样本在数据集中分布不均衡,导致模型未能很好地学习到正例的各种特征,从而无法准确识别所有正例。

2.5数值接近0

数值接近 0:表示模型几乎无法找到实际的正例样本,漏检情况非常严重。模型可能根本没有学习到正例的有效特征,或者模型过于保守,将大量正例错误地判断为负例,需要对模型进行重新训练或调整,以提高其对正例的捕捉能力。

三、Accuracy(准确率)

3.1定义

定义:预测正确的样本数占总样本数的比例。计算公式为:
Accuracy= TP+TN/(TP+TN+FP+FN),其中TN(True Negative)表示真反例,即实际为负例且被预测为负例的样本数量。

3.2意义

意义:准确率是一个较为直观的指标,用于衡量模型整体的预测正确程度。但当数据集中正负样本比例不均衡时,准确率可能会产生误导。例如,在一个正负样本比例为 9:1 的数据集上,即使模型将所有样本都预测为正例,也能获得 90% 的准确率,但实际上模型并没有很好地学习到负例的特征。

3.3数值接近1

数值接近 1:表示模型整体的预测准确性很高,无论是正例还是负例,模型都能准确地进行分类。在数据分布较为均衡的情况下,准确率高说明模型对数据的拟合效果好,能够学习到数据中的有效特征,从而做出准确的预测。

3.4数值接近0.5左右

数值在 0.5 左右:说明模型的预测结果与随机猜测差不多,模型可能没有学习到数据中的任何有效信息,无法对样本进行准确分类。这可能是由于数据特征与目标变量之间没有明显的关联,或者模型过于简单,无法捕捉到数据中的复杂模式。

3.5数值接近0

数值接近 0:表示模型的预测结果几乎都是错误的,这是一种极端情况,通常是由于模型存在严重的问题,如模型结构错误、数据预处理不当、训练过程出现异常等,导致模型完全无法对数据进行正确的分类。

四、F1 值

4.1定义

定义:精确率和召回率的调和平均数,计算公式为:
F1= 2×Precision×Recall/(Precision+Recall)。

4.2意义

意义:F1 值综合了精确率和召回率两个指标,能够更全面地反映模型的性能。当精确率和召回率都较高时,F1 值也会较高。在实际应用中,F1 值常用于平衡精确率和召回率,特别是在两者之间存在权衡时,F1 值可以作为一个综合的评估指标来选择最优的模型。

4.3数值接近1

数值接近 1:说明模型在精确率和召回率上都表现出色,能够在准确识别正例的同时,尽可能地找出所有正例,模型的综合性能优秀。例如在信息检索系统中,F1 值接近 1 表示系统既能准确地返回相关的检索结果(精确率高),又能涵盖大部分相关的信息(召回率高),能够很好地满足用户的需求。

4.4数值0.5左右

数值在 0.5 左右:意味着模型在精确率和召回率之间存在一定的平衡,但整体性能一般。可能是精确率和召回率其中一个指标较高,而另一个指标较低,导致两者的调和平均数不高。此时需要分析具体是哪个指标拖了后腿,进而针对性地改进模型,以提高 F1 值。

4.5数值接近0

数值接近 0:表明模型在精确率和召回率方面的表现都很差,可能存在严重的分类错误或对正例的识别能力不足,模型需要进行全面的优化和调整,包括重新选择特征、调整模型结构、优化训练参数等,以提高精确率和召回率,进而提升 F1 值。

五、ROC 曲线与 AUC

5.1ROC曲线

ROC 曲线: Receiver Operating Characteristic 曲线,以假正率(FPR)为横坐标,真正率(TPR)为纵坐标绘制的曲线。其中
FPR= FP/(FP+TN),TPR= TP/(TP+FN)。ROC 曲线展示了模型在不同阈值下的分类性能,曲线越靠近左上角,说明模型的性能越好。

5.2AUC

AUC: Area Under the Curve,即 ROC 曲线下的面积。AUC 的值介于 0 到 1 之间,AUC 越大,说明模型的性能越好。AUC 为 1 表示模型能够完美地将正负样本区分开,AUC 为 0.5 表示模型的预测结果与随机猜测相当。

5.3AUC接近1

AUC 接近 1:说明 ROC 曲线靠近左上角,模型具有很强的区分正负样本的能力。在不同的阈值下,模型都能较好地将正例和负例区分开来,很少出现将正例误判为负例或负例误判为正例的情况,模型的性能非常优秀。
AUC 在 0.5 到 0.8 之间:表示模型具有一定的区分正负样本的能力,但性能一般。ROC 曲线位于对角线(AUC = 0.5)上方,说明模型的预测结果优于随机猜测,但还有较大的提升空间。可能需要进一步优化模型,调整特征或参数,以提高模型的性能。

5.4AUC接近0.5

AUC 接近 0.5:说明模型的区分能力与随机猜测相当,ROC 曲线接近对角线。这意味着模型可能没有学习到有效的特征来区分正负样本,需要重新审视数据和模型,查找问题所在,可能需要重新进行特征工程或选择更合适的模型。

5.5AUC小于0.5

AUC 小于 0.5:这种情况比较罕见,通常表示模型存在严重问题,其预测结果甚至不如随机猜测。可能是模型训练过程出现错误,或者数据存在严重的偏差或噪声,导致模型学到了错误的模式,需要对整个建模过程进行全面检查和修正。

六、平均绝对误差(MAE)

6.1定义

定义:预测值与真实值之间绝对误差的平均值。

6.2意义

意义:MAE 直观地反映了模型预测值与真实值之间的平均误差大小,其值越小,说明模型的预测结果越接近真实值,预测精度越高。

6.3数值接近0

数值接近 0:表示模型的预测值与真实值之间的平均差异非常小,模型能够准确地预测出目标值,预测精度很高。例如在预测股票价格走势时,MAE 接近 0 说明模型能够准确地预测出股票的实际价格,误差在可接受的范围内,模型具有很强的预测能力。

6.4数值较大

数值较大:说明模型的预测值与真实值之间存在较大的平均差异。例如在房价预测中,如果 MAE 较大,意味着模型预测的房价与实际房价有较大的偏差,可能是模型没有充分考虑到影响房价的各种因素,或者数据中存在一些异常值影响了模型的准确性,需要对模型进行改进或对数据进行进一步的处理。

七、均方误差(MSE)

7.1定义

定义:预测值与真实值之间误差平方的平均值。

7.2意义

意义:MSE 也用于衡量模型预测值与真实值之间的差异程度。由于对误差进行了平方运算,MSE 会对较大的误差给予更大的权重,因此对异常值更为敏感。MSE 越小,模型的性能越好。在一些优化问题中,常以最小化 MSE 为目标来训练模型。

7.3数值接近0

数值接近 0:表明模型的预测值与真实值之间的误差平方和很小,模型的预测效果非常好。与 MAE 类似,MSE 接近 0 表示模型能够准确地拟合数据,对目标值的预测精度高,在各种预测任务中都属于理想的状态。

7.4数值较大

数值较大:由于 MSE 对误差进行了平方运算,所以较大的 MSE 值说明模型存在较大的误差,而且对较大的误差给予了更大的权重。这可能是因为模型过于简单,无法捕捉到数据中的复杂关系,或者存在过拟合现象,导致在训练集上表现良好,但在测试集上误差较大。需要对模型进行调整,如增加模型的复杂度、采用正则化方法等,以降低 MSE 值,提高模型的性能。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2325558.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ubuntu修改用户名

修改用户名: 1.CTRL ALT T 快捷键打开终端,输入‘sudo su’ 转为root用户。 2.输入‘ gredit /etc/passwd ’,修改用户名,只修改用户名,后面的全名、目录等不修改。 3.输入 ‘ gedit /etc/shadow ’ 和 ‘ gedit /etc/…

Windows 系统下多功能免费 PDF 编辑工具详解

IceCream PDF Editor是一款极为实用且操作简便的PDF文件编辑工具,它完美适配Windows操作系统。其用户界面设计得十分直观,哪怕是初次接触的用户也能快速上手。更为重要的是,该软件具备丰富多样的强大功能,能全方位满足各类PDF编辑…

UE学习记录part11

第14节 breakable actors 147 destructible meshes a geometry collection is basically a set of static meshes that we get after we fracture a mesh. 几何体集合基本上是我们在断开网格后获得的一组静态网格。 选中要破碎的网格物品,创建集合 可以选择不同的…

Redis-07.Redis常用命令-集合操作命令

一.集合操作命令 SADD key member1 [member2]: sadd set1 a b c d sadd set1 a 0表示没有添加成功,因为集合中已经有了这个元素了,因此无法重复添加。 SMEMBERS key: smembers set1 SCARD key: scard set1 SADD key member1 …

vscode 源代码管理

https://code.visualstudio.com/updates/v1_92#_source-control 您可以通过切换 scm.showHistoryGraph 设置来禁用传入/传出更改的图形可视化。

iOS审核被拒:Missing privacy manifest 第三方库添加隐私声明文件

问题: iOS提交APP审核被拒,苹果开发者网页显示二进制错误,收到的邮件显示的详细信息如下图: 分析: 从上面信息能看出第三方SDK库必须要包含一个隐私文件,去第三方库更新版本。 几经查询资料得知,苹果在…

【LeetCode Solutions】LeetCode 101 ~ 105 题解

CONTENTS LeetCode 101. 对称二叉树(简单)LeetCode 102. 二叉树的层序遍历(中等)LeetCode 103. 二叉树的锯齿形层序遍历(中等)LeetCode 104. 二叉树的最大深度(简单)LeetCode 105. 从…

Orpheus-TTS 介绍,新一代开源文本转语音

Orpheus-TTS 是由 Canopy Labs 团队于2025年3月19日发布的开源文本转语音(TTS)模型,其技术突破集中在超低延迟、拟人化情感表达与实时流式生成三大领域。以下从技术架构、核心优势、应用场景、对比分析、开发背景及最新进展等多维度展开深入解…

Java数据结构-栈和队列

目录 1. 栈(Stack) 1.1 概念 1.2 栈的使用 1.3 栈的模拟实现 1.4 栈的应用场景 1. 改变元素的序列 2. 将递归转化为循环 3. 括号匹配 4. 逆波兰表达式求值 5. 出栈入栈次序匹配 6. 最小栈 1.5 概念区分 2. 队列(Queue) 2.1 概念 2.2 队列的使用 2.3 队列模拟实…

权重衰减-笔记

《动手学深度学习》-4.5-笔记 权重衰减就像给模型“勒紧裤腰带”,不让它太贪心、不让它学太多。 你在学英语单词,别背太多冷门单词,只背常见的就行,这样考试时更容易拿分。” —— 这其实就是在“限制你学的内容复杂度”。 在…

Hyperliquid 遇袭「拔网线」、Polymarket 遭治理攻击「不作为」,从双平台危机看去中心化治理的进化阵痛

作者:Techub 热点速递 撰文:Glendon,Techub News 继 3 月 12 日「Hyperliquid 50 倍杠杆巨鲸」引发的 Hyperliquid 清算事件之后,3 月 26 日 晚间,Hyperliquid 再次遭遇了一场针对其流动性和治理模式的「闪电狙击」。…

软考笔记6——结构化开发方法

第六章节——结构化开发方法 结构化开发方法 第六章节——结构化开发方法一、系统分析与设计概述1. 系统分析概述2. 系统设计的基本原理3. 系统总体结构设计 二、结构化分析方法1. 结构化分析方法概述2. 数据流图(DFD)3. 数据字典 三、结构化设计方法(了解&#xff…

一种C# Winform的UI处理

效果 圆角 阴影 突出按钮 说明 这是一种另类的处理,不是多层窗口 也不是WPF 。这种方式的特点是比较简单,例如圆角、阴影、按钮等特别容易修改过。其实就是html css DirectXForm。 在VS中如下 圆角和阴影 然后编辑这个窗体的Html模板&#xff0c…

为什么视频文件需要压缩?怎样压缩视频体积即小又清晰?

在日常生活中,无论是为了节省存储空间、便于分享还是提升上传速度,我们常常会遇到需要压缩视频的情况。本文将介绍为什么视频需要压缩,压缩视频的好处与坏处,并教你如何使用简鹿视频格式转换器轻松完成MP4视频文件的压缩。 为什么…

Nginx — Nginx处理Web请求机制解析

一、Nginx请求默认页面资源 1、配置文件详解 修改端口号为8080并重启服务: 二、Nginx进程模型 1、nginx常用命令解析 master进程:主进程(只有一个) worker进程:工作进程(可以有多个,默认只有一…

5.0 WPF的基础介绍1-Grid,Stack,button

WPF: Window Presentation Foundation. WPF与WinForms的对比如下: 特性WinFormsWPF技术基础基于传统的GDI(图形设备接口)基于DirectX,支持硬件加速的矢量渲染UI设计方式拖拽控件事件驱动代码(简单但局限)…

Docker 端口映射原理

在 Docker 中,默认情况下容器无法直接与外部网络通信。 为了使外部网络能够访问容器内的服务,Docker 提供了端口映射功能,通过将宿主机的端口映射到容器内的端口,外部可以通过宿主机的IP和端口访问容器内的服务 以下通过动手演示…

SDL —— 将sdl渲染画面嵌入Qt窗口显示(附:源码)

🔔 SDL/SDL2 相关技术、疑难杂症文章合集(掌握后可自封大侠 ⓿_⓿)(记得收藏,持续更新中…) 效果 使用QWidget加载了SDL的窗口,渲染器使用硬件加速跑GPU的。支持Qt窗口缩放或显示隐藏均不影响SDL的图像刷新。   操作步骤 1、在创建C++空工程时加入SDL,引入头文件时需…

算法每日一练 (23)

💢欢迎来到张翊尘的技术站 💥技术如江河,汇聚众志成。代码似星辰,照亮行征程。开源精神长,传承永不忘。携手共前行,未来更辉煌💥 文章目录 算法每日一练 (23)最大正方形题目描述解题思路解题代码…

UE5学习笔记 FPS游戏制作28 显式玩家子弹数

文章目录 添加变量修改ShootOnce方法,设计时减少子弹,没有子弹不能开枪在UI上显示 添加变量 在Gun类中添加BulletNum和ClipSize两个参数 BulletNum是当前还有多少子弹,ClipSize是一个弹匣多少子弹 Rifle的ClipSzie设置为30,Laun…