机器学习基础知识之预测性能评价指标

news2024/12/28 9:06:35

文章目录

  • 预测性能评价思路
    • 1、均方误差(Mean Square Error,MSE)
    • 2、均方根误差(Root Mean Square Error,RMSE)
    • 3、平均绝对误差(Mean Absolute Error,MAE)
    • 4、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)
    • 5、对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,SMAPE)
    • 6、拟合度(R-squared)
    • 7、预测性能评价指标对比

预测性能评价思路

通常将在训练数据集上的预测输出值与训练数据集中对应的真实值之间的差异称为“训练误差”,而将使用训练好的模型在测试数据集上进行测试而得到的预测值与真实值之间的差异称为“泛化误差”,使用预测模型进行大数据预测的最大目的在于要使“泛化误差”处于一个最小值的状态,而实际过程中只能通过对模型的训练过程使“训练误差”尽可能小,因此实际的应用中,想要在测试数据集上进行测试时预测值与真实值的“泛化误差”为0几乎是不可能的。
由于误差难以避免,在对模型的好坏进行评价时,需要采用一系列指标对其性能进行评价,对预测模型进行性能评价时,主要是对训练好的模型在新数据集上的预测值的好坏进行评价,通常会采用一些数学统计上的公式计算模型的预测值与实际的真实值之间的关系。常见的性能评价指标有均方误差、均方根误差、平均绝对误差、平均绝对百分比误差、对称平均绝对百分比误差以及拟合度,下面将对它们分别展开介绍。

1、均方误差(Mean Square Error,MSE)

该指标的取值范围为0到正无穷大,当模型的预测值与真实值完全相同时,该值取值为0,否则预测值与真实值之间的差值越大,该值越大。其计算公式如下:
在这里插入图片描述

其中n为样本的数量,y_p为预测值,y_t为真实值。

2、均方根误差(Root Mean Square Error,RMSE)

该指标主要是对均方误差进行了开方,使得在数量级上对误差进行观察更为直观,该指标的取值范围与均方误差一样为0到正无穷,当模型的预测值与真实值完全相同时,该值取值为0,否则预测值与真实值之间的差值越大,该值越大。其计算公式如下:

在这里插入图片描述

3、平均绝对误差(Mean Absolute Error,MAE)

与前面两个指标不同的是该指标无需对误差值进行平方计算,该指标主要对所有预测样本的预测值与真实值的误差绝对值的平均值进行计算以判断预测效果的好坏。其计算公式如下:
在这里插入图片描述

与前面两个指标相同的是,该指标的取值范围也为0到正无穷大,当模型的预测值与真实值完全相同时,该值取值为0,否则预测值与真实值之间的差值越大,该值越大。

4、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)

前面几个指标都是采用实数作为预测误差效果评价的标准,而平均绝对百分比误差则是以百分数作为预测误差效果评价的标准,该指标的取值范围为0到正无穷大,当该指标取值为0%时,表示模型下的预测值与真实值完全一致,该模型可视作完美模型,当该指标取值大于100%时,表示模型下的预测值与真实值相差较大,该模型的预测效果较差。该指标的计算公式如下所示:
在这里插入图片描述

可以看到,该公式以真实值作为分母部分,类似于对预测值与真实值之间的误差值进行了归一化处理,以此避免了部分误差极值点对绝对误差的影响,但是由于此特征的存在,在数据集的真实值中存在0时,该预测评价指标无法被采用。

5、对称平均绝对百分比误差(Symmetric Mean Absolute Percentage Error,SMAPE)

与平均绝对百分比误差相同,该指标也是以百分数作为预测误差效果评价的标准,不同点在于其分母部分是预测值绝对值与真实值绝对值的平均值,但该指标同样可以避免了部分误差极值点对绝对误差的影响。同样的,在数据集的真实值中存在0时,该预测评价指标无法被采用。该指标的计算公式如下:
在这里插入图片描述

由上式可以看到,该指标的取值范围为0到正无穷大,计算结果越小,则模型的预测值与真实值之间的差值越小,模型的预测效果越好。

6、拟合度(R-squared)

拟合度主要用来衡量模型预测值与真实值之间的拟合程度,其计算公式如下:
在这里插入图片描述

在上述公式中,y ̅_t为真实值的平均值。
拟合度指标最大的特点在于将实际预测的误差情况与数据集本身的数据情况进行对比,当将公式中的分子分母部分同时除以预测样本数时,分子部分变成了前面介绍的误差指标均方误差,而分母部分则变成了预测样本数据集的方差,当这预测误差越小时,分子部分越接近于0,则该指标的计算结果越接近0,即模型的预测效果越好,而当分子与分母越接近时,每个预测值均处于一个更接近于均值的状态,该指标最后的计算值接近于0,则此时模型的预测效果是极差的。因此该指标的取值范围在0到1之间,该值越大,则模型的预测效果越好,一般来说当该指标的计算结果超过0.8时,模型的预测效果相对较好。

7、预测性能评价指标对比

对比上述六种预测性能评价指标可以看到,对单个模型的预测性能进行评价时,主要还是利用模型的预测值与预测样本的真实值之间的误差进行计算,通过它们之间误差的不同表现形式对来模型的预测性能进行评价,例如均方误差、均方根误差、拟合度是利用预测值与样本真实值之间误差的平方来表现其预测性能好坏,而平均绝对误差、平均绝对百分比误差以及对称平均绝对百分比误差则是利用利用预测值与样本真实值之间误差的绝对值来表现其预测性能好坏。另外这些预测性能评价指标之间也存在一定的相似性,除拟合度外,其他五种预测性能评价指标的取值范围均在0到正无穷之间,且该值越小,模型的预测性能越好,而拟合度也可以视作是均方误差的一种变形,因此无论采用哪种预测性能评价指标对模型的预测效果进行评价均具有一定的合理性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/555432.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

多线程-线程创建方式1:继承Thread类

线程创建方式1:继承Thread类 概述 Java语言的JVM允许程序运行多个线程,使用java.lang.Thread类代表线程,所有的线程对象都必须是Thread类或其子类的实例。Thread类的特性 每个线程都是通过某个特定Thread对象的run()方法来完成操作的&#…

LeetCode:1049.最后一块石头的重量II 494.目标和 474.一和零

1049.最后一块石头的重量II 题目 有一堆石头&#xff0c;用整数数组 stones 表示。其中 stones[i] 表示第 i 块石头的重量。 每一回合&#xff0c;从中选出任意两块石头&#xff0c;然后将它们一起粉碎。假设石头的重量分别为 x 和 y&#xff0c;且 x < y。那么粉碎的可能…

pygam第5课——自制音乐播放器

前言&#xff1a;前几节课我们已经学会了很多知识点&#xff0c;欢迎大家可以去考古一下 今天我们将学习加载音乐&#xff0c;并且自制一个音乐播放器&#xff0c;界面功能包括&#xff1a; 加载背景封面上一首开始\暂停下一首重播随机播放快进 效果展示(GIF所以你们听不到声…

day6 广播及实现

什么是广播 数据包发送方式只有一个接受方&#xff0c;称为单播 如果同时发给局域网中的所有主机&#xff0c;称为广播 只有用户数据报(使用UDP协议)套接字才能广播 广播地址&#xff1a; 一个网络内主机号全为1的IP地址为广播地址 发到该地址的数据包被所有的主机接收 255…

MT6833(天玑 700)处理器参数_芯片规格_性能介绍

MT6833&#xff08;天玑700&#xff09;是一款出色的基带处理器&#xff0c;具有许多优秀的功能&#xff0c;并且采用了强大的八核CPU&#xff0c;其中包括两个主频高达2.2GHz的Arm Cortex-A76核心。此外&#xff0c;他还配备了LPDDR4X内存和UFS 2.2存储&#xff0c;大大提高了…

MyBatis中的#{}和${}有什么区别?

首先#{} 和 ${} 都是参数占位符&#xff0c;其中#{}是预编译处理&#xff0c;${}是字符直接进行替换。预编译处理是指&#xff1a;MyBatis 在处理#{}时&#xff0c;会将 SQL 中的 #{} 替换为?号&#xff0c;使⽤ PreparedStatement 的 set ⽅法来赋值。直接替换是指MyBatis 在…

【谷粒商城笔记】2. 创建项目与运行

1. 创建微服务项目 共分为下面五个 商品服务product 存储服务ware 订单服务order 优惠券服务coupon 用户服务member 1.1 新建github/gitee项目 首先去github新建项目 在IDEA中导入项目 从版本控制(Version Control)新建Project 选择路径和git链接 1.2 创建微服务 新建…

modscan模拟数据,nodred通过modbus协议向emqx创建规则引擎写入TDengine库

nodred通过modbus协议向emqx创建规则引擎写入TDengine库过程 一、emqx存储数据到TDEngine数据库1.1 进入emqx界面1.2 新建资源1.3 新建规则引擎1.4 测试 二、modscan模拟设备数据三、在Node-RED上模拟Modbus通讯3.1 nodeRed环境搭建3.2 nodeRed使用3.3 nodered读取modbus发送的…

Firewalld

目录 firewalld概述 firewalld 与 iptables 的区别 firewalld 区域的概念 firewalld防火墙预定义了9个区域 firewalld数据处理流程 firewalld检查数据包的源地址的规则 firewalld防火墙的配置方法 常用的firewall-cmd 命令选项 区域管理 服务管理 ​编辑端口管理 设…

创建项目执行计划的5个简单步骤

项目执行计划是定义项目将如何执行的文件。执行计划解释项目中涉及的战略目标和步骤&#xff0c;定义项目完成时间表&#xff0c;并列出成功项目所需的资源&#xff08;包括团队成员&#xff09;。 使用项目计划是多种项目管理最佳实践之一。这个过程并不像看起来那么复杂。按…

读财报丨产品收入增长近70%,百济神州已成功切换成长驱动模式?

5月12日&#xff0c;百济神州&#xff08;北京&#xff09;生物科技有限公司&#xff08;下称“百济神州”&#xff09;公布2023年第一季度业绩报告。从数据来看&#xff0c;延续了2022年的良好增长态势&#xff0c;实现营业收入30.66亿元&#xff0c;同比增长57%&#xff0c;而…

unity实现小球poke不穿膜

引言 在oculus quest2官方实现了手部指尖poke按键不穿膜&#xff0c;具体采用代码的方式进行限制&#xff0c;具体看oculus quest包中的HandPokeLimiterVisual.cs&#xff0c;下面则实现其他物体&#xff08;小球&#xff09;作为pokeInteractor来poke按键&#xff0c;当按下的…

Linux网络——shell编程之SNAT与DNAT的应用

Linux网络——shell编程之SNAT与DNAT的应用 一、SNAT的介绍1.SNAT概述2.SNAT源地址转换过程 二、SNAT转换三、DNAT的介绍1.DNAT概述2.DNAT转换前提条件 四、DNAT的转换五、防火墙规则的备份和还原六、tcpdump抓包工具的运用 一、SNAT的介绍 SNAT&#xff08;SNAT&#xff09;一…

蓝桥杯数论总结:最大公约数和最小公倍数(原理+性质证明+python板子)

目录 最大公约数 手写GCD 最小公倍数 推导LCM函数表达式 GCD基本性质 性质的证明 取模运算基本性质 证明 最大公约数 gcd是最大公约数的意思。Python的math库里有gcd函数。 在Python命令行运行gcd&#xff0c;可发现其可传入0、不会返回负数、可对多个数进行判断的性质…

利用 DynamoDB 和 S3 结合 gzip 压缩,最大化存储玩家数据

前言 一些传统游戏架构中&#xff0c;采用 MySQL 存储玩家存档数据&#xff0c;利用分库分表分散单库单表的存储和性能压力&#xff0c;从而达到支持更多玩家的目的。随着数据量增长&#xff0c;数据表中 varchar 类型已经无法满足游戏中单字段的存储需求&#xff0c;而 blob …

数据结构 -最短路径dijkstra(迪杰斯特拉)算法讲解及代码实现

迪杰斯特拉算法是一种广义的贪心算法&#xff0c;求出局部最优解&#xff0c;再去求全局最优解 图文讲解&#xff1a; 举例图&#xff1a;&#xff08;起始点为1&#xff09; 辅助数组&#xff1a; s&#xff1a;记录了目标顶点到其他顶点的最短路径是否求得&#xff08;求得…

代码调试技巧

目录 1.为什么要进行调试&#xff1f; 2.调试的基本步骤 3.关于Debug版本和Release版本 4.调试技巧 5.调试总结 我还是喜欢真实的世界&#xff0c;因为在那里&#xff0c;我可以通过自己的努力来改变残酷的现实 本专栏适用于有一定C语言基础并且还要继续学习的人 往期…

CryoEM - 冷冻电镜 CryoSPARC 软件的安装与环境配置

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://blog.csdn.net/caroline_wendy/article/details/130809095 CryoSPARC 软件是一种用于冷冻电镜数据处理的创新工具&#xff0c;可以快速、准确地重建生物分子的三维结构。CryoSPARC 软件…

【使用ChatGPT制作PPT】

内容目录 一、利用ChatGPT生成PPT内容1. 打开ChatGPT&#xff1a;2. 输入需求&#xff1a;3. 复制&#xff1a; 二、制作生成PPT1. 打开PPT制作网站&#xff1a;2. 左侧网页版-导入创建-粘贴Markdown内容-导入创建3. 自行更改副标题、演讲者、选择模板、演示及下载 一、利用Cha…

Linux网络——shell编程之iptables防火墙

Linux网络——shell编程之iptables防火墙 一、概述1.iptables2.netfilter 和 iptables的关系 二、iptables中的四表五链1.四表五链的关系2.四表3.五链 三、匹配顺序1.数据包到达防火墙的匹配流程2.规则链之间的匹配顺序3.规则链内的匹配顺序 四、iptables 防火墙的配置方法1.ip…