误差的一阶和二阶——MSE/MAE

news2025/1/8 5:00:39

variance和bias

MSE之前,先看两个更为朴素的指标:variance和bias。

在打靶中,有的人所有的子弹都离靶心很远,偏差显然过高,但是很稳定地维持在某一点附近;有的人平均环数更高,但是分布太过分散。我们当然希望又准确又稳定,如何衡量二者呢?

MSE(Mean squared error)

可以发现,MSE正好是偏差和方差构成的:

方差公式:

V(X) = E[(X - E(X))²]
= E[X² - 2 X E(X) + E(X)²]
= E(X²) - 2 E(X) E(X) + [E(X)]²
= E[(X )²] - [E(X)]²

V(θhat -θ) = E[(θhat - θ)²] - [E(θhat - θ)]²,方差平移不变,所以:

V(θhat) = E[(θhat - θ)²] - [E(θhat) - E(θ)]²,等式变换:

E[(θhat - θ)²] = [E(θhat) - θ]² + V(θhat)=[Bias]² + V(θhat) = Bias² + Variance=MSE

对于网络模型的训练,由模型简单到复杂的过程中,欠拟合逐渐变为过拟合。因为随着模型变大,网络学习能力变强,偏差变小,但是受噪声影响变大,方差变大:

MSE和L2正则的关系?

 在之前的文章中,我们看到L2正则和先验概率有一些联系,那么MSE怎么从贝叶斯的角度理解呢?

正则的本质是依据于先验概率,对参数进行约束,相当于参数有一个初始分布,最终估计出的不应该偏离这个值太远。

MSE衡量的是预测值与真实值之间的关系,那么关于预测值的似然函数可以写成关于GT的函数,如果这个函数是高斯分布,根据最大似然估计就可以得到MSE。所以MSE是先验为高斯分布下的最大似然估计。

机器学习常用损失函数小结 - 知乎

从收敛速度看MSE

MSE形状是开口向上的二次曲线,光滑连续、可导,便于使用梯度下降算法,是比较常用的一种损失函数。而且,MSE 随着误差的减小,梯度也在减小,即使固定学习因子,函数也能较快取得最小值。

因为是二次函数,当误差大于1时会被放大,小于1时会被减小。所以MSE会惩罚误差更大的点。

分类可以使用MSE吗

1. 直观地来说,分类中的label只是一个标签,和绝对数值大小没关系,所以强行拟合可能会有问题;

2. 刚才提到,MSE的先验是高斯分布,而分类和高斯分布关系不大,更像是伯努利分布;交叉熵则是以数据分布服从多项式分布为前提,所以分类更多使用交叉熵;

3.从梯度更新上看,MSE中的预测值是sigmoid后的输出,那么求导时就会出现sigmoid的导数,而sigmoid的导数在两侧很小,会导致梯度下降不了。比如真实值是1,不管预测是0还是1附近,梯度都很小。MSE在这里变成了非凸优化。

那么交叉熵就没有这个问题吗?还真没有,因为在求梯度过程中能消掉。可以看下面的回答:

交叉熵损失(Cross-Entropy)和平方损失(MSE)究竟有何区别? - 陆壹爵爷的文章 - 知乎
https://zhuanlan.zhihu.com/p/423179343

回归一定使用MSE吗

在第一篇使用CNN做超分的SRCNN中,确实使用的还是MSE。但是正如前面提到的,MSE过分关注离群点,和人眼不太符合;同时MSE可能会损失高频细节,这和它高斯分布的假设也有关系。

所以超分,去噪更多使用L1,SSIM等,尤其后面又有GAN loss等的出现,MSE使用得更少了。 

分类问题中为什么用交叉熵而不用MSE KL散度和交叉熵的关系_分类为什么用交叉熵不用mse-CSDN博客

交叉熵损失(Cross-Entropy)和平方损失(MSE)究竟有何区别? - 陆壹爵爷的文章 - 知乎
https://zhuanlan.zhihu.com/p/423179343

那么,交叉熵可以用于回归问题吗?有些情况下,还真可以:分类必然交叉熵,回归无脑MSE?未必 - 知乎

https://www.cnblogs.com/USTC-ZCC/p/13219281.htmlAI 面试高频问题: 为什么二分类不用 MSE 损失函数? - mathinside的个人空间 - OSCHINA - 中文开源技术交流社区

RMSE (Root Mean Square Error)

均方根误差RMSE就是对MSE开方之后的结果

MAE(mean absolute error) 

对外点更鲁棒:

mean absolute percentage error (MAPE)

where At is the actual value and Ft is the forecast value.

MAPE和MAE最大的区别就是进行了归一化。相当于在绝对误差的基础上又考虑了相对误差。

MAPE (Mean absolute percentage error)

Symmetric mean absolute percentage error (SMAPE

进一步在归一化的时候同时考虑了真实值和预测值。为什么同时考虑,是为了解决MAPE没有上限的问题:除以一个很小的值,结果会很大。

对于分母,为了避免真实值和预测值之和为负数,所以各自取了绝对值再求和。

有的公式分母会再除以2,这样SMAPE最大值就会达到2.

我们可以看到虽然0-200的范围不太常见,但它是更接近MAPE的:

也可以看到两种sMAPE都不是对称的,0-200的甚至在左边大于MAPE,在右边小于MAPE。

没有达到”对称“的效果:

  • Over-forecasting: At = 100 and Ft = 110 give SMAPE = 4.76%
  • Under-forecasting: At = 100 and Ft = 90 give SMAPE = 5.26%.

反而是MSE和MAE有对称效果。

实验结果评估准则 - 知乎

通俗易懂方差(Variance)和偏差(Bias)_偏差和方差-CSDN博客​​​​​​​深度学习常用损失MSE、RMSE、MAE和MAPE-CSDN博客

https://medium.com/@davide.sarra/how-to-interpret-smape-just-like-mape-bf799ba03bdc

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1619615.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电磁兼容(EMC):静电放电(ESD)抗扰度试验深度解读(六)

目录 1. 静电测试干扰方式 2. 案例一 3. 案例二 4. 案例三 5. 案例四 6. 总结 静电放电测试的复杂性决定了这项测试对产品的主要影响方式也是多样的。标准里介绍了几种常见的影响方式: 1. 静电测试干扰方式 在静电放电试验中,测试了受试设备对于…

自然语言处理 (NLP) 的技术演变史

一、简述 本文的目标是了解自然语言处理 (NLP) 的历史,包括 Transformer 体系结构如何彻底改变该领域并帮助我们创建大型语言模型 (LLM)。 基础模型(如 GPT-4)是最先进的自然语言处理模型,旨在理解、生成人类语言并与之交互。 要理…

倍思、南卡、Cleer开放式耳机怎么样?三大网红真实数据测评PK

​作为一名在数码产品评测领域耕耘五载的专业人士,我有幸涉足各类蓝牙耳机的深度测评,涉猎范围广泛,从崭露头角的新锐品牌直至业界巨擘的旗舰之作,无一不在我的评测之列。鉴于近期对开放式耳机类咨询热度不减,我决定开…

Kafka 可视化管理工具 CMAK 启动错误 -- 命令行太长 问题解决

一、安装环境描述: Kafka版本:kafka_2.13-2.8.1cmak 版本:cmak-3.0.0.6安装环境:windows 11 二、问题描述 当我们在 命令行启动 cmak.bat 命令时,会报如下错误: 命令行太长三、解决办法 修改 cmak.bat…

C#设计树形程序界面的方法:创建特殊窗体

目录 1.TreeView控件 2.实例 (1)Resources.Designer.cs (2)Form1.Designer.cs (3)Form1.cs (4)生成效果 以树形来显示程序的菜单,可以更直观、更快捷地对窗体进行…

Python 面向对象——5.多态

本章学习链接如下: Python 面向对象——1.基本概念 Python 面向对象——2.类与对象实例属性补充解释,self的作用等 Python 面向对象——3.实例方法,类方法与静态方法 Python 面向对象——4.继承 1.基本概念 多态是面向对象编程&#x…

【智慧园区、低碳园区】工业园区综合能源管理系统解决方案

安科瑞薛瑶瑶18701709087 ◆行业特点 产业园区是国民经济发展的重要载体, 同时也是重点用能企业聚集地。园区面积大,供电距离远,建筑多且分散,用电负荷种类多,用电负荷不均匀,园区配电结构应整体规划,统一…

Xshell7免费版下载及安装(详细教程)

Xshell7免费版下载及安装(详细教程) 一、下载及安装 1.打开官网下载 https://www.xshell.com/zh/free-for-home-school/ 2.选择合适的下载路径 点击下载按钮 开始下载 3.下载完成后 我们双击打开.exe文件 点击下一步 4.点击我同意 点击下一步 5.选择合…

第九讲 - Java面向对象

第九讲 - Java面向对象 文章目录 第九讲 - Java面向对象1. 类和对象1.1 类和对象的理解1.2 类的定义1.3 对象的使用1.4 学生对象-练习 2. 对象内存图2.1 单个对象内存图2.2 多个对象内存图 3. 成员变量和局部变量3.1 成员变量和局部变量的区别 4. 封装4.1 封装思想4.2 private关…

IIS中搭建.Net Core项目,步骤详解

一、准备服务器 1)安装IIS 这个比较简单,百度一下就行 2)安装 .NET Core 运行时 下载地址:下载 .NET(Linux、macOS 和 Windows) 因为我是本地开发,所以我下载的是SDK 安装成功之后显示如下: 检查是否安装…

浏览器兼容模式怎么设置?4个提升网页兼容性秘笈分享!

“不知道怎么回事,我打开浏览器的时候总是显示浏览器不兼容,是什么情况呢?我应该怎么操作才能解决这个问题呀?” 浏览器兼容模式是一种使浏览器能够更好地显示网页内容、提高网页加载速度并减少错误的功能。 不同浏览器设置兼容模…

探索HSE化工安全系统在化工生产中的作用

在现代工业化生产中,化工企业扮演着至关重要的角色,但与此同时,化工安全问题也备受关注。为了保障生产环境的安全,HSE化工安全系统应运而生。本文将详细介绍HSE化工安全系统的功能和优势,让您深入了解其在工业生产中的…

ISPLSI1032E-100LT 封装TQFP100 LATTICE/莱迪斯 IC芯片

ISPLSI1032E-100LT 规格信息: 封装:TQFP 逻辑门数量:6000 含铅标准:Lead free RoHS标准:Compliant 产品生命周期:Not Recommended ISPLSI1032E-100LT 是 Lattice Semiconductor 公司生产的一款 Complex Programmable Logic Device (CPLD),中文称为复…

AIGC技术:行业应用案例与未来可能性深度解析

随着人工智能技术的飞速发展,AIGC(人工智能生成内容)技术正日益成为引领内容创作与智能应用的新引擎。在当下,AIGC技术已经取得了一系列令人瞩目的成果,而在未来,它更将展现出无限的可能性,为人…

FebHost:.DE域名能否用于多个市场的国际网站?

.DE德国域名可用于面向多个市场的国际网站,但重要的是要考虑有效的国际搜索引擎优化的影响和策略。下面介绍在这种情况下如何利用 .DE 域名: 本地信任和信誉: .DE 域名可以向用户和搜索引擎表明,您的网站是为德国市场量身定制的。…

面对亚马逊FBA仓附加费上涨,卖家如何破局前行?

跨境电商的发展势头强劲,不仅为消费者带来了更多元化的购物选择,也为卖家提供了更广阔的市场空间,跨境物流作为连接生产与消费的重要桥梁,其成本对于卖家而言,已成为影响竞争力的关键因素之一。然而,从五月…

嵌入式4-23 C++

值不能改变 语法错误 指向地址不能改变 值和地址都不能改变 值不能改变 地址不能改变 都不能改变

【漏洞复现】卡车卫星定位系统 /user/create接口处存在未授权密码重置漏洞

免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…

Golang | Leetcode Golang题解之第46题全排列

题目: 题解: func permute(nums []int) [][]int {var (n len(nums)dfs func(vals []int) // 已选择数 排列为vals 后续回溯继续选择 直至选完ans [][]int)dfs func(vals []int) {//边界if len(vals) n {ans append(ans, vals)}//转移 枚举选哪个f…

聚观早报 | 百度地图V20正式发布;OPPO K12细节曝光

聚观早报每日整理最值得关注的行业重点事件,帮助大家及时了解最新行业动态,每日读报,就读聚观365资讯简报。 整理丨Cutie 4月24日消息 百度地图V20正式发布 OPPO K12细节曝光 Meta宣布开放VR系统 三星 Galaxy Ring提供多种尺寸 Redmi …