1.41.5 模型评估和选择,正则化和交叉验证

news2025/1/18 20:12:10

1.4&1.5 模型评估和选择,正则化和交叉验证

  • 模型评估和选择
    • 训练误差和测试误差
    • 过拟合
  • 正则化与交叉验证
    • 正则化
    • 交叉验证


模型评估和选择

训练误差和测试误差

将预测系统的X作为输入,输入到模型里面,就可以得到预测结果。
在这里插入图片描述
学习到的模型: Y = f ^ ( X ) Y=\hat{f}(X) Y=f^(X)

训练集(Training Set): T = { ( x 1 , y 1 ) , ( x 2 , y 2 ) ⋯   , ( [ x N , y N ) } T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right) \cdots,\left(\left[_{x_{N}}, y_{N}\right)\right\}\right. T={(x1,y1),(x2,y2),([xN,yN)}

训练误差(Training Error) : R e m p ( f ^ ) = 1 N ∑ i = 1 N L ( y i , f ^ ( x i ) ) R_{e m p}(\hat{f})=\frac{1}{N} \sum_{i=1}^{N} L\left(y_{i}, \hat{f}\left(x_{i}\right)\right) Remp(f^)=N1i=1NL(yi,f^(xi))

测试集(Test Set): T ′ = { ( x 1 ′ , y 1 ′ ) , ( x 2 ′ , y 2 ′ ) ⋯   , ( x N ′ , y N ′ ) } T^{\prime}=\left\{\left(x_{1^{\prime}}, y_{1^{\prime}}\right),\left(x_{2^{\prime}}, y_{2^{\prime}}\right) \cdots,\left(x_{N^{\prime}}, y_{N^{\prime}}\right)\right\} T={(x1,y1),(x2,y2),(xN,yN)}

测试误差(Test error): e test  = 1 N ′ ∑ i ′ = 1 N ′ L ( y i ′ , f ^ ( x i ′ ) ) e_{\text {test }}=\frac{1}{N^{\prime}} \sum_{i^{\prime}=1}^{N^{\prime}} L\left(y_{i^{\prime}}, \hat{f}\left(x_{i^{\prime}}\right)\right) etest =N1i=1NL(yi,f^(xi))

误差率(Error Rate): e t e s t = 1 N ′ ∑ i ′ = 1 N ′ I ( y i ′ ≠ f ^ ( x i ′ ) ) e_{t e s t}=\frac{1}{N^{\prime}} \sum_{i^{\prime}=1}^{N^{\prime}} I\left(y_{i^{\prime}} \neq \hat{f}\left(x_{i^{\prime}}\right)\right) etest=N1i=1NI(yi=f^(xi)) = 预测结果不等于真实结果/总数

准确率(Accuracy): r test  = 1 N ′ ∑ i ′ = 1 N ′ I ( y i ′ = f ^ ( x i ′ ) ) r_{\text {test }}=\frac{1}{N^{\prime}} \sum_{i^{\prime}=1}^{N^{\prime}} I\left(y_{i^{\prime}}=\hat{f}\left(x_{i^{\prime}}\right)\right) rtest =N1i=1NI(yi=f^(xi)) = 预测结果等于真实结果/总数

过拟合

过拟合(Over-Fitting) :学习所得模型包含参数过多,出现对已知数据预测很好,但对未知数据预测很差的现象。

在这里插入图片描述
预测误差与模型复杂度的关系:
在这里插入图片描述

正则化与交叉验证

正则化

正则化:实现结构风险最小化策略
min ⁡ f ∈ F 1 N ∑ i = 1 N L ( y i , f ( x i ) ) + λ J ( f ) \min _{f \in \mathcal{F}} \frac{1}{N} \sum_{i=1}^{N} L\left(y_{i}, f\left(x_{i}\right)\right)+\lambda J(f) fFminN1i=1NL(yi,f(xi))+λJ(f)
经验风险 1 N ∑ i = 1 N L ( y i , f ( x i ) ) \frac{1}{N} \sum_{i=1}^{N} L\left(y_{i}, f\left(x_{i}\right)\right) N1i=1NL(yi,f(xi))越小,误差就越小,但模型复杂度越大,预测误差是按照上方图来变化的,故而我们需要用 λ \lambda λ来权衡经验风险和模型复杂度。

常用的正则化项为L1范数L2范数
L1范数: L ( w ) = 1 N ∑ i = 1 N ( f ( x i ; w ) − y i ) 2 + λ ∥ w ∥ 1 L(w)=\frac{1}{N} \sum_{i=1}^{N}\left(f\left(x_{i} ; w\right)-y_{i}\right)^{2}+\lambda\|w\|_{1} L(w)=N1i=1N(f(xi;w)yi)2+λw1
L2范数: L ( w ) = 1 N ∑ i = 1 N ( f ( x i ; w ) − y i ) 2 + λ 2 ∥ w ∥ 2 2 L(w)=\frac{1}{N} \sum_{i=1}^{N}\left(f\left(x_{i} ; w\right)-y_{i}\right)^{2}+\frac{\lambda}{2}\|w\|_{2}^{2} L(w)=N1i=1N(f(xi;w)yi)2+2λw22

奥卡姆剃刀原理:在模型选择时,选择所有可能模型中,能很好解释已知数据并且十分简单的模型。

交叉验证

数据不足情况下可以使用S折交叉验证
S折交叉验证:随机将数据分为S个互不相交、大小相同的子集,其中以S-1个子集作为训练集,余下的子集作为测试集。

在这里插入图片描述


注:以上笔记素材来自于 [B站_简博士_十分钟 机器学习 系列视频 《统计学习方法》]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/84942.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UNIX网络编程卷一 学习笔记 第五章 TCP客户/服务器程序示例

本章将编写一个完整的TCP客户/服务器程序,这个简单例子是执行以下步骤的一个回射服务器: 1.客户从标准输入读入一行文本,并写给服务器; 2.服务器从网络输入读入这行文本,并回射给客户; 3.客户从网络输入读入…

Spring Ioc 依赖来源-7

1. 依赖查找的来源:除容器内建和自定义Spring Bean之外,还有其他来源提供依赖查找吗? 查找来源 Spring 內建 BeanDefintion Spring 內建单例对象 当spring在注解环境下面, 这个 registerAnnotationConfigProcessors API会被调用, 它会被…

Xilinx Vivado的RTL分析(RTL analysis)、综合(synthesis)和实现(implementation)的区别?

1、一般流程 Xilinx 的开发工具Vivado其实还是比较好上手的,在左边的设计流程导航已经把FPGA的开发过程按先后顺序给排列出来了: Project Manager:项目管理器,此项是对项目的参数进行设置 IP Integrator:IP集成器&…

广域铭岛参编《数智化供应链参考架构》标准正式发布

近日,广域铭岛参编的《数智化供应链参考架构》标准正式发布。该标准由工业互联网产业联盟(以下简称“联盟/AII”)发布,是国内首个数智化供应链领域的参考架构标准,明确了新兴的数字化和智能化技术如何在供应链领域应用…

大数据进程管理

进程管理 查看进程 进程查看命令 ps la | head -5,能够观察所有系统的数据 ps axjf | head -20,连同部分程序树状态 ps l仅查看自己的bash相关的进程 ps aux观察系统所有进程 属性含义USER进程使用者PID进程标识符%CPU进程使用掉的CPU 资源百分比%MEM…

一个不错的docker支持音频的rdp桌面

docker pull danielguerra/xfce4-rdp-audio 获取该镜像后,运行 docker run -d --name xfce4_0 --shm-size 1g -p 3389:3389 danielguerra/xfce4-rdp-audio相当于开了3个不同的系统容器,端口分别的13389,23389,33389,这时用远程桌面就可以连…

记录--记一次前端CSS升级

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 目前平台前端使用的是原生CSSBEM命名,在多人协作的模式下,容易出现样式冲突。为了减少这一类的问题,提升研效,我调研了业界上主流的7种CSS解决方案&…

Java基于springboot+vue 的传统乐器培训管理系统 elementUI

此网站系统的开发方式和信息管理方式,借鉴前人设计的信息和研发。以在线乐器培训管理为主,以乐器培训管理为核心功能来进行设计和研发,把网站信息和技术整合,开发出一套网上乐器培训管理系统。主要运用现在社会公司中最新的技术框…

rocketmq源码学习-nameServer

前言 最近看了下rocketmq的源码,计划针对最近的学习,做一个笔记,先从nameServer启动的逻辑开始记录吧 在rocketmq中,有四个关键的组件 nameServerbrokerproducerconsumer 这四个组件之间的关系是这样的 关于nameSrv namese…

[附源码]Python计算机毕业设计钓鱼爱好者交流平台Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

老照片修复清晰?父母以前的老照片还能修复吗?

父母结婚时拍摄的结婚照片,现在大概快四十年了,因为保存不善,导致照片泛黄,严重模糊。因为这是父母年轻的时候唯一保留下来的,对我们来说意义重大,所以想要修复照片可以实现吗? 有些照相馆是提…

论文投稿指南——中国(中文EI)期刊推荐(第6期)

🚀 EI是国际知名三大检索系统之一,在学术界的知名度和认可度仅次于SCI!🎄🎈 【前言】 想发论文怎么办?手把手教你论文如何投稿!那么,首先要搞懂投稿目标——论文期刊。其中&#xf…

ADI Blackfin DSP处理器-BF533的开发详解51:Bin_Conver (图像二值变换处理)(含源码)

硬件准备 ADSP-EDU-BF533:BF533开发板 AD-HP530ICE:ADI DSP仿真器 软件准备 Visual DSP软件 硬件链接 功能介绍 代码实现了图像二值变换处理,代码运行时,会通过文件系统打开工程文件根目下" …/ImageView"路径中的…

阿里云DataWorks荣获DAMA中国数据治理优秀产品奖

DAMA(国际数据管理协会)是一个全球性的专业组织,协会自1980年成立以来,一直致力于数据管理和数字化的研究、实践及相关知识体系的建设,先后发行了《DAMA 数据管理字典》和《DAMA数据管理的知识体系》等,该知…

C/C++程序的断点调试 - Visual Studio Code

本文以Visual Studio Code为例,简述C/C程序断点调试的基本方法和过程。其它的IDE环境,大同小异。 本文引用自作者编写的下述图书; 本文允许以个人学习、教学等目的引用、讲授或转载,但需要注明原作者"海洋饼干叔 叔";本…

视频特效如何制作?快把这些方法收好

小伙伴们平时刷短视频的时候,有没有发现一些短视频的效果很惊艳。这些惊艳的效果,大部分都是在视频中添加的一些动画特效。那你们知道手机视频怎么添加特效吗?为了帮助大家解决这个问题,接下来我就将为大家分享几种添加特效的方法…

架构高可用之限流-抽刀断水水更流

上图中是一个水坝泄洪的图,那么,对于软件系统,如何使用最方便的可编程的方式增加服务限流能力呢? 下面我结合一个常规的springCloud项目实践了一把,希望他山之石可以攻玉。 背景 简单使用jmeter,压20个并…

FL Studio21.0.0完整版最高版本升级功能有哪些?

支持苹果 Silicon 芯片 – 对苹果 Silicon 芯片(M1 芯片以及相关 CPU)的原生 ARM 代码支持,但请注意: NewTime、NewTone 和一些 DirectWave 采样格式的导入功能尚未完全重构可能会有问题。 FL Studio-win21中文更新下载如下: htt…

新通药物被暂缓审议:科创属性遭质疑,招股书“数据打架”

12月12日,上海证券交易所披露的信息显示,西安新通药物研究股份有限公司(下称“新通药物”)的首发申请被暂缓审议。据贝多财经了解,新通药物于2021年12月6日在科创板递交招股书,计划募资12.79亿元。 科创板上…

识破贷后资金归集——关联网络

近几年,金融机构为了扩大信贷规模,抢占市场份额,通过贷款将贷款发放给无法直接通过金融机构获得贷款的个人或者企业,但这也给金融机构带来了多重风险。 首先,我们来看下资金归集是什么。所谓资金归集,是银…