李宏毅ML-机器学习任务功略

news2024/11/20 2:33:59

文章目录

  • 机器学习任务功略
    • 机器学习框架
    • 训练模型通用指南
      • 1. training loss is large
      • 2. training loss is small
        • 2.1 training loss is small and testing loss is large
        • 2.2 training loss is small and testing loss is small
      • 3. 偏差与复杂度的平衡

机器学习任务功略

机器学习框架

在这里插入图片描述

训练模型通用指南

在这里插入图片描述

1. training loss is large

(1) model bias

Model Bias:模型太简单了,在优化的时候,无论给参数怎样的取值,都不能使 Loss 变小。
Solution:为了使模型更具有弹性,可以增加输入的 feature,或者让模型变得更深,即增加更多的神经元数量、增加更多的隐藏层。
在这里插入图片描述

(2) optimization issue

Optimization Issue:使用 gradient descent 进行优化,不断更新参数后获得的 θ ∗ \theta^* θ 并不是使得 Loss 最低的 θ \theta θ,可能会遇到 Local Minima.

在这里插入图片描述

当 training loss 比较大的时候,到底是哪个问题呢?Model Bias or Optimization Issue?

在这里插入图片描述
从下面的图是 Residual Network 训练与测试的误差。从第一张图中可以看出随着更新次数的增加,56 层 和 20 层的模型的 test error 都在下降,但是 56 层的 test error 比较大,从理论上来说,模型越深,它预测的效果也就越好,而在这里却有所违背,人们会第一直觉地以为出现了 overfitting 的现象。
其实不然,从第二张图中可以看出,随着更新次数的增加,56 层和 20 层的模型的 train error 都在下降,但是 56 层的 train error 也比 20 层的模型要来得大, 我们可以试想,56 层的模型具有更大的弹性,20 层的模型所能达到的效果 56 层一样可以,因此可以判断出,是 56 层的模型没有做好 optimization.
在这里插入图片描述

那如何判断是否为 Optimization Issue 呢?

我们可以将模型与其他模型训练所得的结果进行比较。
从一些比较浅层的网络开始训练,或者是 linear model, support vector machine 开始训练,因为它们相对深层的网络来说,较为容易优化。
然后训练深层的网络,如果深层网络的 training loss 要比浅层网络还要大,就说明存在 optimization issue.

在这里插入图片描述
如何解决 optimization issue,看下节课的笔记。

2. training loss is small

2.1 training loss is small and testing loss is large

(1) overfitting

在这里插入图片描述
从下图中可以看出,更加 flexible 的模型,如果在一些点没有给出试练资料,就会有 freestyle,那么在预测结果时,就会产生更大的误差。
在这里插入图片描述
增加训练资料
为了避免 flexible model 在训练时出现 overfitting 现象,我们可以增加更多的训练资料。
1)在网络上搜集更多的资料;
2)data augmentation:根据自己对要解决问题的理解,可以自行创建资料。例如:把图片左右翻转、局部放大等,但不能上下翻转,有违常规。

在这里插入图片描述
给模型一些限制
我们现在所学得的模型都是全连接网络,具有很大的弹性,而 CNN 针对影像的特性给出很大的限制,取得比较好的效果。
在这里插入图片描述
但也要注意,不能太限制模型,限制地太多又回到了 model bias 的问题。
在这里插入图片描述

(2) mismatch

mismatch:训练资料与测试资料的分布是不同的。

在这里插入图片描述

2.2 training loss is small and testing loss is small

This is the best result we want.

3. 偏差与复杂度的平衡

如果模型太简单,会有 model bias 的问题,相反,太复杂,则会有 overfitting 的问题,折中的模型是我们想要的,那究竟如何 select the model?
在这里插入图片描述
在 public testing set 上取得很好的预测效果,但并不代表在 private testing set 上也能表现出色。
因此,我们不要根据在 public testing set 上的结果,来挑选模型。
在这里插入图片描述

那究竟根据什么的结果来选择模型呢?

根据 validation set 上的结果来挑选 model,那 public testing set 上的分数就反映了在 private testing set 上的分数。

那在 public testing set 上的分数多少会影响你对模型的选择,其实我们只要根据 validation set 上的结果来挑选 model 就可以了,public testing set 上的分数过了 strong baseline 就可以不用管他了。
如何分 training set,那为了使得被分到的 validation set 不会太差,可以使用 N 折交叉验证方法。
从下图中可以看出,model 1 的 avg mse 最小,取得的效果也最好,那我们就将 model 1 挑出来,重新在整个 training set 上训练,最后在 public testing set 上进行预测。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/156909.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Yolov5训练自己的数据集

一、从官网下载最新的yolov5代码二、新建VOCData文件夹三、VOCData文件夹结构新建Annotations文件夹,存放标签简单的xml文件,应该长这样复杂的xml文件,应该长这个样子新建images文件夹,存放图片数据注意:需要观察自己的…

1.1.2半导体二极管的结构、工作原理、参数、伏安特性;

1.结构 内部实际上是一个PN结,将电极引线和其封装在一起就构成了二极管 拓展:点接触型二极管,面接触型二极管 2.工作原理 3.参数(以肖特基二极管SS56为例) MAX Forward Voltage(最大导通电压) ,因为SS5…

Jvm-hotspot 总结系列-完整版(1)类加载器

一、类加载器子系统的作用(1)类加载器子系统负责从文件系统或网络中加载class文件,class文件在文件开头有特定的文件标识(cafebabe)咖啡宝贝。(2)ClassLoader只负责class文件的加载,…

广告业务系统 之 核心通道 —— “日志中心-s2s监测上报”

文章目录广告业务系统 之 核心通道 —— “日志中心-s2s监测上报”s2s 监测上报s2s 、c2s曝光/互动/Win数据上报监测上报AB 实验平台广告业务系统 之 核心通道 —— “日志中心-s2s监测上报” s2s 监测上报 s2s 监测上报,是 ADX 将广告的曝光、互动[点击/播放/下载…

赛事推荐 | 建筑物细粒度实例分割——2023 IEEE GRSS 数据融合赛道1

1. 赛题名称 建筑物检测和屋顶类型分类 2. 赛题背景 该轨道侧重于从高分辨率卫星光学图像和 SAR 图像中检测和分类建筑物屋顶类型。SAR 和光学模态有望提供补充信息。给定的数据集涵盖了全球六大洲的十七个城市。分类任务由 12 种细粒度的预定义屋顶类型组成。图 1 显示了一…

缺乏长线思考是扼杀工程师前途的屠刀.

缺乏长线思考是扼杀工程师前途的屠刀。 死局 工作几年后,最容易陷入一个隐形的死局,开发只关注实现需求,运维只关注部署、故障。待到七八年,一定会出现后继无力。被替代,早晚而已。 我相信很多领导都讲过沉淀方法论&am…

RK3399平台开发系列讲解(内核调试篇)如何使用perf进行性能优化

🚀返回专栏总目录 文章目录 一、perf list命令二、perf record/report命令三、perf stat命令四、perf top命令五、火焰图沉淀、分享、成长,让自己和他人都能有所收获!😄 📢perf 可以在 CPU Usage 增高的节点上找到具体的引起 CPU 增高的函数,然后我们就可以有针对性地…

开源PPP软件PRIDE-PPPAR使用记录(一)GFZRNX预处理

我们使用PRIDE-PPPAR软件对GNSS观测数据进行解算时,会遇到观测文件不能识别的问题。观测文件不能识别的主要原因是格式不对,可通过GNSS预处理软件进行修复。本文介绍一款由德国波兹坦地学研究中心(GFZ)开发的GNSS预处理软件GFZRNX…

Mathorcup数学建模竞赛第六届-【妈妈杯】B题:车位分布的优化设计与评价(附一等奖获奖论文、lingo和matlab代码)

赛题描述 随着现代社会经济的快速发展,房地产成为国家经济发展中重要的经济增长点之一。而小区内汽车停车位的分布对于小区居民的上下班出行影响很大。请建立数学模型,解决下列问题: 问题1:分析评判小区汽车停车位分布是否合理的几个关键指标,建立评判车位分布合理的数学…

Qt之单选按钮和复选按钮(QRadioButton、QCheckBox)

文章目录QRadioButton属性示例代码:QCheckBox属性示例代码QRadioButton QRadioButton片这个按钮类应对多选一的场景。打开windows的画图软件,我们就可以看到下面的: 如果我们刚开始的是线,然后我们又想画矩形,则线这…

作用域、生命期和程序的组织结构

一、局部变量和全局变量 在函数内部或复合语句中定义的变量,称为局部变量(local variable)。 (1)在一个函数内部定义的变量; (2)函数的形式参数; (3&…

微信小程序基础篇-模板与配置

本篇学习目标使用WXML渲染模板语法渲染页面结构使用WXSS样式美化结构使用app.json对项目进行全局配置使用page.json对页面进行个性化配置如何发起网络请求1.WXML模板语法1.1 数据绑定在data中定义数据:在页面的js文件在data对象中定义在wxml中使用数据:使…

记一次Windows Terminal的安装和配置

换的原因 之前一直用的cmder,结果突然一次更新之后,delete文本后显示文本错误,于是就换成Window Terminal了 安装 进微软商店搜或者官网跳转到微软商店 下载完后在winr里用wt可以进入 配置外观 配置(因为我是已经配好再写博客…

【微服务笔记05】微服务组件之Ribbon负载均衡器组件介绍及其使用

这篇文章,主要介绍微服务组件之Ribbon负载均衡器及其使用。 目录 一、Ribbon负载均衡器 1.1、负载均衡介绍 (1)负载均衡概念 (2)负载均衡分类 (3)Ribbon负载均衡思想 1.2、Ribbon的使用 …

Mybatis一发入魂

文章目录Mybatis官方中文文档一、Mybatis简介二、简单入门使用2.1、在pom.xml中添加依赖2.2、使用xml配置文件2.3、创建接口2.4、创建映射文件2.6、获取sqlsession实例并执行方法三、Mybatis的Xml配置文件3.1、properties属性3.2、settings设置3.3、typeAliases类型别名3.4、en…

试题 基础练习 高精度加法(java)

试题 基础练习 高精度加法提交此题 评测记录 资源限制内存限制:512.0MB C/C时间限制:1.0s Java时间限制:3.0s Python时间限制:5.0s问题描述输入两个整数a和b,输出这两个整数的和。a和b都不超过100位。算法描述由于a和b…

《架构300讲》学习笔记(151-200)

前言 内容来自B站IT老齐架构300讲内容。 151 Redis发布订阅机制是如何实现的? 152 阿里Seata分布式事务AT、TCC、SAGA、XA模式到底该怎么选? 153 超级实用!十分钟掌握Prometheus与Grafana监控SpringBoot应用 154 如何利用Docker快速构建…

Java面试题每日10问(7)

Core Java - OOPs Concepts: final keyword Interview Questions 1. What is the final variable? the final variable is used to restrict the user from updating it.If we initialize the final variable, we can’t change its value.The final variable - which is not…

论文阅读笔记《Multilevel Graph Matching Networks for Deep Graph Similarity Learning》

核心思想 本文提出一种多级图匹配网络(MGMN)用于图相似性的度量。常见的图相似性网络都是利用图神经网络或其他图嵌入技术将整幅图转化为特征向量,然后计算两个特征向量之间的相似程度。这种做法的缺点在于只关注了图一级的信息交互&#xff…

【随风丶逆风】2022年终总结

前言 又到了一年一度的年终总结了,回顾一年可谓一波三折,感慨良多,最有感触的大概就是疫情带来各种影响吧,经济下行、市场不景气、互联网寒冬。 回顾去年年终规划《【随风丶逆风】2021年终总结》,整体低于预期&#x…