【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task3

news2024/9/22 5:41:52

本文是关于李宏毅苹果书”第2章 实践方法论“学习内容的记录。

模型在测试集上表现不佳,可能是因为模型没有充分学习训练集。模型不能充分学习训练集的原因:

  • 模型偏差
  • 优化问题
  • 过拟合
  • 不匹配

一、模型偏差

模型偏差是指:由于模型过于简单,即便找到该模型的最优参数,模型的损失函数值实际还未达到最小。(想在海里捞针,但实际针不在海中)
在这里插入图片描述
此时可以通过重新设计模型、赋予模型更大灵活性降低模型偏差。

增加模型灵活性的方法有:

  • 增加特征
  • 设计规模更大的模型
  • 使用深度学习

二、优化问题

模型的损失函数值达不到实际最小的原因不一定是模型偏差,还可能是优化不佳。一般的优化方法是梯度下降法。梯度下降法可能只找到损失函数局部最小时的参数,而非真正的最优参数。(想在海里捞针,但没办法捞出来)
在这里插入图片描述

如何判断模型的损失函数值不够小是因为模型偏差还是优化问题?

  • 比较不同的模型,判断当前模型是否足够复杂

    先使用一些较小的模型或非深度学习方法,这类方法不容易出现优化失败的问题。

    如果更复杂的模型表现反而不好,可能是因为优化问题,需要使用其他方法更好地进行优化。

    更复杂的模型应该比简单的模型得到更低的损失,但在训练集上却并没有。这并不是过拟合,过拟合的模型能在训练集上获得更低的损失、在测试集上则效果变差。

三、过拟合

如果增大模型的灵活性后,模型在训练集上的表现变好,在测试集上的表现也变好,说明之前模型的瓶颈是模型偏差;

如果增大模型的灵活性后,模型在训练集上的表现变差,说明之前模型的瓶颈是优化问题;

如果增大模型的灵活性后,模型在训练集上的表现变好,在测试集上的表现变差,说明当前模型过拟合。

过拟合的模型会在接收测试集的输入时,输出训练集中这个输入对应的标签,而这个标签可能跟实际的标签差距较大,使得模型在测试集上的表现较差。

过拟合的原因:

  • 模型极端地拟合数据的分布。
    在这里插入图片描述

解决过拟合的方法:

  • 数据增强

    根据对问题的理解创造新的数据并参与训练。如:在图像识别中,对训练集中的图片进行裁剪、左右翻转等操作得到新的图片。数据增强的方式要根据对数据的特性以及要处理的问题的理解进行选择。

  • 限制模型

    假设已知模型输入与模型输出之间是二次关系,选择与二次关系有关的模型有助于求到与真实分布接近的函数。

    在这里插入图片描述

    限制模型的方法:

    • 减少模型参数。如:减少神经网络中神经元的数量、将FC修改为CNN。
    • 减少使用的特征。
    • 早停、正则化、丢弃法

    同时要注意模型的限制不能太大,否则可能出现模型偏差问题。

    在这里插入图片描述

四、交叉验证

训练模型时,划分训练集和验证集数据的方法;

  • 按比例划分。如:90%的数据作为训练集,10%的数据作为验证集。

  • k折交叉验证。这个方法可以弥补随机划分训练集和验证集带来的划分不当问题。

    k折交叉验证将数据划分为k份,每份数据都有充当验证集的机会。

    在这里插入图片描述

五、不匹配

不匹配是指训练集跟测试集的分布不同。此时即使模型在训练集上获得较好的性能,也无法在测试集上正确预测。与过拟合不同的是,不匹配问题无法通过增加训练集克服。

此时需要分析训练集和测试集的产生方式,判断是否出现不匹配的情况。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2101751.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网站如何针对不同的DDOS进行防御?

建设网站租用服务器是多数企业及个人的选择,一个安全稳定的服务器对网站的重要性无需再赘述。要保证服务器租用的安全和稳定,除了需要服务器自身有强大的硬、软件基础之外,还需要防范外部的一些因素,常见的就是各种网络攻击&#…

Linux 上如何做MySQL数据备份

目录 SQL备份脚本创建crontabcrontab命令总结查看特定目录中的周期性任务 crontab(cron table 的缩写)是 Unix/Linux 系统上用于设置周期性被执行的任务的工具。它允许用户定义需要在特定时间(比如每天凌晨、每周的某个时间等)自动…

驭势科技研究成果入选学术顶会IROS 2024

近日,驭势科技团队关于自动驾驶车辆定位算法的最新研究成果《LiDAR-based HD Map Localization using Semantic Generalized ICP with Road Marking Detection》,创造性地解决了基于LiDAR的实时路标检测和高精地图配准所带来的挑战,成功入选国…

汇川技术|KingIOServer与AC810PLC通过ModbusTCP通讯测试

哈喽,你好啊,我是雷工! 最近有个项目用亚控的KingSCADA软件开发SCADA系统,需要和汇川的AC810PLC进行通讯; 本节测试亚控的采集软件KingIOServer与汇川的AC810PLC的通讯测试。 以下为测试笔记。 01 效果演示 测试过程…

3个苹果锁屏密码解锁方法,帮你快速解决密码忘记的烦恼!

苹果手机锁屏密码忘记了是一件很常见的问题,但也是一件让人头疼的事情。如果你遇到了这样的问题,不要着急,因为有很多方法可以帮助你解锁iPhone。下面我们将介绍四种简单的方法来解锁iPhone。 一、使用密码解锁工具 iphone忘记了密码怎么解锁…

iconfont图标字体库详细介绍

概述 图标库在前端开发中应用十分广泛,图标库不仅会丰富美化界面的展示,语义化的图标库更能简洁明了地向用户传达某些信息,比如功能的特性和作用,引导用户,极大提高系统的易用性。在没有 UI 设计师的情况下&#xff0…

【C++】手动实现队列的封装(C++)

目录 源代码&#xff1a; 输出结果如下&#xff1a; 实现以下封装 源代码&#xff1a; #include <iostream>using namespace std;class Queue { private:int* arr; // 队列的动态数组int front; // 队列头部元素的索引int rear; // 队列尾部元素的索引in…

新版某数字壳脱壳,过frida检测,及重打包

目录 脱壳 寻找特征& frida hook 过frida检测 修复dex 重打包 修改smail 去签名校验 正文 大家好&#xff0c;我是小生&#xff0c;这次的app是一个国内某计划app, 功能相当全&#xff0c;界面也很美观&#xff0c;很实用&#xff0c;这个app我很欣赏。总共花了有…

【SQL】Delete使用

目录 语法 需求 示例 分析 代码 语法 DELETE删除表中所需内容 删除表中满足特点条件的行&#xff1a;DELETE FROM 表名 WHERE 条件; 删除表中所有行&#xff1a;DELETE FROM 表名; WHERE子句 WHERE子句用于指定从表中选取记录的条件。允许筛选数据&#xff0c;只返回满足…

【文献精读】基于驱动力表的无人车终端无约束预测纵向控制(TVT)

写在前面&#xff1a; &#x1f31f; 欢迎光临 清流君 的博客小天地&#xff0c;这里是我分享技术与心得的温馨角落。&#x1f4dd; 个人主页&#xff1a;清流君_CSDN博客&#xff0c;期待与您一同探索 移动机器人 领域的无限可能。 &#x1f50d; 本文系 清流君 原创之作&…

ElasticSearch学习笔记(六)自动补全、拼音分词器、RabbitMQ实现数据同步

文章目录 前言11 自动补全11.1 拼音分词器11.2 自定义分词器11.3 自动补全查询 12 数据同步12.1 实现方案12.1.1 同步调用12.1.2 异步通知12.1.3 监听binlog 12.2 异步通知实现数据同步12.2.1 声明交换机和队列12.2.2 发送MQ消息12.2.3 接收MQ消息并操作ES 前言 ElasticSearch…

数据结构————单向链表

头插&#xff1a; 尾插&#xff1a; 头删&#xff1a; 尾删&#xff1a;

一种常用嵌入式开发代码库

链接&#xff1a;https://gitee.com/zhangxinyuanqi/varch 使用开源协议&#xff1a;GPL-2.0 varch简介 varch&#xff08;we-architecture&#xff0c;意为我们的框架库&#xff09;是嵌入式C语言常用代码模块库&#xff0c;包含了嵌入式中常用的算法库, 数据结构&#xff…

JPA关联MyBatis

3.1 JPA 多表查询 多表查询在 Spring Data JPA 中有两种实现方式&#xff0c;第一种是创建一个结果集的接口来接受多表连接查询后的结果&#xff0c;第二种是利用 JPA 的关联映射来实现 3.1.1 数据库表及关系 CRM 数据库中除 sys_user(用户)表外&#xff0c;还包括sys_role(角…

触想内嵌式工业一体机应用于智能检票机改善旅游体验

一、行业发展背景 每年下半年&#xff0c;暑假、中秋、国庆总是接踵而至&#xff0c;随之而来的出游高峰一波接一波。凶猛需求之下&#xff0c;各地景区、游乐园客流压力加大&#xff0c;特别在检票环节&#xff0c;人工检票效率低、秩序混乱&#xff0c;导致常常出现检票口人山…

POL(Point-of-Load)负载点电源

负载点&#xff08;POL&#xff09;电源在靠近负载处单独放置电源调节器(线性稳压器或DC-DC)&#xff0c;解决了高性能半导体器件&#xff0c;例如&#xff1a;微控制器、ASIC等&#xff0c;所面临的高峰值电流、低噪声裕量等设计挑战。 一般我们会把负载点电源尽量靠近负载放…

乾元通多卡聚合技术在无人配送车应用领域通信保障方案

在无人驾驶公交车、安防车、售卖车、清扫车相继亮相后&#xff0c;无人配送车在全国各地也陆续“上岗”&#xff0c;为我们的城市带来了与众不同的“智慧体验”&#xff0c;让城市有了“科技温度”。 无人配送车在营业部装载好快递后&#xff0c;会按照提前规划好的路线出发&a…

sqli-labs靶场通关攻略 61-65

主页有sqli-labs靶场通关攻略 1-60 第六一关 less-61 步骤一&#xff1a;闭合方式&#xff1a;?id1)) -- 步骤二&#xff1a;查询数据库 ?id1)) and updatexml(1,concat(1,database()),1) -- 步骤三&#xff1a;查出网站的数据库表名 ?id1)) and updatexml(1,concat(0x7e…

15 用户管理

如果我们只能使用root用户&#xff0c;这样存在安全隐患。这时&#xff0c;就需要使用mysql的用户管理 张三只能操纵mytest这个库&#xff0c;李四只能操纵msg这个库&#xff0c;如果给他们root账户&#xff0c;就可以操纵所有库&#xff0c;风险太大 用户 用户信息 用户都存…

项目技巧三

目录 我们现在要实现一个接口功能 1.我们先书写sql语句 2.编写接口 3.书写业务逻辑 4.书写mapper 结果&#xff1a; 缺点&#xff1a;没有根据涨跌幅区间的大小来排序 1.yml文件 2.在value object包下映射这个yml文件 3.开启这个配置类进行映射&#xff0c;并把它交给s…