【Datawhale X 李宏毅苹果书 AI夏令营】《深度学习详解》Task3 打卡

news2024/9/20 14:53:33

文章目录

  • 前言
  • 学习目标
  • 一、优化策略
  • 二、模型偏差
  • 三、优化问题
  • 三、过拟合
    • 增加训练集
    • 给模型一些限制
  • 四、交叉验证
  • 五、不匹配
  • 总结


前言

本文是【Datawhale X 李宏毅苹果书 AI夏令营】的Task3学习笔记打卡。

学习目标

李宏毅老师对应视频课程:https://www.bilibili.com/video/BV1JA411c7VT?p=4
《深度学习详解》第二章主要介绍了训练模型时的优化方法。


一、优化策略

完成的作业如果在 Kaggle 上的结果不太好,虽然 Kaggle 上呈现的是测试数据的结果,但要先检查训练数据的损失。
看看模型在训练数据上面,有没有学起来,再去看测试的结果。

Kaggle 是一个全球知名的数据科学和机器学习竞赛平台,同时也是一个数据科学社区。它提供了各种与数据科学相关的资源,包括竞赛、数据集、代码共享、讨论论坛和学习资源。

在这里插入图片描述

二、模型偏差

模型偏差可能会影响模型训练,所以如果模型的灵活性不够大,可以增加更多特征,可以设一个更大的模型,可以用深度学习来增加模型的灵活性,这是第一个可以的解法。

在这里插入图片描述

三、优化问题

但是并不是训练的时候,损失大就代表一定是模型偏差,可能会遇到另外一个问题:优化做得不好。

在这里插入图片描述

一个建议判断模型偏差或者优化问题的方法,通过比较不同的模型来判断模型现在到底够不够大。

在这里插入图片描述

并不是所有的结果不好,都叫做过拟合。
在训练集上,20 层的网络损失其实是比较低的,56 层的网络损失是比较高的,如图 2.4(b) 所示,这代表 56 层的网络的优化没有做好,它的优化不给力。

在这里插入图片描述

这边给大家的建议是看到一个从来没有做过的问题,可以先跑一些比较小的、比较浅的网络,或甚至用一些非深度学习的方法,比如线性模型、支持向量机(Support Vector Machine,SVM),SVM 可能是比较容易做优化的,它们比较不会有优化失败的问题。

在这里插入图片描述

三、过拟合

为什么会有过拟合这样的情况呢?

如果模型它的自由度很大的话,它可以产生非常奇怪的曲线,导致训练集上的结果好,但是测试集上的损失很大。

在这里插入图片描述

怎么解决过拟合的问题呢,有两个可能的方向:

增加训练集

可以做数据增强(data augmentation,),这个方法并不算是使用了额外的数据。

在这里插入图片描述

给模型一些限制

全连接网络(fully-connected network)其实是一个比较有灵活性的架构,而卷积神经网络(Convolutional Neural Network,CNN)是一个比较有限制的架构。

在这里插入图片描述

  • 给模型比较少的参数。如果是深度学习的话,就给它比较少的神经元的数量。

  • 或者用比较少的特征,本来给 3 天的数据,改成用给两天的数据,其实结果就好了一些。

  • 还有别的方法,比如早停(early stopping)、正则化(regularization)和丢弃法(dropoutmethod)。

在这里插入图片描述

随着模型越来越复杂,训练损失可以越来越低,但测试时,当模型越来越复杂的时候,刚开始,测试损失会跟著下降,但是当复杂的程度,超过某一个程度以后,测试损失就会突然暴增了。

在这里插入图片描述

可以选一个中庸的模型,不是太复杂的,也不是太简单的,刚刚好可以在训练集上损失最低,测试损失最低。

四、交叉验证

比较合理选择模型的方法是把训练的数据分成两半,一部分称为训练集(training set),一部分是验证集(validation set)。

其实最好的做法,就是用验证损失,最小的直接挑就好了,不要管公开测试集的结果。在实现上,不太可能这么做,因为公开数据集的结果对模型的选择,可能还是会有些影响的。
理想上就用验证集挑就好,有过比较好的基线(baseline)算法以后,就不要再去动它了,就可以避免在测试集上面过拟合。

在这里插入图片描述

五、不匹配

真实曲线与预测曲线之间出现反常情况,这种错误的形式称为不匹配。

在这里插入图片描述

不匹配跟过拟合其实不同,一般的过拟合可以用搜集更多的数据来克服,但是不匹配是指训练集跟测试集的分布不同,训练集再增加其实也没有帮助了。

在这里插入图片描述


总结

《深度学习详解》的前两章到此就顺利看完了,本质上是对李宏毅老师《机器学习》课程的一个口语化文字记录,非常通俗易懂,后面还有更加有意思的内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2102300.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JMeter 安装使用

JMeter 安装使用 a.安装 下载链接:Apache JMeter - Download Apache JMeter 环境变量 打开 cmd 输入 jmeter,即可启动 b.使用 http请求接口 300 个线程设置 1 s 的预热时间 右键 start

B端:工作台页面放什么?不知道,这里告诉你10个常见内容。

工作台是B端系统的核心页面,也是最常用的页面,该页面的上通常放哪些内容了,是中说纷纭,本文把常放内容给大家列举下。 B端工作台页面是专门为企业用户设计的工作台,通常需要包含一些与企业工作相关的功能和信息。以下…

传知代码-让机器感受你的情绪!(论文复现)

代码以及视频讲解 本文所涉及所有资源均在传知代码平台可获取 让计算机理解你的情绪! 随着近年来社交媒体的快速增长,社交媒体上的用户生成内容(例如视频)的量大幅增加。不同模态的自动情感分析有利于人机交互,并吸…

跟我一起学FPGA (二) 语法讲解

本章讲解 1 、Verilog 概述和基础知识; 2 、Verilog 程序框架和高级知识点; 3 、Verilog 编程规范。 1.Verilog 概述和基础知识 Verilog 是一种硬件描述语言,以文本形式来描述数字系统硬件的结构和行为的语言,用它可以表示逻辑电…

Vivado2018.3版本_将bit文件转化为bin文件

Vivado2018.3版本_将bit文件转化为bin文件 1、配置转换文件 2、下载到flash中

用 count(*)哪个存储引擎会更快?

InnoDB 引擎执行 count 函数的时候,需要通过遍历的方式来统计记录个数,而 MyISAM 引擎执行 count 函数只需要 0(1 )复杂度,这是因为每张 MyISAM 的数据表都有一个 meta 信息有存储了row_count值,由表级锁保证一致性,所…

[数据集][目标检测]鲜花检测数据集VOC+YOLO格式25215张106类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):25215 标注数量(xml文件个数):25215 标注数量(txt文件个数):25215 标…

给P人一点小小震撼!铁威马UI全新设计!更友好更美观~

开学了,小马居然发现有学校竟然玩起了新花样,通过MBTI来分宿舍,这脑洞大开的创意简直让人直呼内行! 你是P人还是J人? 在MBTI人格分类中,J人喜欢条理清晰的计划,而P人则倾向于随性所欲。 想象…

第十五届北京青年相声节宣传片发布

第十五届北京青年相声节宣传片,围绕相声演员的四个基本功:说、学、逗、唱,搭建四个生活场景,编创四个微短故事,演绎四组人物关系,向大众普及“相声就在我们身边”的深刻内涵。

如何轻松的步入编程的第一课?相信你就是那个伟大的天才!

第一次编程,会让初学者感到既兴奋又有些紧张。以下是一些建议 明确学习目标:首先,思考你为什么想学编程。是为了职业发展、兴趣爱好、还是仅仅想了解新技术?明确的目标能帮你保持学习的动力。选择合适的编程语言:对于…

【持续更新】Solid Explorer premium2.8.48.200291文件管理器最新免费高级解锁版

Solid Explorer文件管理器高级版解锁,拥有诸多增强功能和额外特性,使其区别于标准版。 ▨ 解锁版主要特点 • 解锁高级功能:无限制地访问所有高级功能 • 无广告体验:享受无任何烦人广告的流畅用户界面 • 增强安全性&#xff1a…

软件性能测试重要性简析,好用的性能测试工具有哪些?

软件性能测试是软件开发和维护过程中一个至关重要的环节。通过性能测试,企业能够评估软件在不同负载下的表现,预测其在真实环境中的表现,以确保用户能获得优秀的使用体验。 软件性能测试可以被定义为一种评估软件系统的快速性、响应性、稳定…

【ShuQiHere】重新定义Linux桌面生态:Gnome-Pie与Touché的双剑合璧

【ShuQiHere】 从期待到失望的初体验 当我第一次拿到Logitech Master 3S鼠标时,心中的兴奋感油然而生。它精致的做工、独特的造型,以及舒适的握感,让我感觉它不仅是一款鼠标,更是一件工艺品。再加上令人期待的自定义手势功能&am…

RR隔离级别下还有幻读吗

文章目录 1 背景2 验证2.1 验证准备2.1.1 环境信息2.1.2 数据准备 2.2 当前读场景验证2.2.1 前言2.2.2 场景验证2.2.3 小结 2.3.快照读场景验证2.3.1 前言2.3.2 场景验证2.3.3 小结 3 分析4 总结 1 背景 InnoDB默认的事务隔离级别是REPEATABLE-READ,它为了解决该隔离…

数学 小朋友按如图所示的规则练习数数,1大拇指,2食指,3中指,4无名指,5小指,6无名指,…,一直数到2024的时候,是哪一个手指?

1、先上一张图: 如图,一个小朋友按如图所示的规则练习数数,1大拇指,2食指,3中指,4无名指,5小指,6无名指,…,一直数到2024时,对应的指头是&#xf…

UE的Gameplay框架(三) —— Level和World

这篇文章关注于Level和World,对其在Gameplay框架中的作用及使用做简单讲解。 文章目录 Level和World的作用关卡流送关卡流送体积蓝图加载 参考资料 Level和World的作用 在UE里,Level 可以看作是 Actors 的容器,其有一个LevelScriptActor用于处…

【Netty】实战:基于WebSocket的聊天室

​ 本文将使用Netty快速实现一个聊天室应用,该应用基于WebSocket协议,用户可以在浏览器内聊天。 实现过程很简单,就几步。 一、处理Http请求 package cn.md.netty.websocket.groupchat;import io.netty.channel.*; import io.netty.handle…

yolov8目标检测pyside6可视化图形界面+检测源码ui文件——用于计数统计

项目结构 YOLOv8模型加载:加载预训练的YOLOv8模型。PySide6 GUI:设计图形用户界面,用于显示检测结果和控制选项。摄像头/视频输入:从摄像头或视频文件读取图像帧。目标检测:使用YOLOv8模型对输入图像进行实时目标检测…

Explorer++:轻量级高效文件管理器!!

项目简介 Explorer 是一款专为Windows操作系统设计的轻量级且高效的文件管理器。作为Windows资源管理器的强大替代方案,它提供了丰富的特性和优化的用户体验,使得文件管理和组织变得更加便捷高效。无论是专业用户还是普通用户,都能从中受益&a…

Leetcode面试经典150题-92.反转链表II

解法都在代码里,不懂就留言或者私信 比反转链表I略微难一点点 /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}* ListNode(int val) { this.val val; }* ListNode(int val, Li…