【Datawhale X 李宏毅苹果书 AI夏令营】《深度学习详解》Task1 打卡

news2024/11/16 0:00:10

文章目录

  • 前言
    • 学习目标
  • 一、机器学习
  • 二、案例学习
  • 三、隐藏任务
    • 隐藏任务①:
      • 1. **回归 (Regression)**
      • 2. **分类 (Classification)**
      • 3. **模型 (Model)**
      • 4. **特征 (Feature)**
      • 5. **超参数 (Hyperparameter)**
      • 6. **训练集 (Training Set)**
      • 7. **验证集 (Validation Set)**
      • 8. **测试集 (Test Set)**
      • 9. **过拟合 (Overfitting)**
      • 10. **欠拟合 (Underfitting)**
      • 11. **损失函数 (Loss Function)**
      • 12. **正则化 (Regularization)**
      • 13. **梯度下降 (Gradient Descent)**
      • 14. **交叉验证 (Cross-Validation)**
    • 隐藏任务②:
      • 1. 预测函数模型
      • 2. 绝对误差
      • 3. 损失函数(平均绝对误差 MAE)
      • 4. 均方误差(MSE)
      • 5. 梯度下降法的权重更新
    • 隐藏任务③:
    • 隐藏任务④:
    • 隐藏任务⑤:
  • 总结


前言

本文是【Datawhale X 李宏毅苹果书 AI夏令营】的Task1学习笔记打卡。

学习目标

李宏毅老师对应视频课程:https://www.bilibili.com/video/BV1JA411c7VT?p=2

屏幕截图 2024-08-26 191806.png

屏幕截图 2024-08-26 191612.png


一、机器学习

屏幕截图 2024-08-26 150121.png

随着要找的函数不同,机器学习有不同的类别。假设要找的函数的输出是一个数值,一个标量(scalar),这种机器学习的任务称为回归。

除了回归以外,另一个常见的任务是分类(classification,)。分类任务要让机器做选择题。

屏幕截图 2024-08-26 150249.png

在机器学习领域里面,除了回归跟分类以外,还有结构化学习(structured learning)。
结构化学习(Structured Learning)通常指的是处理和学习结构化数据的任务。结构化数据具有内在的复杂结构或关系,而不仅仅是简单的向量或标量。与传统的分类或回归任务不同,结构化学习的目标是预测复杂对象,例如序列、树或图形。

屏幕截图 2024-08-26 150309.png

二、案例学习

机器学习找函数的过程,分成 3 个步骤。第一个步骤是写出一个带有未知参数的函数 f,其能预测未来观看次数。比如将函数写成y = b + wx1 (1.1)

屏幕截图 2024-08-26 150421
猜测往往来自于对这个问题本质上的了解,即领域知识(domain knowledge)

屏幕截图 2024-08-26 150605
如图 1.2 所示的等高线图,就是试了不同的参数,计算它的损失,画出来的等高线图称为误差表面(error surface)。

屏幕截图 2024-08-26 154213.png

右侧红点这个位置是真的可以让损失最小的地方,称为全局最小值(global minima),而 wT 这个地方称为局部最小值(local minima),其左右两边都比这个地方的损失还要高一点,但是它不是整个误差表面上面的最低点。

屏幕截图 2024-08-26 150639.png
事实上局部最小值是一个假问题,在做梯度下降的时候,真正面对的难题不是局部最小值。
有两个参数的情况下使用梯度下降,其实跟刚才一个参数没有什么不同。如果一个参数没有问题的话,可以很快的推广到两个参数。

屏幕截图 2024-08-26 164220.png

三、隐藏任务

隐藏任务①:

找出本篇中形如回归(regression)加粗字体的术语,并用自己的话进行解释,列成表格,与学习群的其他小伙伴讨论你的理解和搜索到的相关案例。

1. 回归 (Regression)

  • 定义:回归是一种监督学习任务,目标是预测连续值输出。例如,预测房价、温度等。
  • 示例:线性回归(Linear Regression)、多元回归(Multiple Regression)。

2. 分类 (Classification)

  • 定义:分类也是一种监督学习任务,目标是将输入数据分配到预定义的类别中。例如,垃圾邮件过滤(垃圾邮件或正常邮件)。
  • 示例:逻辑回归(Logistic Regression)、支持向量机(Support Vector Machine, SVM)。

3. 模型 (Model)

  • 定义:模型是指用于进行预测的数学或计算机程序,基于训练数据的模式,做出预测或决策。模型可以是简单的线性模型,也可以是复杂的深度神经网络。
  • 示例:线性模型(Linear Model)、神经网络(Neural Network)。

4. 特征 (Feature)

  • 定义:特征是从数据中提取的有助于预测的输入变量。特征是模型学习的基础,通常由原始数据转换或处理得到。
  • 示例:在房价预测中,特征可以是房子的面积、卧室数量、位置等。

5. 超参数 (Hyperparameter)

  • 定义:超参数是模型的外部配置参数,无法通过训练数据直接学习得到,而需要在训练前设置。它们影响模型的训练过程和最终性能。
  • 示例:学习率(Learning Rate)、正则化系数(Regularization Coefficient)、树的深度(Depth of Trees)等。

6. 训练集 (Training Set)

  • 定义:训练集是用于训练模型的数据集,通过学习这些数据,模型调整其参数以最大化预测性能。
  • 示例:一个包含房价和相关特征的数据集,用于训练房价预测模型。

7. 验证集 (Validation Set)

  • 定义:验证集用于评估模型的性能并进行超参数调优。它帮助判断模型是否过拟合或欠拟合。
  • 示例:在训练模型时,将数据划分为训练集和验证集,验证集用于评估模型在未见数据上的表现。

8. 测试集 (Test Set)

  • 定义:测试集是完全独立于训练和验证过程的数据集,用于最终评估模型的性能。
  • 示例:训练完模型后,用测试集的数据来评估模型在现实世界中的表现。

9. 过拟合 (Overfitting)

  • 定义:过拟合是指模型在训练集上表现得非常好,但在新数据上表现不佳。这通常是因为模型学到了数据中的噪声或异常。
  • 示例:一个过于复杂的模型,如深度过大的决策树,可能在训练数据上表现得非常好,但在测试数据上表现不佳。

10. 欠拟合 (Underfitting)

  • 定义:欠拟合是指模型过于简单,无法捕捉训练数据中的模式,导致在训练集和新数据上都表现不佳。
  • 示例:一个线性模型可能无法准确预测具有非线性关系的数据,表现出欠拟合。

11. 损失函数 (Loss Function)

  • 定义:损失函数用于衡量模型预测值与实际值之间的差距。模型通过最小化损失函数来优化其参数。
  • 示例:均方误差(Mean Squared Error, MSE)、交叉熵损失(Cross-Entropy Loss)。

12. 正则化 (Regularization)

  • 定义:正则化是一种防止过拟合的技术,通过在损失函数中加入惩罚项,使模型的复杂度降低,从而提升泛化能力。
  • 示例:L1正则化(Lasso)、L2正则化(Ridge)。

13. 梯度下降 (Gradient Descent)

  • 定义:梯度下降是一种优化算法,通过迭代调整模型参数,使损失函数达到最小值。模型通过计算损失函数的梯度,沿梯度方向更新参数。
  • 示例:批量梯度下降(Batch Gradient Descent)、随机梯度下降(Stochastic Gradient Descent, SGD)。

14. 交叉验证 (Cross-Validation)

  • 定义:交叉验证是一种评估模型性能的技术,通过将数据集分成多个子集,反复训练和验证模型,得到更可靠的性能评估。
  • 示例:k折交叉验证(k-Fold Cross-Validation)。

隐藏任务②:

整理出本篇中所有的公式,手动摘录,并尝试理解。

1. 预测函数模型

y = b + w x 1 y = b + wx_1 y=b+wx1
其中, y y y是预测的结果,例如某天的观看次数; x 1 x_1 x1是已知的特征,如前一天的观看次数; b b b是偏置, w w w是权重。该公式用于根据已知数据预测目标值。

2. 绝对误差

e = ∣ y − y ^ ∣ e = |y - \hat{y}| e=yy^
绝对误差用于衡量预测值$ \hat{y} 与实际值 与实际值 与实际值y$之间的差异。

3. 损失函数(平均绝对误差 MAE)

L = 1 N ∑ n e n L = \frac{1}{N} \sum_{n} e_n L=N1nen
其中, N N N是数据的数量, e n e_n en是第 n n n个预测值的误差。MAE用于衡量整体预测误差。

4. 均方误差(MSE)

e = ( y − y ^ ) 2 e = (y - \hat{y})^2 e=(yy^)2
MSE用于度量平方误差,这比绝对误差更加惩罚大的误差。

5. 梯度下降法的权重更新

w 1 ← w 0 − η ∂ L ∂ w ∣ w = w 0 w_1 \leftarrow w_0 - \eta \frac{\partial L}{\partial w}\Big|_{w=w_0} w1w0ηwL w=w0
其中, η \eta η是学习率,表示每次迭代中参数的更新幅度。该公式用于更新权重 w w w以最小化损失函数。

隐藏任务③:

找出机器学习找函数的3个步骤!并查找资料,交叉佐证这些步骤。

三步骤可以概括为:

  1. 定义模型:选择一个模型并初始化其参数。
  2. 定义损失函数:定义一个损失函数来量化模型预测的准确性。
  3. 优化:使用优化算法来最小化损失函数,从而找到最佳的模型参数。

隐藏任务④:

隐藏任务:归纳梯度下降的步骤。

首先选择一个点,随后我们在这个点取微分,并且定义一个学习率,我们假设步长为该点的微分乘上学习率(这样做的好处,当曲线趋近平缓的时候,微分也小,往后逼近的速度也会变慢),我们就按照这个步长依次往最小点逼近,直到逼近或者达到一个相对满意的效果。如果是两个变量,就要乘以负数的步长,因为这个双变量的微分是有方向的,我们要按照一个钝角的方向才能靠拢,而最好的方向显然就是180度,所以要乘负号。

隐藏任务⑤:

为什么局部最小是一个假问题,局部最小怎么解决?真正的难题是什么?

鞍点(Saddle Points),过拟合(Overfitting),欠拟合(Underfitting),计算资源,模型设计 是真正的难点。


总结

好看爱看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2076578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Seata(简单配置就能使用,含下载)

Seata参考资料和下载 Seata官网: Apache Seata Seata中文开发文档: Seata 是什么? | Apache Seata Seata下载地址: 这里提供一个最新版的 seata-server-2.0.0.zip官方版下载丨最新版下载丨绿色版下载丨APP下载-123云盘 Seata的配置 第一步解压Seat…

Vue笔记总结(Xmind格式):第一天

Xmind鸟瞰图: 简单文字总结: vue知识总结: vue的优点: 1.体积小 2.更高的运行效率 3.双向数据绑定 4.生态丰富,学习成本低 vue指令: 1.指令:带有v-前缀的特殊属性 2…

基于SSM的学生管理系统的设计与实现(包含源码、sql脚本、导入视频教程)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的学生管理系统2拥有三种角色 管理员:学生管理、教师管理、课程管理、个人信息管理等教师:添加课程、录入成绩、查看选课名单和结课、个人信息等学生&…

关于Linux sudo授权的那点事

sudo可以让我们以其他用户的身份执行命令,而只需要自己的密码(甚至不需要密码)。这比su切换用户需要目标用户的密码要方便。 从授权角度来审视,sudo比su的授权粒度要细很多,su属于大放权,例如:s…

STM32——PWR电源控制的低功耗模式

1、理论知识 本节主要学习配置低功耗模式:防止在空闲时候耗电(关闭/唤醒哪些硬件很重要) 虽然STM32外部需要使用3.3V供电,但内部核心电路CPU、外设和存储器使用1.8V供电即可,这3者需要与外界交流时才需要3.3V供电 从上…

第一课,认识C++,和计算机对话

一,编程是什么?C是什么? 编程是编写代码来实现需要的功能,C就是用来编程的语言,计算机没法直接听懂人类的语言,需要用编程语言C来和计算机交流。 二,编程能做哪些事情? ①让机器人…

openwrt系统通过ZeroTier插件实现远程管理

OpenWrt是一款开源的路由器系统,可以自由安装各种插件,但由于是非商业化的系统,没有统一的云管理平台,所以远程管理相对麻烦,需要借助于第三方服务器。当然如果家里宽带有独立公网ip,还可以通过ddns实现远程…

只用一个 HTML 元素可以写出多少形状?——不规则图形篇(序)

上一篇章,我们的不规则图形篇发了之后,我一个朋友说我“良心发现”了,不提供新的知识点了,而是实实在在的一些案例直接丢给大家。 的确,前面的每一个篇章,我都有引入新的知识点。 规划这个系列&#xff0…

某系统接入网关任意文件读取漏洞

当你征服一座山峰时,它已经在你脚下了,你必须再找一座山峰去征服,否则,你只有下山,走下坡路了 漏洞描述 某系统接入网关存在任意文件读取漏洞,攻击者通过构造请求可以读取服务器任意文件 漏洞复现 访问…

“智能安全新防线:深信达软加密狗的全面防护功能解析“

在智能安全设备领域,深信达的CBS赛博锁以其独特的软加密狗技术,为设备提供了全面的安全保障。CBS赛博锁通过以下几个核心功能来保障智能设备的安全性: 1. **许可管理**:CBS赛博锁通过硬件唯一身份ID和许可授权管理,确保…

云匹面粉直供小程序的设计

管理员账户功能包括:系统首页,个人中心,用户信息管理,种植基地管理,云匹小麦采收管理,云匹面粉加工,面粉分类管理,云匹面粉管理,系统管理 微信端账号功能包括&#xff1…

Redis数据的持久化是如何做的?(面试版)

在Redis中提供了两种数据持久化的方式:RDB、AOF RDB快照 RDB全称Redis Database Backup file(Redis快照),也被叫做Redis数据快照。简单来说就是创建快照来获取内存中某个时间点上的副本。当Redis实例故障重启后,从磁盘读取快照文件&#xf…

[java][代码]使用java在mongodb上传下载文件

建立java项目新建lib包&#xff0c;导入jar包 3.链接mongdo数据库代码 /** * 1.获取连接 * 2.上传文件 * 3.下载文件 * 4.删除文件 * */ public static GridFS GetMongoGridFS(){ List<ServerAddress> adds new ArrayList<>(); ServerAddress serverAddress new…

根据数据库设计开发一套通用的电子商务平台

目录 案例 【题目】 【问题 1】(9 分) 【问题 2】(9 分) 【问题 3】(7 分) 【答案】 【问题 1】解析 【问题 2】解析 【问题 3】解析 相关推荐 案例 阅读以下关于数据库设计的叙述&#xff0c;在答题纸上回答问题 1 至问题 3。 【题目】 某制造企业为拓展网上销售业…

如何从零开始在 Vue 3 项目中引入 Element Plus

如果想在 Vite 生成的 Vue 3 下项目中&#xff0c;从头开始使用 Element Plus UI 库&#xff0c;并成功展示到页面&#xff0c;可以按照如下步骤操作&#xff1a; 1. 创建 Vue 3 项目&#xff08;如果还没有&#xff09; 使用 vite 创建 npm create vitelatest my-vue-app -…

vue3 内置的特殊属性ref

Vue 3 中的数据绑定是通过模板语法实现的。开发者可以在模板中使用特殊的语法来绑定数据&#xff0c;例如使用双花括号 {{}} 来显示数据&#xff0c;或者使用 v-bind 指令来绑定属性。 当数据发生变化时&#xff0c;Vue 会自动更新绑定的数据在模板中的显示&#xff0c;实现页面…

CSS盒子模型【怪异盒模型、定位看这一篇就够了!!!】

目录 盒子模型 width和height属性 width属性 height属性 width和height的特性 边框属性 边框的三要素小属性 四个方向的边框的三要素小属性 边框应用场景-制作三角形 单独设置四个圆角 盒子水平居中 盒子模型占位计算 盒模型可视宽高 盒模型实际占位 box-sizing怪…

启动Application 报错:no mapping for GET /(已解决)

根据以上内容&#xff0c;帮助我顺利解决了此问题 自己的错误&#xff1a;因为我使用的是框架嘛&#xff0c;然后生成了一个SpringBoot项目后&#xff0c;resources下面就会有一个static的类&#xff0c;用于存放静态资源类&#xff0c;后面我把静态资源放在里面&#xff0c;但…

大脑可视化:多种方式实现fMRI的ROI的绘图

前言 在探索神经科学的深邃领域中&#xff0c;我们常常面临着如何将复杂的脑区数据以一种清晰、直观的方式呈现给同行和公众的挑战。随着功能性磁共振成像&#xff08;fMRI&#xff09;技术的发展&#xff0c;我们拥有了更多工具来揭示大脑的奥秘。本文旨在介绍一系列笔者学习的…

一键安装!系统之家Win7纯净版镜像文件:无捆绑软件!

今日系统之家小编给大家带来做到真正纯净的Win7纯净版系统&#xff0c;该版本系统将捆绑软件都删除了&#xff0c;系统特别干净&#xff0c;安装后整体操作体验感很好。系统运作速度也快&#xff0c;兼容性出色&#xff0c;也没有蓝屏问题的出现&#xff0c;时刻都能放心使用。…