2023春季李宏毅机器学习笔记 02 :机器学习基本概念

news2025/1/9 15:25:34

资料

  • 课程主页:https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php
  • Github:https://github.com/Fafa-DL/Lhy_Machine_Learning
  • B站课程:https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800

一、機器學習基本原理

机器学习本质:机器自动寻找一个最合适的函数f

根据函数的输出可以分为两类

  • Regression(回归):函数的输出是一个数值
    例如:输入输入今天的PM2.5值、温度、臭氧量等,输出明天的PM2.5值
  • Classification(分类):函数的输出是一个类别(选择题)
    例如:判断一封邮件是否为垃圾邮件
  • Structured Learning/Generative Learning(结构化学习/生成式学习):生成有结构的物件(如影像、文句等),更复杂

寻找函数f的步骤:
在这里插入图片描述

  1. 第一步:选定候选函数的集合Model;
    深度学习中类神经网络的结构(如:CNN、RNN、Transformer、Decision Tree等等)指的就是不同的候选函数集合,函数集合表示为H
    在这里插入图片描述

目的:缩小选择的范围;技巧性强
训练资料少时,L(f)小但测试差的函数就会多,这个时候画出集合范围要保守(小);反之测试数据多时,上述L(f)小但测试差的函数就会少

  1. 第二步:订出评价函数好坏的标准;
    使用Loss函数,将f做出输入,输入L函数:L(f),根据输出的大小,评价函数(越大越差),L的计算过程取决于training data
    在这里插入图片描述

常用方法:

  • supervised Learning(全部都有标准答案)
    semi-supervised Learning(没有标准答案,要定义评量标准)
    RL(reinforcement Learning)等等
  1. 第三步:找出最好的函数,最佳化Optimization
    在这里插入图片描述

将集合H中的所有函数带入L中,寻找Loss最小值
常用方法:Gradient Descent(Adam,AdamW…),Genetic Algorithm等等

超参数:手调参数

二、生成式学习的两种策略

生成式学习:生成有结构的物件
在这里插入图片描述

案例:

  • 生成影片:https://imagen.research.google/video/ 或https://audioldm.github.io/
  • 生成语音:https://dongchaoyang.top/InstructTTS/
  • 生成声音:https://audioldm.github.io/

两种策略在这里插入图片描述

  • 策略 1:各个击破AR(Autoregressive Model):上一个生成才生成下一个
  • 策略 2:一次到位NAR(Non-autoregressive Model):一次性生成所有的
  • 策略比较:
    • AR:速度慢,答案质量好,适合生成文字
    • NAR:速度快,答案质量较差,适合生成图像(影像像素过多,AR太慢)

综合使用: 批次

  1. 以语音合成为例:生成分为两个阶段,AR决定大方向,NAR生成最后产物
    在这里插入图片描述
  2. 将“一次到位”改为“N此到位”(类似Diffusion Model)
    在这里插入图片描述

三、能够使用工具的AI

  1. New Bing:New Bing是有搜寻网络的,但什么时候进行搜寻是由机器自己决定的
    在这里插入图片描述

  2. WebGPT:也是文字接龙
    在这里插入图片描述
    步骤:

    • 输入”Which river is longer, the Nile or the Yangtze?”(翻译:拿一条河比较长,尼罗河还是扬子江?)
    • 提取关键字(如:”Nile vs Yangtze”、”nile length”、”Yangtze length”)
    • 对关键字进行网络搜索,根据算法对搜索网页资料的部分段落进行收藏(注意只收藏文字段落,而不是整个网页)
    • 整理生成答案(答案后会附上引用的网址)
  3. Toolformer:使用多种不同的工具
    在这里插入图片描述

四、延伸学习

深度学习
梯度下降
反向传播
卷积神经网络
自注意力机制

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1351980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL将多条数据合并成一条的完整示例

数据库中存的是多条数据,展示的时候需要合并成一条 数据表存储形式如下图 以type分组,type相同的算一条,且保留image和link的所有数据,用groupBy只保留一条数据 解决方案:用GROUP_CONCAT 完整语法如下 group_concat…

基于人工智能的数据库工具Chat2DB使用

文章目录 前言Chat2DB介绍Chat2DB地址下载安装 Chat2DB配置Chat2DB使用1、自然语言转sql2. SQL解释3. SQL优化4. SQL转换 写在最后 前言 随着人工智能的发展,各行各业都出现了不少基于AI的工具来提升工作效率。就连国内的各个大厂也都在基于大模型开发自己的产品线…

ctfshow——信息搜集

文章目录 web 1web 2web 3web 4web 5web 6web 7web 8web 9web 10web 11web 12web 13web 14web 15web 16web 17web 18web 19web 20 web 1 题目提示开发注释未及时删除。 直接右键查看源代码。 web 2 在这关我们会发现:1)无法使用右键查看源代码&…

Github 2023-12-31 开源项目日报 Top10

根据Github Trendings的统计,今日(2023-12-31统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量TypeScript项目3Swift项目1Java项目1HTML项目1Astro项目1Python项目1C项目1Dart项目1Jupyter Notebook项目1C项…

Python最基础的对字符串的操作1

1,字符串的查找: find():查询某个子串是否包含在这个字符串中,如果在返回这个子串开始的位置下标,否则则返回-1 index():查询某个子串是否包含在这个字符串中,如果在返回这个子串开始的位置下标…

Linux系统编程(八):信号(下)

参考引用 UNIX 环境高级编程 (第3版)嵌入式Linux C应用编程-正点原子 1. 基本概念 信号是事件发生时对进程的通知机制,也可以把它称为软件中断 信号与硬件中断的相似之处在于能够打断程序当前执行的正常流程,其实是在软件层次上对中断机制的一种模拟大多…

【华为机试】2023年真题B卷(python)-快递运输

一、题目 题目描述: 运送的快递放在大小不等的长方体快递盒中,为了能够装载更多的快递同时不能让货车超载,需要计算最多能装多少个快递。 注:快递的体积不受限制 快递数最多1000个 货车载重最大50000 二、输入输出 输入描述&#…

【算法挨揍日记】day42——494. 目标和、1049. 最后一块石头的重量 II

494. 目标和 494. 目标和 题目描述: 给你一个非负整数数组 nums 和一个整数 target 。 向数组中的每个整数前添加 或 - ,然后串联起所有整数,可以构造一个 表达式 : 例如,nums [2, 1] ,可以在 2 之前…

工程化态势感知的困难

工程化态势感知的困难在于数据整合、大数据处理和分析、领域知识和模型构建、实时性和准确性要求以及安全和隐私问题。解决这些困难需要技术和专业知识的结合,以及各方面的合作和努力。 多源异构数据的整合:工程化态势感知需要从各种数据源获取数据&…

数据结构——顺序队列与链式队列的实现

目录 一、概念 1、队列的定义 2、队首 3、队尾 二、接口 1、可写接口 1)数据入队 2)数据出队 3)清空队列 2、只读接口 1)获取队首数据 2)获取队列元素个数 3)队列的判空 三、队列的顺序表实现…

com.gexin.platform 依赖下载问题

打包时报错显示&#xff1a; com.gexin.platform:gexin-rp-sdk-http:pom:4.1.1.4 failed to transfer from http://0.0.0.0/ 解决办法&#xff1a; 1、在idea中找到maven中的设置的settings.xml 2、根据路径找到settings.xml文件&#xff0c;添加以下内容 <mirror><…

基于孔雀优化算法的航线规划

MATLAB2020a下正常运行 上传明细-CSDN创作中心

一元函数微分学——刷题(14

目录 1.题目&#xff1a;2.解题思路和步骤&#xff1a;3.总结&#xff1a;小结&#xff1a; 1.题目&#xff1a; 2.解题思路和步骤&#xff1a; 只要知道反函数求导等于原函数的导数的倒数&#xff0c;那就很好求解了&#xff0c;这不过要先处理好x和y的对应关系&#xff0c;知…

WPF容器的背景对鼠标事件的影响

背景&#xff1a;在实现鼠标拖动窗口的过程中发现对父容器设置了鼠标拖动窗口的事件MouseLeftButtonDown private void DragWindow(object sender, MouseButtonEventArgs e) {if (e.LeftButton MouseButtonState.Pressed)DragMove(); } 问题&#xff1a;非常困惑的是&#x…

【MySQL】常用存储引擎,数据库管理,数据表管理,数据库账户管理

目录 一 常用的数据引擎(4) 1.1 InnoDB存储引擎 1.2 MyISAM存储引擎 1.3 Memory存储引擎 1.4 ARCHIVE存储引擎 二 数据库管理 2.1 元数据库概念与分类 2.2 相关操作命令 三 数据表的管理 3.1 三大范式 3.2 数据类型 四 数据库账户管理 五 思维导图 一 常用的数据…

Mac环境下Parallels Desktop 19的安装和使用

为了后续构建漏洞靶场和渗透测试环境&#xff0c;我们需要提前准备好几套与宿主机隔离的工作环境&#xff08;Windows、Linux等&#xff09;&#xff0c;在Mac上最常用的就是Paralles Desktop&#xff08;PD&#xff09;工具了&#xff0c;当前最新版本为19。接下来介绍如何安装…

PDF控件Spire.PDF for .NET【安全】演示:获取并验证 PDF 中的数字签名

在 PDF 中创建数字签名广泛用于保护 PDF 文件。因此&#xff0c;当您查看一些带有数字签名的PDF文件时&#xff0c;需要获取并验证数字签名。本文向您展示了一种通过使用Spire.PDF和 C# 代码来获取和验证 PDF 中的数字签名的解决方案。 Spire.PDF for .NET 是一款独立 PDF 控件…

第二证券:停牌意味着什么?

股票停牌的原因&#xff1f; 一般来说&#xff0c;股票停牌的原因可以分为以下几类&#xff1a; 1、上市公司有严峻情况变化&#xff0c;如企业并购、重组等&#xff0c;为了确保生意顺利完成和信息宣布的及时、充分、准确&#xff0c;避免商场出现信息不对称的情况&#xff…

javascript 常见工具函数(五)

41.深度拷贝对象&#xff1a; static deepCopyObj$(obj) {var result Array.isArray(obj) ? [] : {};for (var key in obj) {if (obj.hasOwnProperty(key)) {if (typeof obj[key] object && obj[key] ! null) {result[key] Utils$.deepCopyObj$(obj[key]); //递归…

门店管理井然有序的秘诀,就在这1888字里

门店管理是一款帮助企业提高线下门店管理效率的应用&#xff0c;适用于所有拥有实体连锁门店的行业&#xff0c;如&#xff1a;连锁服饰、商超、数码产品、连锁餐饮等。 门店管理常见痛点 线下连锁门店的管理受位置、时间等因素影响&#xff0c;总部管理鞭长莫及&#xff1b; …