《动手学深度学习》笔记一 ------机器学习中的基础概念

news2025/1/6 7:57:56

写在前面:本文按照书中的脉络做的笔记,包含概念的定义、自己的理解以及阅读时的小思考。感受:深度学习很奥妙,很有趣!

1.2机器学习中的关键组件

  1. 可以⽤来学习的数据(data);
  2. 如何转换数据的模型(model);
  3. ⼀个⽬标函数(objective function),⽤来量化模型的有效性;

当任务在试图预测数值时,最常⻅的损失函数是平⽅误差(squared error),即预测值与实际值之差的平⽅。 当试图解决分类问题时,最常⻅的⽬标函数是最⼩化错误率,即预测与实际情况不符的样本⽐例。

。有些⽬标 函数(如平⽅误差)很容易被优化,有些⽬标(如错误率)由于不可微性或其他复杂性难以直接优化。在这 些情况下,通常会优化替代⽬标

可⽤数据集通常可以分成两部分:训练数据集⽤于拟合模型参数,测试数据集⽤于评估拟合的模型。

  1. 调整模型参数以优化⽬标函数的算法(algorithm)。

深度学习中,⼤多流⾏的优化算法通常基于⼀种基本⽅法‒梯度下降(gradient descent)。简⽽⾔之,在每个步骤中,梯度下降法都会检查每个参数,看看如果仅对该参数进⾏少量变动,训 练集损失会朝哪个⽅向移动。然后,它在可以减少损失的⽅向上优化参数。

1.3各种机器学习问题

  1. 监督学习

擅长在“给定输入特征”的情况下预测标签,相当于,在给定一组特定的可用数据(相当于特征)的情况下,估计未知事物的概率(事情的结果,相当于是标签)。

(我的理解:监督学习就是,根据给出的特征和标签,学会二者之间如何从特征映射到标签)

监督学习的学习过程一般可以分为三大步骤:

1、从已知大量数据样本中随机选取一个子集,为每个样本获取真实标签。有时,这些样本已有标签(例如,患者是否在下一年内康复?);有时,这些样本可能需要被人工标记(例如,图像分类)。这些输入和相应的标签一起构成了训练数据集;

2、选择有监督的学习算法,它将训练数据集作为输入,并输出一个“已完成学习的模型”;

3、将之前没有见过的样本特征放到这个“已完成学习的模型”中,使用模型的输出作为相应标签的预测。

(1)回归

回归问题的模型,由输出决定。当标签取任意数值时,我们称之为回归问题,此时的目标是生成一个模型,使它的预测非常接近实际标签值。总而言之,判断回归问题的一个很好的经验法则是,任何有关“有多少”的问题很可能就是回归问题。eg:这个手术需要多少小时.

(我的理解:相当于是y=k x+b中,已知x,y,求解k,b。就是在几个变量的已知函数关系的情况下求解变量,这个变量不一定是系数k,b,也可能是x或者y。)、

(2)分类

  1)区别:回归是训练一个回归函数来输出一个数值; 分类是训练一个分类器来输出预测的类别。

2)分类问题的常见损失函数被称为交叉熵(cross-entropy)(后面会讲)

3)分类包括:二项分类、多项分类、层次分类(eg:动物的科目类别(猫科、犬科),可能存在相关性,这种不同类的结构叫层析结构)

 层次结构相关性可能取决于模型的使用者计划如何使用模型。 例如,响尾蛇和乌梢蛇血缘上可能很接近,但如果把响尾蛇误认为是乌梢蛇可能会是致命的。 因为响尾蛇是有毒的,而乌梢蛇是无毒的。

4)标记问题

给问题贴标签

学习预测不相互排斥的类别的问题称为多标签分类(比如,在一张动物图片中识别出所有的动物)

5)搜索

最重要的是,将搜索的结果根据问题的相关性进行排序

6)推荐系统(recommender system)

它的目标是向特定用户进行“个性化”推荐

7)序列学习

就是根据连续的一段信息,通过学习,获得可能的后续信息。

 序列学习需要摄取输入序列或预测输出序列,或两者兼而有之。

应用:机器翻译(eg:根据输入的顺序得到合理的翻译语句)

2、无监督学习

数据中不含有“目标”的机器学习问题通常被为无监督学习(unsupervised learning)

可解决的问题:

A.聚类问题(没有标签的情况下,将有相似特征的东西归为一类)

B.主成分分析(eg:裁缝通过确定人的某些参数来裁定衣服的大小(比如人的臂长,身高等))

C.因果关系和概率图模型(根据经验数据发现给出数据之间的关系)

D.生成对抗网络(提供一种合成数据的方法,潜在的统计机制是检查真实和虚假数据是否相同的测试)

3、环境交互

  上述的两种学习方式,是事先取数据,启动模型后就不在与环境交互,是离线学习。

4、强化学习

即智能体(agent)在一系列的时间步骤上与环境交互。

在每个特定时间点,智能体从环境接收一些观察(observation),并且必须选择一个动作(action),然后通过某种机制(有时称为执行器)将其传输回环境,最后智能体从环境中获得奖励(reward)

(我的理解:在已有模型的基础上,执行自己的动作后,将观测到的环境变化与内部的“激励”传回到智能体中进行下一步的动作)

假设我们有一个分类问题,可以创建一个强化学习智能体,每个分类对应一个“动作”。 然后,我们可以创建一个环境,该环境给予智能体的奖励。 这个奖励与原始监督学习问题的损失函数是一致的。

(插个题外话,这句话我有点喜欢,有种内心被点化的感觉。强化学习智能体必须不断地做出选择:是应该利用当前最好的策略,还是探索新的策略空间(放弃一些短期回报来换取知识)。)

当环境可被完全观察到时,强化学习问题被称为马尔可夫决策过程(markov decision process)。 当状态不依赖于之前的操作时,我们称该问题为上下文赌博机(contextual bandit problem)。 当没有状态,只有一组最初未知回报的可用动作时,这个问题就是经典的多臂赌博机(multi-armed bandit problem)

(机器能思考吗?我觉得按照深度强化学习的思路看,机器可以通过观察和模仿,无限接近人的行为,几乎是有思想的模样。因为我觉得人从受精卵开始,虽然开始有生命,但是有自己的意识也是通过模仿外界,和机器的学习似乎没区别。或者说,刚出生的婴儿就像是机器已经通过类似深度强化学习学习了十个月,从而有人们看到的与生俱来的脾气秉性、自己的各种反应。以上纯属我的猜测。)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/182788.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

直接在Notepad++中运行GO语言

建议先阅读并实践(配置notepad支持go语言语法着色(高亮)):https://mp.csdn.net/mp_blog/creation/editor/new/1287591911.Windows上安装Go语言开发包参考链接:http://c.biancheng.net/view/3992.html1.1.下载Go语言开发包可以在Go语言官网 &a…

大聪明教你学Java | 深入浅出聊 Mybatis 的一级缓存和二级缓存

前言 🍊作者简介: 不肯过江东丶,一个来自二线城市的程序员,致力于用“猥琐”办法解决繁琐问题,让复杂的问题变得通俗易懂。 🍊支持作者: 点赞👍、关注💖、留言&#x1f4…

【头歌】函数的递归调用

第1关:编写递归函数方法求x的n次方 (要求n>0)任务描述本关任务:编写递归函数方法求x的n次方 (要求n>0)。相关知识递归法在定义一个过程或函数时出现调用本过程或本函数的成分,称之为递归。若调用自身,称之为直接递归。若过程…

论文笔记:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS

ICLR 2017 1 abstract和intro部分 问题的setting 在图上进行节点分类,其中只有一部分节点有label ——>基于图的半监督学习传统的方法是使用平滑正则 其中L0表示图中有监督部分的lossf是神经网络,ΔD-A表示unnormalized的拉普拉斯矩阵 这种方…

Blender 物理属性 (五)动态绘画

文章目录动态绘画简介.以小船划过水面产生波纹为例.波浪属性.动态绘画简介. 1 动态绘画可以让一个物体在另一个物体上绘制东西 2 动态绘画至少需要两个物体,一个作为画布,另一个作为笔刷 3 两个物体必须接触才有效果 以小船划过水面产生波纹为例. 1 为…

【数据结构】浅识泛型

目录 1、包装类 1.1、基本数据类型和其包装类 1.2、装箱和拆箱 1.2.1、装箱 1.2.2、拆箱 1.2.3、面试题 2、泛型的概念 3、引出泛型 3.1、语法 4、泛型类的使用 4.1、语法 5、裸类型(Raw Type) 6、泛型是如何编译的 6.1、擦除机制 6.2、不…

Springboot+ssm371的在线考试系统maven idea

摘 要 I 1 绪论 1 1.1研究背景 1 1.2研究现状 1 1.3研究内容 2 2 系统关键技术 3 springboot是基于spring的快速开发框架, 相比于原生的spring而言, 它通过大量的java config来避免了大量的xml文件, 只需要简单的生成器便能生成一个可以运行的javaweb项目, 是…

DPO4104示波器

18320918653 DPO4104 详细说明: 美国泰克Tektronix DPO4104数字荧光示波器主要产品特色:Inspector智能存储管理2.串行触发和分析3.10.4”更大的显示器, 前面板上USB和CompactFlash端口, 及TekVPI?改善的探头接口, 更强的操作渐 变性商品名称 &#x…

针孔相机模型

针孔相机模型坐标系(1) 图像像素坐标系(2) 图像物理坐标系(3) 相机坐标系(4) 归一化平面坐标系(5) 世界坐标系畸变校正针孔相机模型中一般会涉及到图像像素坐标系、图像物理坐标系、相机坐标系、归一化平面坐标系和世界坐标系这5个坐标系。 坐标系 (1) 图像像素坐标系 图像像…

IDEA设置界面和控制台的滚动条颜色

前言 不知道大家是否和我一样有这么一个烦恼: IDEA自带的滚动条颜色很暗,配上一些主题颜色搭配很难发现。 所以今天就想着怎么可以修改滚动条颜色,首先去网上搜了搜都是什么鼠标滚轮加shift滚动,一点也不实用 偶然看到了个不错的…

图表控件LightningChart.NET 系列教程(七):LightningChart 组件——LightningChart.NET 函数库

LightningChart.NET SDK 是一款高性能数据可视化插件工具,由数据可视化软件组件和工具类组成,可支持基于 Windows 的用户界面框架(Windows Presentation Foundation)、Windows 通用应用平台(Universal Windows Platfor…

匿名函数 lambda

匿名函数 lambda 匿名函数:一句话函数,比较简单的函数,没有函数名的函数 在Python中,lambda的语法是唯一的 lamlambda a,b:ab lamlam(a1,b2) # 传参 print(lam) # 3lmbda的语法是唯一的。其形式如下:lambda argument_list: expr…

python图像处理(prewitt算子)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】 前面几章谈到了灰化、增强、旋转、滤波等内容,今天来谈一谈边缘检测。边缘检测是图像处理的重要内容。很多图像分割、图像识别的前一步就是边缘检测。某种意义上说,边缘检测的好坏…

7-查看和处理文件内容

7-查看和处理文件内容 文本文件 ASCII、UTF-8、Unicode、ANSItxt、xml、conf、properties、yml等配置文件、日志文件、源代码 二进制文件 可执行文件、图片、音频、视频 cat 全拼:concatenate [kənˈkt(ə)nˌeɪt] 连接 格式:cat 文件名 more/…

2. Spring 注解开发

文章目录1. 用注解开发定义bean2. 纯注解开发3. 注解开发的 bean 管理3.1 作用范围管理(单例或非单例)3.2 生命周期管理4. 注解开发的依赖注入4.1 引用类型的依赖注入4.2 简单类型的依赖注入4.2.1 直接注入值4.2.2 注入 properties 文件中的值5. 注解开发…

Acwing---1101. 献给阿尔吉侬的花束

献给阿尔吉侬的花束1.题目2.基本思想3.代码实现1.题目 阿尔吉侬是一只聪明又慵懒的小白鼠,它最擅长的就是走各种各样的迷宫。 今天它要挑战一个非常大的迷宫,研究员们为了鼓励阿尔吉侬尽快到达终点,就在终点放了一块阿尔吉侬最喜欢的奶酪。…

MYSQL不存在插入 存在更新的解决方法和对比

设置主键id自增,name为唯一索引 一、避免重复插入 insert ignore into(有唯一索引) 关键字/句: insert ignore into,如果插入的数据会导致 UNIQUE索引 或 PRIMARY KEY 发生冲突/重复,则忽略此次操作/不插入数据&…

Leetcode.1664 生成平衡数组的方案数

题目链接 Leetcode.1664 生成平衡数组的方案数 题目描述 给你一个整数数组 nums。你需要选择 恰好 一个下标(下标从 0 开始)并删除对应的元素。请注意剩下元素的下标可能会因为删除操作而发生改变。 比方说,如果 nums[6,1,7,4,1]nums [6,1…

spark转化操作

文章目录转化操作Transformer算子概念单RDD转换函数多RDD转换函数map与flatmap转化操作 由于spark的惰性计算特性,RDD只有在第一次行动操作中被用到时才会真正进行计算,因此我打算将文章内容分为"转化操作"和"行动操作"两部分&…

【web】微信小程序笔记小结(视图与逻辑)

过完年回来干正事了orz 来源:黑马程序员前端微信小程序开发教程 目录 I. 页面导航 ① 概念 ② 导航方式 1)声明式导航 ※※ 导航到 tabBar 页面 ※※ 导航到非 tabBar 页面 ※※ 后退导航 2)编程式导航 ※※ 导航到 tabBar 页面…