深度学习——引言

news2026/2/13 18:08:01

一、机器学习的关键因素

1.1 数据

每个数据集由一个个样本组成，大多情况下，数据遵循独立同分布。通常每个样本由一组特征属性组成。
$\begin{cases} 数据样本多\\\ 正确的数据(garbage \quad in,\quad garbage \quad out) \end{cases}$

1.2 模型

与经典机器学习算法模型相比，深度学习的模型由神经网络错综复杂地交织在一起，包含层层数据转换，模型功能更加强大。

1.3 目标函数

在机器学习中，需要定义对模型的优劣程度的度量，并且这个度量在大多数情况下是“可优化的”，这被称为目标函数。
$\begin{cases} 1、损失函数，越小越好（例如：平方误差函数）\textcolor{red}{最常用的方法}\\ 2、设计一种新的函数，优化到其最大值 \end{cases}$

1.4 优化算法

当我们获得了一些数据源及其表示、一个模型和一个合适的损失函数，接下来就需要一种算法，它能够搜索出最佳参数，以最小化损失函数。在深度学习中，大多数流行的优化算法通常基于一种基本方法，梯度下降。梯度下降方法在每个步骤中都会检查每个参数，观察如果仅对该参数进行少量改动，训练集上的损失会朝哪个方向移动。然后，它在可以减少损失的方向上优化参数。

二、各种机器学习的问题

2.1 监督学习

监督学习是在“给定输入特征”的情况下预测标签，每个“特征-标签”对都称为一个样本，即使标签是未知的，样本也可以指代输入特征。监督学习的目标是生成一个模型，该模型能够将任何输入特征映射到标签。
监督学习的学习过程：

1、从已知大量数据样本中随机选取一个子集，为每个样本获取真实标签；
2、选择有监督的学习算法，它将训练数据集作为输入，并输出一个“已完成学习的模型”；
3、将之前没有见过的样本特征放到这个“已完成学习的模型”中，使用模型的输出作为相应标签的预测。
$\begin{cases} 1、回归问题：预测一个数值\\ 2、分类问题：预测是哪一类\\ 3、标注问题：多标签分类\\ 4、搜索问题：对搜索查询的结果进行筛选排序\\ 5、推荐系统：捕捉一个用户的偏好\\ 6、序列学习：如果是连续的输入，模型需要有记忆功能 \end{cases}$

2.2 无监督学习

数据样本中不含有“目标”的机器学习问题通常被称为无监督学习。
$\begin{cases} 1、聚类问题\\ 2、主成分分析\\ 3、因果关系和概率图模型\\ 4、生成对抗网络 \end{cases}$

2.3 强化学习

在强化学习问题中，智能体(agent)与环境进行交互。在每个特定时间点，智能体从环境接受一些观测(observation)，并且必须选择一个动作(action)，然后通过某种机制将其输出回环境，最后智能体从环境获得奖励(reward)，然后开始新一轮循环，智能体继续从环境中监测，选择后续动作并获得奖励，以此类推。