ML 系列：机器学习和深度学习的深层次总结(01)

news2026/2/13 18:32:49

文章目录

一、说明
二、人工智能和机器学习
三、机器学习的类型
四、结论

一、说明

欢迎学习机器学习系列。这门综合课程目前包括40个部分，指导您了解机器学习、统计和数据分析的基本概念和技术。以下是到目前为止涵盖的关键主题的简要概述：

1 机器学习简介
基本原则、意义以及机器学习、人工智能和深度学习之间的关系。
见这一天

2 回归方法，包括简单和多元线性回归、非线性回归以及梯度下降等优化技术。
第 2 天：简单线性回归，第 3 天：使用梯度下降（GD）进行优化，第 4 天：多元线性回归（MLR），第 5 天：非线性回归

3 准备数据进行分析的关键预处理步骤，包括清理、规范化、转换和特征工程。
第 6 天：预处理（第 1 部分），第 7 天：预处理（第 2 部分），第 8 天：预处理（第 3 部分）

4 欠拟合、过拟合、实现良好拟合、偏差-方差权衡和模型性能评估的概念。
第 9 天：低于、高于和良好拟合，第 10 天：偏差-方差权衡

5 探索不同的学习范式，包括监督学习、无监督学习和强化学习。
第 11 天：ML 中的不同类型的学习

6 二元分类和 KNN 的逻辑回归研究，包括通过 KD 树等高级数据结构提高效率。
第 12-14 天：逻辑回归（第 1 部分 — 第 3 部分），第 15 天：KNN，第 16 天：KD 树

7 核心概率概念、基本分布（离散分布和连续分布）及其在机器学习中的应用。
第 17 天：基本概率概念，第 18 天：高级概率论，第 20-29 天：各种分布，
第 32 — 34 天：机器学习中的统计简介和描述性统计
第 35 天：机器学习中的数据可视化，第 36 天：采样

8了解估计方法（例如最大似然估计）和各种假设检验策略。
第 37 天：统计估计，第 38 天：矩法，第 39 天：最大似然估计（MLE），第 40 天：MLE 的简单问题，第 41 天：假设检验简介，第 42 天：用于模型比较的统计检验

主题包括假设检验在机器学习中的高级应用以及参数检验和非参数检验之间的区别。
第 43 天：参数检验与非参数检验，第 44 天：假设检验在机器学习中的高级应用

二、人工智能和机器学习

一个RTIFICIAL Intelligence 使用计算机和机器来模仿人类大脑解决问题和决策的能力。机器学习是一门科学，它通过使用编程使计算机能够从数据中学习，而无需直接手动编程。机器学习是人工智能的一个子集，深度学习是机器学习的一个子集，它使用大量数据和通常使用神经网络来训练模型。

在这里插入图片描述

图 1.人工智能、机器学习和深度学习之间的关系

三、机器学习的类型

监督学习
监督式学习是一种机器学习方法，它使用标记的数据集来训练算法，以对数据进行分类并预测结果。监督学习有两个主要应用：分类问题和回归。

“分类”是指获取输入值并将其映射到离散值。在此方法中，输出由多个 “类” 或 “类别” 组成。另一方面，“回归”也是指输入数据到连续输出的映射，我们寻求找到一个与数据的距离最小的函数，并且每个输入点都可以映射到一个输出值。

图 2 显示了分类和回归。

在这里插入图片描述

图 2.回归（右侧）和分类（左侧）

监督学习中一些最常见的算法是支持向量机（SVM）、逻辑回归、简单贝叶斯算法、K 最近邻（KNN）和随机森林。

无监督学习
无监督学习是一种机器学习，其中算法处理没有标签的数据。目标是单独学习算法在输入数据中找到结构。简而言之，无监督学习是一种自学习方法，其中算法可以在未标记的数据集中找到隐藏的模式，并在没有任何干扰的情况下提供所需的输出。无监督学习中一些最常见的算法是聚类和降维。

聚类是一种无监督学习，其中隐藏的数据模式是根据它们的相似或不同来确定的。这些模式可以与形状、大小或颜色相关，并用于对数据项进行分组或创建集群。降维，顾名思义，用于减少数据维度。

图 3 显示了聚类。
在这里插入图片描述
图 3. 聚类

在图 3 中，有 12 个点（数据）分配给 3 个集群。在最简单的理解中，几何上彼此接近的点被放置在一个星团中，星星指的是每个星团的中心。

强化学习（RL）

强化学习是机器学习的一个领域，其目的是研究智能代理应该如何在环境中行动，以最大化奖励的概念。强化学习是机器学习的三个主要模型之一，另外两个是监督学习和无监督学习。这种方法基于奖励理想的行为和/或惩罚不良行为。一般来说，强化学习代理可以理解和解释其环境，采取行动，并通过反复试验来学习。要定义这种学习方法，我们需要陈述一些初步定义。

A. 环境

在强化学习中，目标是设计和训练代理，以便他能够在环境中执行最合适的行为;因此，必须为每个问题定义相关环境。

B. 状态

定义环境后，代理随时处于特定状态。例如，在国际象棋游戏中，如果我们把棋盘看作是游戏环境，那么每颗棋子在任何时刻都位于其中一座房子里，每颗房子代表着每颗棋子的状态。

C. 奖励

在为代理定义的环境中，每个操作都会考虑一个奖励，并且根据此奖励，代理会了解哪些行为更合适。

D. 操作

在环境中，代理体的每次移动都被视为一个操作，根据该操作，代理体从环境中获得奖励。

E. 发作

每次代理在环境中执行操作时，根据收到的奖励，从一个状态转移到另一个状态;此操作称为 episode。

图 4 显示了强化学习过程。
在这里插入图片描述