揭开面纱--机器学习

news2025/7/14 12:49:43

一、人工智能三大概念

1.1 AI、ML、DL

1.1.1 什么是人工智能?

AI：Artificial Intelligence 人工智能
AI is the field that studies the synthesis and analysis of
computational agents that act intelligently
AI is to use computers to analog and instead of human brain

AI系统的4大期望：
释义 - 仿智；像人一样机器智能的综合与分析；机器模拟代替人类

在这里插入图片描述

1.1.2 什么是机器学习？

Machine Learning 释义：机器学习; 自动学习; 机器学
Field of study that gives computers the ability to learn without being explicitly programmed
释义：让机器自动学习，而不是基于规则的编程（不依赖特定规则编程）
在这里插入图片描述

1.1.3 什么是深度学习？

深度学习(DL, Deep Learning) : ，也叫深度神经网络，大脑仿生，设计一层一层的神经元模拟万事万物

在这里插入图片描述

1.2 AI、ML、DL、三者联系和区别

在这里插入图片描述

1.3 算法的学习方式

1.3.1 基于规则的预测

程序员自己手工的if-else方式写经验规则
机器学习出来之前进行预测，需先有一个明确的可解释的规则。比如垃圾邮件分类
通过 “if…else…” 写很多规则，来对邮件分类！有些场景很难写规则！
例子：大象的识别
在这里插入图片描述

1.3.2 基于模型的学习

从数据中自动学出规律

在这里插入图片描述
例子：房价的预测

1.4 小结

在这里插入图片描述

二、机器学习的应用领域和发展史

2.1应用领域：

在这里插入图片描述

2.2 机器学习发展史：

在这里插入图片描述

2.3 AI发展三要素

数据、算法、算力三要素互相作用，是AI发展的基石

在这里插入图片描述
要用英伟达的处理器，原因在于其高效的并行处理能力、先进的架构、强大的生态系统支持、以及专为AI优化的硬件功能。
国企一般用华为的升腾处理器。

2.4 小结

在这里插入图片描述

三、机器学习常用术语

3.1 常用术语

在这里插入图片描述

3.2训练集和测试集的划分

在这里插入图片描述
特征：用x表示
目标：用y表示
x_train：训练集中的特征，x_test：测试集中的目标
y_train：测试集中的特征，y_test：测试集中的目标

3.3 小结

在这里插入图片描述

四、算法分类

4.1 有监督学习 Vs 无监督学习

从数据上对算法的划分
在这里插入图片描述

有监督学习分为：分类问题和回归问题
在这里插入图片描述
分类种类：
二分类：“是、否”问题
多分类

无监督再举例
在这里插入图片描述

4.2 半监督学习

在这里插入图片描述

4.3强化分类

在这里插入图片描述

4.4 小结

在这里插入图片描述

机器学习算法可分为哪些类别？分别说一说各自的特点？

1 按照学习方式分类可分为: 监督学习, 无监督学习, 半监督学习, 强化学习
2 监督学习: 输入训练集数据包含输入特征值和目标值
回归: 函数的输出是一个连续的值
分类: 函数的输出是有限个离散值
3 无监督学习: 输入训练集数据是由输入特征值组成，没有目标值
比如：聚类根据样本间的相似性对样本集进行分类
4 半监督学习: 训练集同时包含有目标值的样本数据和不含有目标值的样本数据
5 强化学习: 智能体不断与环境进行交互，通过获取最大奖励的方式（试错的方式）来获得最佳策略；主要包含四个元素：Agent(智能体)，环境(Environment)，行动(Action)，奖励(reward)

五、机器学习建模流程

5.1机器学习建模流程

在这里插入图片描述
注：在整个建模流程中，数据基本处理、特征工程一般是耗时、耗精力最多的。

5.2 有监督学习模型训练和模型预测

在这里插入图片描述

5.3 总结

在这里插入图片描述

六、特征工程概念入门

6.1 特征工程概念入门

在这里插入图片描述
特征提取：原始数据中提取与任务相关的特征，构成特征向量

特征预处理：特征对模型产生影响；因量纲问题，有些特征对模型影响大、有些影响小
在这里插入图片描述
特征降维：将原始数据的维度降低，叫做特征降维，一般会对原始数据产生影响

特征选择：原始数据特征很多，与任务相关是其中一个特征集合子集，不会改变原数据

特征组合：原始数据特征很多，与任务相关是其中一个特征集合子集，不会改变原数据
在这里插入图片描述