一、人工智能三大概念
1.1 AI、ML、DL
1.1.1 什么是人工智能?
AI:Artificial Intelligence 人工智能
AI is the field that studies the synthesis and analysis of
computational agents that act intelligently
AI is to use computers to analog and instead of human brain
AI系统的4大期望:
释义 - 仿智; 像人一样机器智能的综合与分析;机器模拟代替人类
1.1.2 什么是机器学习?
Machine Learning 释义:机器学习; 自动学习; 机器学
Field of study that gives computers the ability to learn without being explicitly programmed
释义:让机器自动学习,而不是基于规则的编程(不依赖特定规则编程)
1.1.3 什么是深度学习?
深度学习(DL, Deep Learning) : ,也叫深度神经网络,大脑仿生,设计一层一层的神经元模拟万事万物
1.2 AI、ML、DL、三者联系和区别
1.3 算法的学习方式
1.3.1 基于规则的预测
程序员自己手工的if-else方式写经验规则
机器学习出来之前进行预测,需先有一个明确的可解释的规则。 比如垃圾邮件分类
例子:大象的识别
1.3.2 基于模型的学习
从数据中自动学出规律
例子:房价的预测
1.4 小结
二、机器学习的应用领域和发展史
2.1应用领域:
2.2 机器学习发展史:
2.3 AI发展三要素
数据、算法、算力三要素互相作用,是AI发展的基石
要用英伟达的处理器,原因在于其高效的并行处理能力、先进的架构、强大的生态系统支持、以及专为AI优化的硬件功能。
国企一般用华为的升腾处理器。
2.4 小结
三、机器学习常用术语
3.1 常用术语
3.2训练集和测试集的划分
特征:用x表示
目标:用y表示
x_train:训练集中的特征,x_test:测试集中的目标
y_train:测试集中的特征,y_test:测试集中的目标
3.3 小结
四、算法分类
4.1 有监督学习 Vs 无监督学习
从数据上对算法的划分
有监督学习分为:分类问题和回归问题
分类种类:
二分类:“是、否”问题
多分类
无监督再举例
4.2 半监督学习
4.3强化分类
4.4 小结
机器学习算法可分为哪些类别?分别说一说各自的特点?
1 按照学习方式分类可分为: 监督学习, 无监督学习, 半监督学习, 强化学习
2 监督学习: 输入训练集数据包含输入特征值和目标值
回归: 函数的输出是一个连续的值
分类: 函数的输出是有限个离散值
3 无监督学习: 输入训练集数据是由输入特征值组成,没有目标值
比如:聚类根据样本间的相似性对样本集进行分类
4 半监督学习: 训练集同时包含有目标值的样本数据和不含有目标值的样本数据
5 强化学习: 智能体不断与环境进行交互,通过获取最大奖励的方式(试错的方式)来获得最佳策略;主要包含四个元素:Agent(智能体),环境(Environment),行动(Action),奖励(reward)
五、机器学习建模流程
5.1机器学习建模流程
注:在整个建模流程中,数据基本处理、特征工程一般是耗时、耗精力最多的。
5.2 有监督学习模型训练和模型预测
5.3 总结
六、特征工程概念入门
6.1 特征工程概念入门
特征提取:原始数据中提取与任务相关的特征,构成特征向量
特征预处理:特征对模型产生影响;因量纲问题,有些特征对模型影响大、有些影响小
特征降维:将原始数据的维度降低,叫做特征降维,一般会对原始数据产生影响
特征选择:原始数据特征很多,与任务相关是其中一个特征集合子集,不会改变原数据
特征组合:原始数据特征很多,与任务相关是其中一个特征集合子集,不会改变原数据
6.2 总结
七、模型拟合问题
7.1 什么叫拟合?
例如:x轴是年龄,y轴是身高。
红色的f(x)没有拟合x和y
绿色的f(x)拟合了x和y
模型拟合:就是拟合特征和目标的关系
7.2 欠拟合和过拟合
例子:识别天鹅
7.3 总结
八、机器学习开发环境
简单高效的数据挖掘和数据分析工具
可供大家使用,可在各种环境中重复使用
建立在NumPy,SciPy和matplotlib上
开源,可商业使用
安装方法:
pip install scikit-learn
在pycharm中验证是否安装成功:
官网:
https://scikit-learn.org/stable/
日拱一卒,功不唐捐,信奉长期主义
每天进步一点点,为中国人工智能的发展贡献力量!
我这么可爱,还等什么?快点关注我哦~