机器学习简介
定义
机器学习是人工智能(AI)和计算机科学的一个分支,专注于使用数据和算法来模仿人类的学习方式,逐步提高其准确性。
简单来说,是一种运用数学公式来对问题进行最优化求解的方法
分类
一般来说将:机器学习分为两种
-
监督学习
-
无监督学习
简单介绍
1. 监督学习
- 定义:监督学习通常指的是由X映射到Y之间的关系
只需要输入X,及可以得到Y,应用实例如下:
训练一组集合,并且给它们提出正确的例子,通过学习,它们之间就可以建立起一组关系(为一个函数关系)
1.1 回归(Regression)
回归是监督学习中的一种,指 从无限多可能的数中预测出一个数
例如:通过已知的房价来拟合曲线 可以750英尺的价格
1.2 分类算法(classification)
回归是监督学习中的一种,限定了可能的结果, 将已知的结果通过一个拟合的函数边界线进行分割
例如:通过年龄和肿瘤大小,辨别肿瘤恶性(malignant)/无害(benign)
2 无监督学习
- 定义:监督只有输入X,通过没有正确结果的数据集,发掘有用信息
下图为聚类算法示例
例如:
通过聚类将相似的新闻聚集
- 无监督学习分类
- 聚类(Clustering)
- 异常检测(Anomaly detection)
- 维度减少(dimensionality reduction)