《零基础学机器学习》读书笔记三之基本机器学习术语
一、机器学习快速上手路径(续)
1.3 基本机器学习术语
1.3.1 特征
特征是机器学习中的输入,原始的特征描述了数据的属性。特征的维度指的是特征的数目。
把向量、矩阵和其他张量的维度统称为 阶,或者称为1D向量、2D矩阵、3D张量等。
”维“,主要指的就是数据集中特征X的数目。 特征维度越高,数据集越复杂。
张量是机器学习的数据结构,也就是程序中的数组。向量、矩阵都是张量的一种。向量张量是一个1D数组,矩阵张量是一个2D数组。
1.3.2 标签
标签,是机器学习要输出的结果,是我们视图预测的目标。机器学习要解决什么问题,标签就是什么。
一个有标签数据样本的格式:
(x1,x2,x3;y)
机器推断出来的,称作预测标签y’ (也叫y-hat)。
比较y和y’的差异,也就是在评判机器学习模型的效果。
在无监督学习中,所有的样本都没有标签。
1.3.3 模型
模型将样本映射到预测标签y’。
模型就是函数,是执行预测的工具。
函数由函数的内部参数定义。
在机器学习中,先确定模型的类型(也可以说是算法);
选定算法之后,再确定模型的参数;
类型和参数都确定了,机器学习的模型也就最终确定了。