文章目录
- 深度学习简介
- 计算机视觉简介
- k近邻算法
- 得分函数
- 损失函数作用
- 前向传播整体流程
机器学习是一个大块,其中就包含着深度学习,计算机视觉等
机器学习的流程:
- 数据获取
- 特征工程
- 建立模型
- 评估与应用
深度学习简介
深度学习通过特征学习进行相关操作。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
计算机视觉简介
计算机视觉:
- 图像分类任务(一张图像由一个三维数组进行表述,比如3001003实际上就是高*长*3颜色通道(red blue green))
- 计算机视觉面对的挑战:照射角度,形状改变,部分遮蔽,背景混入
k近邻算法
计算流程:
- 计算已知类型数据集中点与当前点的距离。
- 按照距离依次排序
- 选取与当前点距离最小的k个点
- 确定k个点所在类别的出现的概率
- 返回k个点出现概率最高的类别作为当前点预测分类。
分析:
- knn算法本身简单有效,是一种lazy-learning算法
- 分类器不需要使用训练集进行训练,训练时间复杂度为0
- knn分类的计算复杂度和训练集中的文档数目成正比。也就是说,如果训练集中文档总数为n,那么knn的分类时间复杂度为O(n)
- k值的选择,距离度量和分类决策规则是该算法的三个基本要素
通过检测实际的运作后发现,不能使用k近邻进行图像分类:
- 背景主导是一个最大的问题,我们关注的却是主体部分。
- 引出我们该如何让机器学习了解那些事最为重要的部分。
得分函数
- 线性函数
f(image,parameters)此得分函数(线性函数)将每个像素点与每个像素点的权重进行运算得出其得分点,得到每一个类的得分。
损失函数作用
多组权重参数构成了决策边界
损失函数的实际就是衡量我们分配任务过程中的好坏程度,帮助我们更好的分类。
举个例子:
这就是一个简单的损失函数,具体的计算即是:比如第一张图我们明显得知这是一张猫,但是对于w来说,他判断的car的权重确是最大的,我们就可以计算其损失函数,右边蓝色最上面的计算过程,得到一个损失的值,代表需要的修改。
而为什么有+1呢,理解就是这是为了避免w太接近导致计算机识别不出来。或者理解为我们的容忍度,至少需要这么多,才能证明是两类。
但是实际上,我们的损失函数还需要加上一个正则化惩罚项,也即代表着我们希望w进行充分的分配比如(0.25,0.25,0.25,0.25)而不会由于某种情况训练成(1,0,0,0).
前向传播整体流程
softmax分类器: