深度学习 --- stanford cs231学习笔记(一)

news2024/9/24 19:19:44

stanford cs231学习笔记(一)

 

 

 


1,先是讲到了机器学习中的kNN算法,然后因为kNN分类器的一些弊端,引入了线性分类器。

kNN算法的三大弊端:

(1),计算量大,当特征比较多时表示性差

(2),训练时耗时少,且计算需求低,反而是对测试数据分类时,计算需求量大。

(3),衡量两幅图像之间的差异时,衡量方式单一,例如L1,L2距离。且仅有的这两种方法效果都不理想。


2,引入线性分类器

        把图像的二维矩阵拉成一长条,变成一个向量x。对每个向量乘以一组权重系数W,得到一个分类的得分。也就是说,如果有10个类别的话,权重矩阵W就有10行。每行的权重系数对应了一个种类,比如说第一行对应的是猫的权重系数,那么第一行乘以x后,得到的值就是猫的得分。第二行是人,第二行乘以x后,就能得到对人的打分。依此类推,最终会得到10类的打分。

        上图为一个简化模型,假设图像只有4个像素,且总共只有3个类别的打分结果。可以看得出,这个打分结果是错误的,Dog的得分最高。而cat反而得了最低分。

3,如何选择正确的W,才能让相应类别的图像打分最高而在其他类型的图像上打分低?答案就是损失函数Loss function,用于衡量正对当前所使用的W矩阵分类的打分结果,有多么的unhappy不满意。

3,1,损失函数有两种,一种是SVM loss(也叫hinge loss),分数越高表示越unhappy,即越不满意。

其中s_{j}s_{y_{i}}表示经过Wx计算后的分数向量score vector,根据这种方式计算后得到的结果分别是:

 最终得到L函数的均值,对svm loss而言,分数越高,说明分类结果越不好。

3,2,另一种损失函数叫softmax(也叫cross-entropy loss),他把分数转化成了概率函数,然后再对这个概率函数求了一个负自然对数。

        负自然对数函数的图像如下图所示,又因为概率函数的值域在0~1之间,因此,最终L函数的值域应该是在正无穷大到0之间。概率越低损失函数越大,概率越大,也就是越接近1,损失函数的值越接近0。

4,Loss function用于如何评估权重W的合理性,相当于是一个“体检指标”。指标高了,说明W有病了,如果指标越低,则说明W越健康。如何有效的利用Loss函数去优化W呢?这时optimization就出现了,也叫优化函数。

既然,我们的目标是让损失函数L最小化,我们就应该试着找到怎么改变W才能让L减小的最多。这里用到了求极限的概念,也就是通过让W增加一个很小的变化h,然后观察L值的变化。

 

5,改变W后L的变化有可能变大,也有可能变小。而我们的目的是希望找到让L减小最快的W。这时,就引出了optimization优化

        常见的优化方式是梯度下降法,梯度下降法的原理是源于函数f在点P处的梯度一定是函数f在P点处的所有方向导数中增加最大的方向导数。因此,我们要想让函数f减小的最多,我们只需让自变量x沿着这一方向变化即可。

6,为了防止过拟合,在Loss函数中还可以加入Regularization正则化函数。

他能够使得拟合出来的函数尽可能的简单。

 


 (全文完) 

--- 作者,松下J27

参考文献(鸣谢): 

1,Stanford University CS231n: Deep Learning for Computer Vision

2,https://zh.wikipedia.org/wiki/%E6%A2%AF%E5%BA%A6%E4%B8%8B%E9%99%8D%E6%B3%95

版权声明:所有的笔记,可能来自很多不同的网站和说明,在此没法一一列出,如有侵权,请告知,立即删除。欢迎大家转载,但是,如果有人引用或者COPY我的文章,必须在你的文章中注明你所使用的图片或者文字来自于我的文章,否则,侵权必究。 ----松下J27

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1644869.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++初阶之模板初阶

一、泛型编程 如何实现一个通用的交换函数呢? void Swap(int& left, int& right) {int temp left;left right;right temp; } void Swap(double& left, double& right) {double temp left;left right;right temp; } void Swap(char& left,…

sql编写规范(word原件)

编写本文档的目的是保证在开发过程中产出高效、格式统一、易阅读、易维护的SQL代码。 1 编写目的 2 SQL书写规范 3 SQL编写原则 软件全套资料获取进主页或者本文末个人名片直接获取。

[Java、Android面试]_22_APP启动流程(中频问答)

欢迎查看合集: Java、Android面试高频系列文章合集 本人今年参加了很多面试,也有幸拿到了一些大厂的offer,整理了众多面试资料,后续还会分享众多面试资料。 整理成了面试系列,由于时间有限,每天整理一点&am…

偏微分方程算法之混合边界条件下的差分法

目录 一、研究目标 二、理论推导 三、算例实现 四、结论 一、研究目标 我们在前几节中介绍了Poisson方程的边值问题,接下来对椭圆型偏微分方程的混合边值问题进行探讨,研究对象为: 其中,为矩形区域,为上的连续函数…

毕业设计参考-PyQt5-YOLOv8-鱼头鱼尾鱼长测量程序,OpenCV、Modbus通信、YOLO目标检测综合应用

“PyQt5-YOLOv8-鱼头鱼尾鱼长测量程序”是一个特定的软件程序,用于通过图像处理和目标检测技术来测量鱼类的长度。 视频效果: 【毕业设计】基于yolo算法与传统机器视觉的鱼头鱼尾识别_哔哩哔哩_bilibili 这个程序结合了多种技术: 1. OpenCV…

【数据结构(邓俊辉)学习笔记】列表03——有序列表

文章目录 0. 概述1. 唯一化2. 查找2.1 实现2.2 顺序查找2.3 复杂度 0. 概述 介绍下有序列表。 若列表中所有节点的逻辑次序与其大小次序完全一致,则称作有序列表(sorted list)。为保证节点之间可以定义次序,依然假定元素类型T直接…

【一刷《剑指Offer》】面试题 12:打印 1 到最大的 n 位数

力扣对应题目链接:LCR 135. 报数 - 力扣(LeetCode) 牛客对应题目链接:打印从1到最大的n位数_牛客题霸_牛客网 (nowcoder.com) 一、《剑指Offer》内容 二、分析题目 1、暴力解法 2、用字符串模拟数字加法 首先要考虑当 n 很大时&…

Pandas层级索引

文章目录 第1关:多级索引的取值与切片第2关:多级索引的数据转换与累计方法 第1关:多级索引的取值与切片 编程要求 本关的编程任务是补全右侧上部代码编辑区内的相应代码,要求实现如下功能: 使用MultiIndex创建如下Da…

Vue3+.NET6前后端分离式管理后台实战(十七)

1,Vue3.NET6前后端分离式管理后台实战(十七)已经在微信公众号更新,有兴趣的扫码关注一起交流学习。

ShardingSphere 5.x 系列【30】影子库

有道无术,术尚可求,有术无道,止于术。 本系列Spring Boot 版本 3.1.0 本系列ShardingSphere 版本 5.4.0 源码地址:https://gitee.com/pearl-organization/study-sharding-sphere-demo 文章目录 1. 影子库与全链路压测2. 核心概念3. 使用限制4. 执行原理4.1 DML 语句4.2 D…

Vue前端环境准备

vue-cli Vue-cli是Vue官方提供的脚手架,用于快速生成一个Vue项目模板 提供功能: 统一的目录结构 本地调试 热部署 单元测试 集成打包上线 依赖环境:NodeJs 安装NodeJs与Vue-Cli 1、安装nodejs(已经安装就不用了) node-…

指挥中心操作台的选择至关重要

在指挥中心的环境中,操作台是核心设备,它承载着信息收集、处理、分发的重要任务。其选择应考虑到多方面的因素,包括外观、材质、稳定性、操作便利性以及技术支持等。嘉德立在这里给大家详细的总结一下选择指挥中心操作台的要点。 首先&#x…

docker挂载数据卷-以nginx为例

目录 一、什么是数据卷 二、数据卷的作用 三、如何挂载数据卷 1、创建nginx容器挂载数据卷 2、查看数据卷 3、查看数据卷详情 4、尝试在宿主机修改数据卷 5、查看容器内对应的数据卷目录 6、 访问nginx查看效果 ​​​​​​​一、什么是数据卷 挂载数据卷本质上就是实…

Ansible之性能调优

有很多人说Ansible的执行效率比SaltStack差,确实,默认使用的SSH方式通信,效率远低于SaltStack的zeromq消息队列。但是我们可以优化Ansible的执行速度,可以做到并不比SaltStack差。 1. 开启SSH长连接 在OpenSSH 5.6版本后&#xf…

【Proteus】LED呼吸灯 直流电机调速

1.LED呼吸灯 #include <REGX51.H> sbit LEDP2^0; void delay(unsigned int t) {while(t--); } void main() {unsigned char time,i;while(1){for(time0;time<100;time){for(i0;i<20;i){LED0;delay(time);LED1;delay(100-time);}}for(time100;time>0;time--){fo…

【软件测试理论002】认识软件缺陷、缺陷生命周期、缺陷分类

目录 1 认识软件缺陷 1.1 什么是软件缺陷 1.2 缺陷存在哪些方面 1.3 软件缺陷示例 1.4 软件缺陷的表现形式 1.5 软件缺陷产生的原因 1.6 软件缺陷的根源 1.7 软件缺陷修复的费用 2 软件缺陷的信息分类 2.1 软件缺陷的生命周期 2.2 软件缺陷的信息 2.3 软件缺陷分类…

论文| What makes visual place recognition easy or hard?

论文| What makes visual place recognition easy or hard?

【C语言】简单有趣的扫雷游戏

**©作者:末央&#xff06; ©系列:C语言初阶(适合小白入门) ©说明:以凡人之笔墨&#xff0c;书写未来之大梦 目录 一、分析游戏规则二、分文件三、菜单实现四、游戏内容核心实现1.初始化棋盘2.打印棋盘3.布置雷4.排查雷5.game()函数实现调用 五、全部源码 一、分…

【JAVA项目】基于ssm的协同过滤算法的【图书推荐系统】

技术简介&#xff1a;采用B/S架构、ssm 框架、Java技术、MySQL等技术实现。 系统简介&#xff1a;系统权限按管理员和用户这两类涉及用户划分。&#xff08;1&#xff09;管理员功能需求 管理员登陆后&#xff0c;主要包括首页、个人中心、用户管理、书籍管理、书籍分类管理、热…

手搓链式结构队列(C语言)

Queue.h #pragma once#include <stdio.h> #include <stdlib.h> #include <assert.h> #include <stdbool.h>typedef int QDataType;// 链式结构&#xff1a;表示队列 typedef struct QListNode {struct QListNode* next;QDataType data; }QNode;// 队…