一文入门图像分类

news2024/12/28 5:57:20

文章目录

  • 一、卷积网络
    • 1.1 卷积的参数量
    • 1.2 卷积的计算量
    • 1.3 降低模型参数量和计算量的方法
      • 1.3.1 GoogLeNet 使用不同大小的卷积核
      • 1.3.2 ResNet 使用1×1卷积压缩通道数
      • 1.3.3 可分离卷积
  • 二、Transformer
    • 2.1 注意力机制 Attention Mechanism
    • 2.2 多头注意力 Multi-head (Self-)Attention
    • 2.3 Vision Transformer
    • 2.4 Swin Transformer
  • 三、模型学习的范式
    • 3.1 监督学习
    • 3.2 自监督学习
  • 四、tips
    • 4.1 权重初始化
    • 4.2 学习率
      • 4.2.1 学习率对训练的影响
      • 4.2.2 学习率退火 Annealing
      • 4.2.3 学习率升温 Warmup
      • 4.2.4 Linear Scaling Rule
    • 4.3 梯度更新算法
      • 4.3.1 自适应梯度算法
      • 4.3.2 正则化与权重衰减 Weight Decay
    • 4.4 早停 Early Stopping
    • 4.5 模型权重平均 EMA
  • 五、标签平滑 Label Smoothing

图像分类模型发展
图像分类模型发展

一、卷积网络

1.1 卷积的参数量

在这里插入图片描述

1.2 卷积的计算量

在这里插入图片描述

1.3 降低模型参数量和计算量的方法

•降低通道数 C′ 和 C(平方级别)
•减小卷积核的尺寸 K(平方级别)

1.3.1 GoogLeNet 使用不同大小的卷积核

在这里插入图片描述

1.3.2 ResNet 使用1×1卷积压缩通道数

在这里插入图片描述

1.3.3 可分离卷积

在这里插入图片描述在这里插入图片描述
在这里插入图片描述

二、Transformer

2.1 注意力机制 Attention Mechanism

在这里插入图片描述
在这里插入图片描述
query:查询特征,即我关心的特征有哪些。以自动驾驶举例,比如我关心车、行人、车道等三类特征;
key:图像中有什么,比如图像中有车和车道这两种特征。

2.2 多头注意力 Multi-head (Self-)Attention

仿造卷积使用多组通道的特征就多头注意力机制
在这里插入图片描述

2.3 Vision Transformer

2.4 Swin Transformer

  • Vision Transformer 的特征图是是直接下采样 16 倍得到的,后面的特征图也是维持这个下采样率不变,缺少了传统卷积神经网络里不同尺寸特征图的层次化结构。所以,Swin Transformer 提出了分层结构(金字塔结构)Hierarchical Transformer
  • 同时,相对于 Vision Transformer 中直接对整个特征图进行 Multi-Head Self-Attention,Swin Transformer 将特征图划分成了多个不相交的区域(Window),将 Multi-Head Self-Attention 计算限制在窗口内,这样能够减少计算量的,尤其是在浅层特征图很大的时候。


三、模型学习的范式

3.1 监督学习

在这里插入图片描述

3.2 自监督学习

在这里插入图片描述

四、tips

4.1 权重初始化

在这里插入图片描述

4.2 学习率

4.2.1 学习率对训练的影响

在这里插入图片描述

4.2.2 学习率退火 Annealing

在这里插入图片描述

4.2.3 学习率升温 Warmup

在这里插入图片描述

4.2.4 Linear Scaling Rule

在这里插入图片描述

4.3 梯度更新算法

4.3.1 自适应梯度算法

在这里插入图片描述

4.3.2 正则化与权重衰减 Weight Decay

在这里插入图片描述

4.4 早停 Early Stopping

在这里插入图片描述

4.5 模型权重平均 EMA

在这里插入图片描述在这里插入图片描述

模型权重平均 Stochastic Weight Averaging
## 4.6 丢弃层 Dropout ![在这里插入图片描述](https://img-blog.csdnimg.cn/f92eadb1b35843bf82d98c6f9aa1b46e.png) ## 4.6 随机深度 Stochastic Depth

在这里插入图片描述

五、标签平滑 Label Smoothing

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/197029.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SSM框架宠物管理系统

一、项目简介 本项目是一套基于ssm框架宠物管理系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。 包含:项目源码、数据库脚本等,该项目附带全部源码可作为毕设使用。 项目都经过严格调试,eclipse…

学习笔记:Java 并发编程⑥_线程池

若文章内容或图片失效,请留言反馈。 部分素材来自网络,若不小心影响到您的利益,请联系博主删除。 视频链接:https://www.bilibili.com/video/av81461839配套资料:https://pan.baidu.com/s/1lSDty6-hzCWTXFYuqThRPw&am…

软件测试-移动端测试示例1-笔记

搭建环境移动端测试试验连接真机不方便,在此通过电脑端进行一个测试安装JDK环境参考一下文章https://blog.csdn.net/weixin_47260194/article/details/122595008?spm1001.2014.3001.5502Android SDK环境配置首先去到官网https://www.androiddevtools.cn/下载SDK&am…

【虹科新品】采用NVIDIA Jetson Orin NX系统的视觉边缘计算机

虹科是智能感知与机器视觉领域领先资源整合及技术服务落地供应商,已经和Gidel展开深度的技术合作,为用户提供图像采集卡、FPGA图像处理和高带宽图像采集等服务。目前已经陆续在国内完成了多家一线公司的汽车图像采集、AOI、晶圆半导体检测项目。Gidel推出…

JS 执行上下文和作用域

与JS 中的作用域一同出现的还有一个执行上下文(execution context)的概念,这两个概念容易混淆,今天就来聊聊他们。 作用域 作用域是指程序源代码中定义变量、函数的区域,它规定了变量和函数可以访问哪些数据以及他们…

C语言和汇编语言混合编程

ATPCS ATPCS的全称是ARM-Thumb Procedure Call Standard,其核心内容就是定义了ARM子程序调用的基本规则及堆栈的使用约定等。如ATPCS规定了ARM程序要使用满递减堆栈,入栈/出栈操作要使用STMFD/LDMFD指令,只要所有的程序都遵循这个约定&#…

前端开发环境部署问题

很多开发者到了一家新公司,公司发了一台新电脑,对环境安装比较困惑。今天带大家还原,拿到公司电脑,如何安装你需要的各种环境。 一、node按装 官网下载地址: http://nodejs.cn/download/ 根据自己需要下载对应的版本…

深度 | Web 3.0时代去中心化IM 的挑战与思考

前言 Web3.0时代的重要特点: 1、数据主权 用户将拥有自己的数据主权,用户所创造的数字内容,所有权和控制权都归属于用户,用户所创造的价值可以由用户自主支配。对于IM业务,就是用户的好友列表,聊天消息等…

windowXP系统无法正常访问vue3网页

开发完的vue3项目需要在XP系统环境使用 由于在立项时采用了开发成本较低速度较快的vue3技术栈,并没有考虑到工厂的设备仍然在试用二十年前的机器,导致项目上线后有部分人员打开页面展示白屏。 经过排查,发现由于vue3使用ES6的Proxy代理实现响…

Linux-目录结构及文件基本操作

目录1、Linux目录结构1.1 FHS标准1.2 目录路径2、Linux文件的基本操作2.1 新建2.2 复制2.3 删除2.4 移动文件与文件重命名2.5 查看文件2.6 查看文件类型2.7 编辑文件1、Linux目录结构 Linux的目录结构和Windows的目录结构在实现上是完全不同的 Windows以存储介质为主&#xff…

Vue-Cli 脚手架 搭建 Vue项目

本篇目开始进行Vue基于项目中的介绍,Vue-cli 是官方提高用于搭建基于 Vue、Webpack、ES6 项目目的脚手架工具,可以前往在线官网查看:—— 官方文档 | Vue CLI 。 安装npm 1. 检测是否安装了Node.js ,未安装请前往下载;…

【内网安全-隧道搭建】内网穿透_Ngrok上线(美版、国版二开)

目录 一、准备 1、意义: 2、项目: 二、内网穿透 1、简介: 三、Ngrok(入门上线) 1、简述: 2、Ngrok入门上线(国版二开) 3、相关工具: 2、Ngrok入门上线&#xff…

低代码开发平台|SRM-招投标管理搭建指南

1、简介1.1、案例简介本文将介绍,如何搭建SRM-招投标管理。1.2、应用场景企业根据采购需求创建招投标需求,选择供应商进行邀标,供应商报名再投标,投标结束评标人员对投标项目进行评估。2、设置方法2.1、表单搭建1)新建…

Python build Exe 使用PyInstaller创建可执行的Python脚本

在本指南中,您将看到如何使用PyInstaller创建Python脚本的可执行文件? 下面是在Windows中实现这一目标的完整步骤。 使用PyInstaller创建可执行文件的步骤 步骤1:添加Python到Windows路径 首先,您可能想要将Python添加到Windows路径。 将Python添加到…

Spring Boot整合Redis笔记

文章目录前言Java 操作 RedisJedis 操作-测试Jedis 实例-手机验证码Redis与Spring Boot整合整合步骤Redis 的事务操作Redis的事务定义Multi、Exec、discard 基本命令事务冲突的问题为什么要做成事务悲观锁乐观锁WATCH key [key ... ]Redis事务三特性Redis事务秒杀案例解决计数器…

分布式定时任务-XXL-JOB-教程+实战

一.定时任务概述 1.定时任务认识 1.1.什么是定时任务 定时任务是按照指定时间周期运行任务。使用场景为在某个固定时间点执行,或者周期性的去执行某个任务,比如:每天晚上24点做数据汇总,定时发送短信等。 1.2.常见定时任务方案…

docker-compose容器编排部署

docker-compose部署微服务1、Docker-Compose是什么?2、应用场景3、docker-compose部署SpringBoot项目3.1 编写Dockfile3.2 编写docker-compose.yaml3.3 修改工程配置3.4 将相关文件上传到服务器3.5 执行docker-compose up本文是对DockerNginx打包部署前后端分离项目…

E5061B矢量网络分析仪VNA概念

矢量网络分析仪VNA是一种测试仪器,它可以将网络的响应测量成矢量:实参数和虚参数,从而表征其性能。矢量网络分析仪VNA是射频设计实验室和许多制造和服务领域的重要测试仪器。虽然矢量网络分析仪主要侧重于研究和开发,但它也可以为所有类型的R…

2月3日 读书笔记

我们将程序改善一下,让程序在按下一个键后不结束,而是把所按键的编码在画面上显示出来,这样就可以切实完成中断处理程序了。 所谓中断处理,基本上就是打断CPU本来的工作,加塞要求进行处理。而且处理中断期间不再接收别…

创业30载,百亿市值奥瑞金未来可期

1994年,关玉香在海南文昌破土兴建海南奥瑞金包装实业有限公司(原名:文昌奥瑞金制罐公司),与儿子周云杰一起带领着16名工人进入了金属包装行业,从0到如今的百亿市值,就此拉开了一路“封神”的序幕…