VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION--论文笔记

news2025/1/17 4:06:21

论文笔记

论文来源

Very Deep Convolutional Networks for Large-Scale Image Recognition

代码来源

还没上传

数据集

这里采用的是猫狗数据集
还没上传

1论文摘要的翻译

在这项工作中,我们研究了卷积网络深度对其在大规模图像识别设置中的准确性的影响。我们的主要贡献是使用具有非常小(3 × 3)卷积滤波器的架构对增加深度的网络进行全面评估,这表明通过将深度推至16-19权重层可以实现对现有技术配置的显着改进。这些发现是我们2014年ImageNet挑战赛提交的基础,我们的团队分别在本地化和分类轨道中获得了第一名和第二名。我们还表明,我们的表示可以很好地推广到其他数据集,从而获得最先进的结果。我们已经公开了两个表现最好的ConvNet模型,以促进在计算机视觉中使用深度视觉表示的进一步研究。

2论文的创新点

  • 使用具有非常小(3 × 3)卷积滤波器的架构对增加深度的网络
  • 从卷积网络的深度来考虑,通过添加卷积层来增加深度
  • 三层非线性纠偏而不是单一的纠偏层,使决策函数更具判别性

3 论文方法的概述

3.1 ARCHITECTURE

图片 固定大小 224 * 224
并减去RGB均值
模型架构:
卷积层:卷积核3 * 3 或这个1 * 1 padding 为1 stride 为1
池化: 最大池化(2 * 2, stride = 2)

模型配置

网络A中的11个权重层(8个卷积层和3个FC层)到网络E中的19个权重层(16个卷积层和3个FC层)。卷积层的宽度(通道的数量)相当小,从第一层的64开始,然后在每个最大池化层之后增加2倍,直到达到512。如下图所示。

  • 最大池化在一个2 × 2像素的窗口上执行,步幅为2
  • 所有函数使用了Rulu函数
    在这里插入图片描述

模型参数对比

下表中是每个配置的参数数量。尽管深度很大,但网络中的权重数量并不大于具有更大卷积层宽度和接受域的更浅的网络中的权重数量
在这里插入图片描述

3.2训练框架

训练是遵循带动量的小批量梯度下降(基于反向传播)优化多项逻辑回归目标来进行的。批量大小设置为256动量设置为0.9。训练通过权重衰减(L2正则项为 5 ∗ 1 0 − 4 5*10^{-4} 5104)和前两个完全连接层的dropout正则化(dropout ratio设置为0.5)进行正则化。

学习率最初设置为10−2,当验证集精度停止提高时,学习率降低10倍。

图像预处理:随机裁剪固定图像大小裁剪224 * 224
当图大小 S > 224 S>224 S>224时候,包含小物体或一个物体部分即可, S = 224 S= 224 S=224时,可以完全训练完整图像数据
数据增强:随机水平翻转,随机RGB颜色偏移

网络采取随机初始化(平均值为零、方差为10 - 2的正态分布中采样权重),避免学习停滞,biases偏差初始值为零。

3.3测试框架

  • 首先,将其各向同性地重新缩放到预定义的最小图像边,记为Q(我们也称其为测试尺度)。
  • 我们还通过水平翻转图像来扩大测试集;对原始图像和翻转图像的软最大类后验进行平均,得到图像的最终分数。

4 论文实验

数据集

ILSVRC-2012数据集
该数据集包括1000个类的图像,并分为三组:训练(1.3M图像),验证(50K图像)和测试(100K带有固定类标签的图像)。

4.1 单尺度评价

测试图像大小设置如下:固定 S S S Q = S Q = S Q=S,抖动 S ∈ [ S m i n , S m a x ] S∈[S_{min}, S_{max}] S[Smin,Smax]为Q = 0.5( S m i n + S m a x S_{min} + S_{max} Smin+Smax)。的结果如下表所示。
分析结果

  • 在没有任何归一化层的情况下,使用局部响应归一化(A- LRN网络)并不能改善模型A。因此,我们不会在更深的架构(B-E)中使用规范化
  • 分类误差随着卷积神经网络深度的增加而减小:从A的11层到e的19层。值得注意的是,尽管深度相同,配置C(包含三个1 × 1的卷积层)的性能比使用3 × 3卷积的配置D差
  • 训练时尺度抖动( S ∈ [ 256 ; 512 ] S∈[256;512] S[256;512])的结果明显好于对固定最小边的图像进行训练( S = 256 S = 256 S=256 S = 384 S = 384 S=384),即使在测试时使用单一尺度。这证实了通过尺度抖动增强训练集确实有助于捕获多尺度图像统计。

在这里插入图片描述

4.2 多尺度评价

在单一尺度上评估了卷积神经网络模型之后,现在评估尺度抖动在测试时的影响。它包括在测试图像的几个重新缩放版本上运行一个模型(对应于不同的Q值),然后对结果类后验进行平均。考虑到训练尺度和测试尺度之间的较大差异会导致性能下降,使用固定S训练的模型在接近训练图像的三种测试图像尺寸上进行评估:Q = { S − 32 , S , S + 32 } \{S−32,S, S + 32\} {S32,S,S+32}。同时,训练时的尺度抖动使得网络在测试时可以应用于更大范围的尺度,所以用变量 S ∈ [ S m i n , S m a x ] S∈[S_{min}, S_{max}] S[Smin,Smax], Q = { S m i n , 0.5 ∗ ( S m i n + S m a x ) , S m a x } Q = \{S_{min}, 0.5*(S_{min} + S_{max}), S_{max}\} Q={Smin,0.5(Smin+Smax)Smax}
如下表所示的结果表明,测试时的尺度抖动会带来更好的性能(与在单个尺度上评估同一模型相比,如表3所示)。与之前一样,最深配置(D和E)表现最好,并且尺度抖动优于固定最小侧s的训练。我们在验证集上的最佳单网络性能为24.8%/7.5% top-1/top-5误差(表4中粗体突出显示)。配置E达到7.3%的top-5误差。
在这里插入图片描述

4.3 MULTI-CROP EVALUATION

multi-crop
经常使用的卷积层+全连接层。通过将测试图片缩放到不同大小Q,Q可以不等于S(训练时图片大小)。在QQ图片上裁剪出多个SS的图像块,将这些图像块进行测试,得到多个1*n维的向量。通过对这些向量每一纬求平均,得到在某一类上的概率。这种方法叫做multi-crop。
我们比较了密集卷积神经网络评价与MULTI-CROP EVALUATION)。我们还通过平均其softmax输出来评估两种评估技术的互补性。结果如下表,可以看出,使用MULTI-CROP的性能略好于dense evaluation,并且这两种方法确实是互补的,因为它们的组合优于它们中的任何一种
在这里插入图片描述

5 总结

在这项工作中,我们评估了用于大规模图像分类的非常深的卷积网络(多达19个权重层)。
研究表明,表示深度有利于分类精度,并且使用传统的ConvNet架构可以在ImageNet挑战数据集上实现最先进的性能,深度大幅增加。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1690789.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CTFHUB技能树——SSRF(二)

目录 上传文件 ​FastCGI协议 Redis协议 上传文件 题目描述&#xff1a;这次需要上传一个文件到flag.php了.祝你好运 index.php与上题一样&#xff0c;使用POST请求的方法向flag.php传递参数 //flag.php页面源码 <?phperror_reporting(0);if($_SERVER["REMOTE_ADDR&…

删除MySQL中所有表的外键

方法一&#xff1a; 原理 查询schema中所有外键名称然后拼接生成删除语句 第一步&#xff1a; SELECT CONCAT(ALTER TABLE ,TABLE_SCHEMA,.,TABLE_NAME, DROP FOREIGN KEY ,CONSTRAINT_NAME, ;) FROM information_schema.TABLE_CONSTRAINTS c WHERE c.TABLE_SCHEMA数据库名…

node环境问题(无法加载文件D:\Software\Node.js\node_global\vue.ps1,因为在此系统上禁止运行脚本。)

问题&#xff1a;npm安装lerna显示安装成功&#xff0c;但是lerna -v的时候报错 解决步骤&#xff1a; 1、输入&#xff1a;Get-ExecutionPolicy 2、输入&#xff1a;Set-ExecutionPolicy -Scope CurrentUser&#xff08;有选项的选Y&#xff09; 3、输入&#xff1a;RemoteSi…

超详细的前后端实战项目(Spring系列加上vue3)前端篇(二)(一步步实现+源码)

好了&#xff0c;兄弟们&#xff0c;继昨天的项目之后&#xff0c;开始继续敲前端代码&#xff0c;完成前端部分 昨天完成了全局页面的代码&#xff0c;和登录页面的代码&#xff0c;不过昨天的代码还有一些需要补充的&#xff0c;这里添加一下 内容补充&#xff1a;在调用登…

信息系统项目管理师0129:输入(8项目整合管理—8.7监控项目工作—8.7.1输入)

点击查看专栏目录 文章目录 8.7 监控项目工作8.7.1 输入8.7 监控项目工作 监控项目工作是跟踪、审查和报告整体项目进展,以实现项目管理计划中确定的绩效目标的过程。本过程的主要作用: 让干系人了解项目的当前状态并认可为处理绩效问题而采取的行动;通过成本和进度预测,让…

房地产支持政策加码不断,美克家居全力变革未来可期

2023年我国经济处于恢复发展阶段&#xff0c;而家具制造业“回温”速度明显慢于经济增速&#xff0c;在这一背景下&#xff0c;美克家居如此营收表现并不令人感到意外。而在充沛现金流支撑下&#xff0c;辅以全方位开展降本增效的年度经营规划&#xff0c;公司亏损收窄或已为期…

rclone迁移对象存储之间的数据

1 概述 rclone是一款文件复制工具&#xff0c;既可以用于在linux主机之间复制文件&#xff0c;也可以在对象存储之间复制文件。 rclone的官网为&#xff1a; https://rclone.orgrlcone关于对象存储的官方文档为&#xff1a; https://rclone.org/s32 安装 2.1 yum安装 yum …

【全网最全】2024电工杯数学建模A题前两问完整解答+21页初步参考论文+py代码+保奖思路等(后续会更新成品论文)

您的点赞收藏是我继续更新的最大动力&#xff01; 一定要点击如下的卡片链接&#xff0c;那是获取资料的入口&#xff01; 【全网最全】2024电工杯数学建模A题前两问完整解答21页初步参考论文py代码保奖思路等&#xff08;后续会更新成品论文&#xff09;「首先来看看目前已有…

在线生成数据库er图的工具

网址 https://databasediagram.com/ 其实很早之前我也有类似的想法&#xff0c;根据数据表结构&#xff0c;显示数据表之间的关系图。 当时我还写了一个工具&#xff0c;可惜后来就没怎么用过了。 这个网站和我当时的思路很像&#xff0c;只不过他这个页面显示比我的好得多&…

谈恋爱没经验?那就来刷谈恋爱经验宝宝吧

❤️作者主页&#xff1a;小虚竹 ❤️作者简介&#xff1a;大家好,我是小虚竹。2022年度博客之星评选TOP 10&#x1f3c6;&#xff0c;Java领域优质创作者&#x1f3c6;&#xff0c;CSDN博客专家&#x1f3c6;&#xff0c;华为云享专家&#x1f3c6;&#xff0c;掘金年度人气作…

C++青少年简明教程:If选择语句

C青少年简明教程&#xff1a;If选择语句 C中选择语句的语法是&#xff1a; if (条件) { 条件成立时需要执行的语句... } [else { 条件不成立时需要执行的语句... }] 说明&#xff1a; if后面使用一个括号&#xff0c;括号里是条件——关系表达式。 所谓的关系表达式就是判…

报错:找不到或无法加载主类 com.example.SpringbootApplication(idea)

OpenJDK 64-Bit Server VM warning: Sharing is only supported for boot loader classes because bootstrap classpath has been appended 错误: 找不到或无法加载主类 com.example.SpringbootApplication 原因: java.lang.NoClassDefFoundError: com/example/SpringBootAppli…

上位机图像处理和嵌入式模块部署(mcu中的串口接口)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 在mcu开发中&#xff0c;mcu扮演着非常重要的角色。一方面&#xff0c;串口可以帮助我们对固件功能进行调试&#xff0c;另外一方面&#xff0c;串…

小猫咪的奇幻冒险:一个简单的Python小游戏

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、游戏简介与演示 二、游戏开发与运行 1. 环境搭建 2. 代码解析 3. 加速机制 三、游戏…

k近邻和kd树

K近邻 选取k值的时候可以采用交叉验证的方法 一般采用欧氏距离 kd树 采用树这个特殊的数据结构来实现k近邻算法 先假设是二维的情况 下面讲解kd树的完整构造过程 找这个中位数是按照每棵子树来创建的 前提是已经有了一棵kd树,然后来一个实例点

45岁前TVB有型熟男生图流出

凭无线处境剧《爱回家》中饰演律师「严谨」一角成功入屋的张达伦&#xff0c;于2022年约满无线离巢后&#xff0c;正式「卖身」给杜琪峰成为旗下艺人&#xff0c;先后亮相ViuTV剧集及综艺节目&#xff0c;又参与电影演出&#xff0c;作多方面尝试和发展。 日前有网民食完糖水在…

网段与广播域

ip地址与子网掩码做与运算得到网络号&#xff0c;得到的网络号相同就是同一个网段&#xff0c;否则不是&#xff0c;跟他们在什么位置没有任何关系 这里面pc3和前两个pc虽然不在同一个网段&#xff0c;但是pc1发广播包的时候&#xff0c;pc3也能收到&#xff0c;因为路由器的所…

离开谷歌:九年之后,我为何选择离开这家公司

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

【学习笔记】Windows GDI绘图(四)矩阵Matrix详解

矩阵Matrix 基于矩阵在GDI绘图的重要性&#xff0c;所以想深入了学习矩阵的相关属性与方法。 先上个本文中所有的函数图例演示吧。 原型&#xff1a; namespace System.Drawing.Drawing2D;public sealed unsafe class Matrix : MarshalByRefObject, IDisposableMatrix类封装…

玩机社区 - 2024年最美社区源码开源

玩机社区 - 2024年最美社区源码开源 教程源码文档都内置到压缩包了 https://pan.baidu.com/s/1xwcscTne-JMbmKEntiuAuA?pwd78oi