24/10/12 算法笔记 NiN

news2024/12/25 18:18:04

LeNet、AlexNet和VGG都有一个共同的设计模式:通过一系列的卷积层与汇聚层来提取空间结构特征;然后通过全连接层对特征的表征进行处理。 AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。 或者,可以想象在这个过程的早期使用全连接层。然而,如果使用了全连接层,可能会完全放弃表征的空间结构。 网络中的网络NiN)提供了一个非常简单的解决方案:在每个像素的通道上分别使用多层感知机 

看一下卷积层和全连接层对于空间结构信息的不同能力

  1. 卷积层(Convolutional Layers)

    • 卷积层通过滑动窗口(卷积核)在输入数据上进行局部连接操作,这种操作能够捕捉到输入数据的空间结构信息。例如,在图像处理中,卷积层可以检测到图像中的边缘、纹理、形状等空间特征。
    • 由于卷积层的这种局部感受野特性,它们能够理解输入数据中的空间关系,如物体的位置、方向和相对布局。
  2. 全连接层(Fully Connected Layers)

    • 全连接层则不同,每个神经元与前一层的所有神经元都有连接。在图像数据中使用全连接层时,输入数据的空间维度通常会被展平(flatten)成一个长向量。
    • 一旦图像数据被展平,空间维度的信息(如像素的位置)就会丢失,因为全连接层不再考虑输入数据的空间结构。这意味着全连接层无法直接从展平的数据中捕捉到与空间位置相关的特征。

如果在网络的早期阶段就使用全连接层,那么模型可能会失去对输入数据空间结构的表征能力。这是因为全连接层不保留空间信息,而卷积层则能够做到这一点。因此,在处理具有明显空间结构的数据(如图像)时,通常先使用卷积层来提取空间特征,然后再使用全连接层进行分类或其他任务。

实际中,通常会在卷积神经网络末尾使用全连接层,此时网络已经通过卷积层学习到了丰富的空间特征,这个阶段,全连接层可以将这些特征整合起来,用于最终的决策或分类。

NiN的想法是在每个像素位置(针对每个高度和宽度)应用一个全连接层。 如果我们将权重连接到每个空间位置,我们可以将其视为1×1卷积层(如 6.4节中所述),或作为在每个像素位置上独立作用的全连接层。 从另一个角度看,即将空间维度中的每个像素视为单个样本,将通道维度视为不同特征(feature)。

NiN特点:

1.1*1卷积层:

使用1*1卷积层来实现逐像素的全连接操作,有助于在通道维度上整合特征,同时保持空间维度学习,1*1卷积可以看作是对每个像素点的通道进行线性变换,并且可以通过这种方式减少或增加通道数,实现特征降维或升维

2.使用全局平均池化层替代了传统全连接层,减少模型的参数数量,并且使得模型的输出对输入的尺寸变化更加鲁棒

3.减少了参数,减轻过拟合问题,使模型轻量

4.在卷积层之间引入全连接层(通过1*1卷积实现)增强了模型对特征的表达能力,使模型能够捕捉到更复杂的特征组合

NiN的这些设计使得它在处理图像分类任务时非常有效,尤其是在需要保持空间结构信息的同时,还需要强大的特征表达能力的场景中。

1x1卷积层在深度学习网络中有着广泛的应用,尤其是在一些著名的网络架构中,如Network In Network(NiN)、Inception网络、ResNet等

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2210069.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

D35【python 接口自动化学习】- python基础之输入输出与文件操作

day35 文件合并 学习日期:20241012 学习目标:输入输出与文件操作﹣-47 如何使用python合并多个文件? 学习笔记: 合并文件需求分析 合并两个文件 代码实现 # 合并两个文件 with open(demo1.txt) as f1:file_data_1f…

Clickhouse 安装部署说明手册

Clickhouse 安装部署说明手册 准备工作 操作系统 CentOS Linux release 7.5.1804 详细信息: LSB Version: :core-4.1-amd64:core-4.1-noarch:cxx-4.1-amd64:cxx-4.1-noarch:desktop-4.1-amd64:desktop-4.1-noarch:languages-4.1-amd64:languages-4.1-noarch:pr…

【LeetCode】动态规划—95. 不同的二叉搜索树 II(附完整Python/C++代码)

动态规划—95. 不同的二叉搜索树 II 题目描述前言基本思路1. 问题定义二叉搜索树的性质: 2. 理解问题和递推关系递归构造思想:状态定义:递推公式:终止条件: 3. 解决方法递归 动态规划方法:伪代码&#xff…

Linux高级编程_32_磁盘映射

文章目录 磁盘映射相关函数mmap函数作用: munmap函数作用: truncate 函数作用: 语法:使用步骤: 磁盘映射 概述: > 存储映射 I/O (Memory-mapped I/O) 使一个磁盘文件与存储空间中的一个缓冲区相映射。…

Excel中Ctrl+e的用法

重点:想要使用ctrle,前提是整合或拆分后的结果放置的单元格必须和被提取信息的单元格相邻,且被提取信息的单元格也必须相连。 下图为错误示例 这样则可以使用ctrle 1、信息整合 2、提取信息 3、添加符号 4、信息顺序调换 5、数字提取 crtle还…

AI测试之 TestGPT

如今最火热的技术莫非OpenAI的ChatGPT莫属,AI技术也在很多方面得到广泛应用。今天我们要介绍的TestGPT就是一个软件测试领域中当红的应用。 TestGPT是什么? TestGPT是一家总部位于以色列特拉维夫的初创公司 CodiumAI Ltd.,发布的一款用于测…

Android:记录一个打包发布版的release包以后闪退的问题

个人感觉其实release闪退的问题挺难排查的,因为release包运行起来as捕获不到相应的应用程序进程,从而不易查看到日志,也是我玩得不溜,大家有不同的方法可以评论区探讨,我也定期回复一些评论一起讨论。以下是我遇到的情…

高效的读书与笔记管理:打造个人知识体系

01 读书学习的常见问题 1、读书⼯具分散,划线和笔记分散,导致我们的复习、搜索效率低。⽐如不同书籍中,提到了同⼀个问题的观点,很难进行关联。 2、读书,仅限于读,知道别⼈的观点,但是缺乏内…

【AI论文精读13】RAG论文综述2(微软亚研院 2409)P5-可解释推理查询L3

AI知识点总结:【AI知识点】 AI论文精读、项目、思考:【AI修炼之路】 P1,P2,P3,P4 五、可解释推理查询(L3) ps:P2有四种查询(L1,L2,L3,…

学习记录:js算法(六十二):单词搜索 II

文章目录 单词搜索 II思路一思路二 单词搜索 II 给定一个 m x n 二维字符网格 board 和一个单词(字符串)列表 words, 返回所有二维网格上的单词 。 单词必须按照字母顺序,通过 相邻的单元格 内的字母构成,其中“相邻”…

crashrpt3 开源项目的Vs 2022 C++20及其以上的编译

1. 首先从github 下载源代码 crashrpt3 2. 用CMake Gui 编译成vs studio 工程文件 2.1 点击 config 按钮 2.2 依次点击 Generate 按钮、Open Project 按钮.之后vs 2022 会打开编译好的sln工程文件 3.全选解决方案里面的所有项目,设置C语言标准,我这里设置是最新C,即启用的是…

Solidity基础语法

Solidity的在线编辑器:https://remix.ethereum.org/ 一、合约结构 1、SPDX许可标识:指定代码的开源许可 2、pragma指令:声明Solidity版本 3、导入语句:引入其他合约或库 4、合约声明:使用contract关键字 5、状态变量&…

【关系模型】关系完整性约束

按照上面的框架我们已经讲了关系数据结构还有关系操作,今天来补充这一章的关系完整性约束 关系完整性约束 完整性约束 完整性约束可以保证数据的一致性和元组的唯一性 实体完整性约束 比如在学生表中,每一个元组都应该是唯一并且元组之间是可以区分…

JavaScript(Web APIs 作用和分类,DOM数是什么,document是什么,根据css选择器来获取DOM元素,修改DOM元素的方式,边量声明)

变量声明 变量声明有三个 var let 和 const建议: const 优先,尽量使用const,原因是: const 语义化更好 很多变量我们声明的时候就知道他不会被更改了,那为什么不用 const呢? 实际开发中也是,…

【unity框架开发8】unity场景Scene的使用, 如何封装一个场景管理器

文章目录 一、场景基本操作1、加载切换场景2、获取场景信息3、激活场景4、场景基本属性获取5、已加载场景个数6、获取场景中所有物体7、创建新场景8、卸载销毁场景 二、使用协程方法来异步加载场景1、AsyncOperation相关的代码应写在一个协同程序中。2、allowSceneActivation加…

AI深湖DeepLate人工智能的数据集格式开源项目

人工智能的数据集格式 文档 • 入门 • API 参考 • 例子 • 博客 • Slack 社区 • Twitter(推特) 用其他语言阅读这篇文章: English 深湖 Deep Lake Deep Lake 是一种数据集格式,提供简单的 API 以用于创建、存储和协作处理任何规模的…

Spring Security 与 OAuth 2.0 登录实现指南

文章目录 一、项目概述二、环境准备三、创建GitHub OAuth应用四、项目依赖配置五、配置OAuth 2.0六、创建控制器七、创建视图八、运行应用九、用户界面展示十、总结 在现代的Web应用中,安全性是一个不可忽视的因素。OAuth 2.0作为一种流行的授权框架,提供…

浅析主流监控告警系统基本架构和原理

浅析主流监控告警系统基本架构和原理 一,监控系统的作用和目前主流监控系统 1,作用:监控系统一般有以下这几个作用 实时采集监控数据:包括硬件、操作系统、中间件、应用程序等各个维度的数据。实时反馈监控状态:通过…

论文笔记:RelationPrompt :Zero-Shot Relation Triplet Extraction

论文来源: ACL Findings 2022 论文链接:https://arxiv.org/pdf/2203.09101.pdf 论文代码:http://github.com/declare-lab/RelationPrompt 本篇论文是由阿里达摩院自然语言智能实验室于2022年发表的关于零样本关系抽取的顶会论文,本篇博客将记录我在阅读过程中的一些笔记…

AI自动生成PPT解决方案,AI生成PPT-PrensentationGen-Java实现

AI自动生成PPT解决方案,AI生成PPT-PrensentationGen-Java实现。 利用大语言模型生成PPT文件的SpringBoot Web应用,主要功能是自动化创建演示文稿,适用于快速制作演示材料,特色在于其高效的模板处理和文本替换技术。 点击视频观看…