刘二大人CNN

news2024/10/2 16:18:59

 10.卷积神经网络(基础篇)_哔哩哔哩_bilibili

0、前一部分 卷积层 和 subsampling  叫做Feature Extraction特征提取器,后一部分叫做classification

        1、每一个卷积核它的通道数量要求和输入通道是一样的。这种卷积核的总数有多少个和你输出通道的数量是一样的。

        2、卷积(convolution)后,C(Channels)变,W(width)和H(Height)可变可不变,取决于是否padding。subsampling(或pooling)后,C不变,W和H变。

        3、卷积层:保留图像的空间信息。

       4、卷积层要求输入输出是四维张量(B,C,W,H),全连接层的输入与输出都是二维张量(B,Input_feature)。

             传送门 PyTorch的nn.Linear()详解

      5、卷积(线性变换),激活函数(非线性变换),池化;这个过程若干次后,view打平,进入全连接层~
 

处理图像经常用:二维卷积神经网络

把图像通过一个卷积层,来保留图像的空间特征

做成全连接会丧失一些空间结构信息。

CNN是把图像直接按照原始的空间结构来进行保存

subsampling目的是减少feature maps的数据量

栅格图像是我们用从自然界获取图像的方式,处理图像时ccd    电子器件 光敏电阻 随着光照电阻值发生变化,一个光敏电阻就能处理一个光锥;光敏做的越小 捕获的光锥就越小 图像分辨率就高;把这些光敏电阻做成阵列,每个光敏电阻就叫做像素。

这是一个黑白的数码摄像的采集器

 彩色图像要对传感器做进一步的改进,

处理一个像素拓展成传感器阵列,这个像素的值来自于三种光敏器件

这里其实也正好解释了为什么抠图要用绿幕,因为绿色在每个像素就多一些

矢量图像大部分都是人工生成或者程序生成的,现画的,所以 随意缩放也不会改变清晰度

 

 

因为在pytorch里面、所有的输入数据必须是小批量的数据啊

torch.randn() 从正太分布采样的随机数

 stride=2进行卷积运算时的步长,默认为1;bias=False卷积运算是否需要偏置bias,默认为False。padding = 0,卷积操作是否补0。

 

 

 

 

先做 relu还是先做池化区别不大,先池化后relu计算量小一些

view()函数用来转换size大小。x = x.view(batchsize, -1)中batchsize指转换后有几行,而-1指根据原tensor数据和batchsize自动分配列数。

 将上一讲的模型换成这个即可

运算迁移到GPU,1. move model to GPU

模型参数和缓存 都放到cuda上

2. move tensors to GPU       移动计算的张量、输入和输出

 

 

 2、self.fc = torch.nn.Linear(320, 10),这个320获取的方式,可以通过x = x.view(batch_size, -1) # print(x.shape)可得到(64,320),64指的是batch,320就是指要进行全连接操作时,输入的特征维度。

11.卷积神经网络(高级篇)_哔哩哔哩_bilibili

这个结构和物联网课里提到的LeNet5很接近

 

other:拼接层等...

减少代码冗余:

在过程式的编程范式里 比如C语言,我们使用函数

面向对象,类

GoogLeNet

googleNet可以说是现在非常常用的一种基础架构,我们经常拿这个网络做主干网络,再给他做一些修改,

 

实际上inception model有好多可以构造的方式

concatenate  把张量沿着通道拼接到一起

Inception Moudel 
1、卷积核超参数选择困难,自动找到卷积的最佳组合。 
2、1x1卷积核,不同通道的信息融合。作用:改变通道个数        network in network

 

 

 

 

  观察test来看训练多少轮合适。 准确率达到新高时,备份当前网络参数,

 residual net

要解决的问题:梯度消失

跳连接,H(x) = F(x) + x,张量维度必须一样,加完后再激活。

 就可以把离输入非常近的那些层进行充分的训练

 

 

 最重要是在构造网络时,要把这个网络里面的超参数以及它的输入输出的这些size,要算出来

 增量式开发

identity mapping in deep residual network论文

 DenseNet

 后面的路怎么走:

读代码,学习别人做的系统架构,训练的架构、测试的架构、数据读取的架构、损失函数的构建

根据论文尝试自己写,卡住了去读代码,循环。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/7432.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot+Vue项目医院挂号系统的设计与实现

文末获取源码 开发语言:Java 使用框架:spring boot 前端技术:JavaScript、Vue 、css3 开发工具:IDEA/MyEclipse/Eclipse、Visual Studio Code 数据库:MySQL 5.7/8.0 数据库管理工具:phpstudy/Navicat JDK版…

2.6 自定义srv python

功能介绍 以自定义数据类型为基础,完成一个节点作为服务器,另一个节点接收传送两个数字到服务端,服务端计算后反馈到客户端进行打印输出 1、工作空间 1.1 创建工作空间lee_ws mkdir -p ~/lee_ws/src cd ~/lee_ws/src/ catkin_init_worksp…

leetcode134.加油站 贪心法求解 (c++版本)

题目描述 题目比较长,明确以下这点就可以 gas数组是当前下标i加油站所能加的油cost数组是从当前下标i加油站到下一加油站所消耗的油那么gas [i]与cost [i] 的大小就决定了车辆能否从当前加油站出发到达下一加油站 上面三点非常重要是能正确做出题目的必须要求 其实…

字符流,编码表,字符流写数据,字符流读数据

文章目录前言字符流编码表字符串中的编码解码问题字符流写数据字符流读数据总结前言 因为近期考试原因,还有自身惰性的问题,小编最近停更了一段时间,随之而来的罪恶感让我又开启了自学与创作之路,学习这么久,自己虽然…

来源稳定的l2逐笔接口数据去哪找?

l2逐笔接口的逐笔数据的最初来源均是从交易所获取,其授予了一些信息服务商L2非展示数据接口转发权限,其中包含了逐笔成交、逐笔委托等数据。使用时,通常是从信息商处购买,比如同花顺、万得、国泰安等等。那么小编认为通过交易所授…

mysql中find_in_set()函数的使用及in()用法详解

MySQL手册中find_in_set函数的语法解释: FIND_IN_SET(str,strlist) str 要查询的字符串 strlist 字段名 参数以”,”分隔 如 (1,2,6,8,10,22) 查询字段(strlist)中包含(str)的结果,返回结果为null或记录 假如字符串str在由N个子链组成的字符串列表strli…

Linux:rpm与yum(内含:1.rpm介绍+2.卸载rpm包+3.安装rpm(应用案例)+4.yum(应用案例))

1.rpm介绍使用: 实例:查看当前系统是否安装了 firefox ,操作如下: 解释: 名称:firefox 版本号:91.11.0-2 使用操作系统:el7.centos.x86_64 表示centos.x的64位系统。 查询软件包是否安装&#…

跨境电商卖家必知的9个圣诞节营销技巧

关键词:跨境电商卖家、圣诞节营销 圣诞节——对跨境电商卖家来说是非常重要的促销节日。根据以往的经验,您或许已经有了初步的促销想法,想知道您今年的跨境电子商务营销策略是否正确?为您整理了跨境电商卖家必须注意的营销技巧&am…

TiDB数据库架构——TiDB Server

TiDB Server架构 TiDB Server 是SQL层,无状态,启动多个TiDBServer,均匀分摊,解析SQL,获取真实数据。 Protocol Layer、:负责客户端的连接。 Parse、Compile:负责SQL语句的解析和编译&#xff…

信息控制信息卷积

🍿*★,*:.☆欢迎您/$:*.★* 🍿 目录 背景

少儿编程 电子学会图形化 scratch编程等级考试四级真题答案解析(判断题)2022年9月

目录 2022年9月scratch编程等级考试四级真题 判断题(共10题,每题2分,共20分) 推荐资料

java学生作业带选课管理系统ssh

1.管理员具有对学校课程信息,教师信息,学生信息增删改查的权限 (1)可以录入学校所开课程,学生信息,教师信息; (2)可以对教师的开课信息进行增加,删除&#xf…

什么是 DeGods NFT 系列?

Nov. 2022, Vincy Data Source: Footprint Analytics - DeGods NFT Collection DeGods 系列有 10,000 个 Solana 铸造头牌的 NFT。 DeGods 持有者拥有访问 DeDAO 的权限和社区。 它在 1 月推出 DUST 协议,允许持有者质押他们的 DeGods NFT 并赚取 DUST。 10 月 …

cmake 工具 三 add_libary, set_target_properties,link_libary, target_link_libary

一起通过一个例子学一下 add_libary, set_target_properties,link_libary, target_link_libary 四个命令 首先创建如下的文件: 其中 build用于cmake编译,防止大量编译的中间文件污染代码文件夹具体可见cmake 构建工具…

手机端宝贝描述中每张图片的宽要在480到1500之间,最大高度为2500, 以下图片不满足

上图是近期小编与一位店主的聊天截图,从截图中我们可以知道,这位店主在使用复制软件来复制宝贝上传时出现了一些问题,下面,小编将上传出现的错误、分析过程及解决方法列示如下,希望能给其他店主一些帮助:查…

批量图片压缩怎么做?分享三招图片压缩怎么操作的方法

因为工作需要在电脑上保存大量图片的小伙伴们,是不是图片一下子把电脑内存占满了,可是要怎么做才能减少图片的占用空间呢?我们可以把图片压缩,这样子就可以保存更多的图片啦。还不清楚批量图片压缩怎么做的小伙伴们,让…

光点数据中台,解决高校信息整合难题_光点科技

目前,国家和相关部门对教育信息化高度重视,先后出台了多项政策和文件,要求加快教育信息化的发展步伐,高校信息化进入了快速发展期。 在此背景下,数据也将会成为高校信息化的核心资产,并对高校信息化的快速发…

【Big Data】解决Hive查询出现Java.lang.OutMemoryError.java heap space

一、Introduction 在使用Hive时,出现了以下的问题 错误的原因是资源分配不够,但是错误的原因有很多,需要去查看日志文件观察具体的错误。 日志文件位置在 /tmp/root/hive.log 由此我们知道具体的错误原因是JVM资源分配不够 接下来可以尝试…

PE格式:手写PE结构解析工具

PE格式是 Windows下最常用的可执行文件格式,理解PE文件格式不仅可以了解操作系统的加载流程,还可以更好的理解操作系统对进程和内存相关的管理知识,而有些技术必须建立在了解PE文件格式的基础上,如文件加密与解密,病毒分析,外挂技术等,在PE文件中我们最需要关注,PE结构,导入表,…

Tech Lead如何组建你的全明星团队

当你成为 Tech lead,意味着你不再只是团队中的普通一员。现在你是开发团队的Leader,换句话讲,这是一支你的团队。你需要费尽心思组建和打造你的团队! 组建搭配合理的团队 (图片来自于 pixabay) 作为Tech Lead,你要先…