四、卷积神经网络整体基础结构

news2024/11/15 17:55:01

一、计算机发展应用

神经网络主要用于特征提取
卷积神经网络主要应用在图像领域,解决传统神经网络出现的过拟合、权重太多等风险

1,CV领域的发展

Computer vision计算机视觉的发展在2012年出现的AlexNet开始之后得到了挽救
之前都是一些传统的机器学习算法,但是错误率始终下不去,12年之后深度学习开始登上舞台中央,直到2016年,深度学习模型错误率已经低于人类肉眼识别水平,2017年该挑战赛达到了预期效果,就不再举办了。
在这里插入图片描述

2,卷积神经网络CNN应用场景

Ⅰ 检测任务

目标检测
在这里插入图片描述
语义分割(人、车、建筑物…)
实例分割(人a、人b、车a、车b、车c、建筑物a…)
在这里插入图片描述

Ⅱ 分类与检索

分类:判断这张图像是什么?
在这里插入图片描述
检索:输入一张图像,返回同款内容,类似于tb和jd里面的拍照购物,不知道是啥,拍照就能检索出来,也就是找相似度更接近的东西
在这里插入图片描述

Ⅲ 超分辨率重构

给出一张较为模糊的图像,对其进行分辨率重构,提高分辨率
在这里插入图片描述

Ⅳ 无人驾驶

在这里插入图片描述

Ⅴ 人脸识别

在这里插入图片描述

Ⅵ 其他领域应用

①细胞检测

在这里插入图片描述

②OCR字体识别

在这里插入图片描述

③标志识别

在这里插入图片描述

3,卷积神经网络和传统神经网络区别

传统神经网络:输入的是一列特征,需要把数据reshape成一个向量进行处理
在这里插入图片描述
卷积神经网络:保存原有图像特征,直接进行处理
在这里插入图片描述

二、卷积神经网络整体架构

卷积神经网络整体架构主要包括:输入层、卷积层、池化层、全连接层
在这里插入图片描述

1,输入层

这个比较简单,也就是输入待训练或待检测的图像

2,卷积层

卷积操作也比较简单,这里我就不再过多赘述,只选择较为的核心内容。
卷积运算实则就是内积操作:对应元素相乘再相加

Ⅰ 滑动窗口步长

原图是7*7像素大小,卷积核大小为3*3,红色和绿色为两次卷积,滑动窗口步长为1
在这里插入图片描述
滑动窗口步长为2,也就是一行一行扫描式的进行卷积;左往右步长为2,那么上往下也是步长为2
在这里插入图片描述

Ⅱ 卷积核(filter)大小

一般常用的卷积核大小为3*3,当然7*7也可以,但一般都是奇数大小
卷积核的大小决定卷积之后得到的特征图的大小

Ⅲ 卷积核个数

卷积核的个数取决于卷积之后得到的特征图的深度
每个卷积核的内核均不一样
在这里插入图片描述

  • 卷积核的大小决定[32,32]—>[28,28]
  • 卷积核的个数决定最终的activation maps中的深度6
  • 因为图像是3颜色通道的,故卷积核的大小也必须为3

在这里插入图片描述

Ⅳ 边缘填充

在卷积的过程中,很容易可以看出,边缘的区域相对于中间的区域作用较小,但边缘信息也不是不重要的,故可以通过边缘填充将原先在边缘区域的信息给移到里面,从而弥补了一些边界信息缺失,对边界特征相对公平一些。
一般情况加边,加一圈全是0,加的东西不能产生其他的影响,故加0;有时为了方便计算,也可以自定义加边的圈数。
在这里插入图片描述

Ⅴ 卷积结果计算

PyTorch官网给的卷积结果计算公式
在这里插入图片描述
在这里插入图片描述
简化一下公式就是:
在这里插入图片描述

举例:输入数据为[32,32,3],使用10个[5,5,3]的卷积核进行卷积,步长为1,边界填充为2,求最终得到的特征图规模。
在这里插入图片描述

Ⅵ 卷积参数共享

卷积参数共享也就是说:若一张三颜色通道的彩色图像,三个通道,都使用同一个卷积核参数进行卷积。
在这里插入图片描述
若使用10个553的卷积核filter进行卷积,5*5*3=75,每个卷积核需要75个参数75*10=750,共10个filter750+10=760,每个filter都有一个偏置项bias,最终需要760个权重参数。相较于全连接而言,权重少的太多了。

3,池化层

池化层也称下采样、压缩,其主要目的为了减少特征参数,无任何运算。
主要有:最大池化、平均池化等池化操作,其中最大池化最常用,效果也最好
在这里插入图片描述

4,全连接层

通过卷积(特征图深度增加),池化(减少特征参数)之后,得到一个三维的特征图,此时需要将该特征图进行拉长成一行向量的形式,最后再接FC全连接层根据实际的情况进行输出。
在这里插入图片描述
举例:最终归为5分类任务,即最后得到5个结果的概率值
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/671370.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SQL高级语句2

SQL高级语句2 SQL高级语句17.---- 连接查询 ----18.自我连接,算排名:19.---- CREATE VIEW ----视图,可以被当作是虚拟表或存储查询。20.---- UNION ----联集,将两个SQL语句的结果合并起来,两个SQL语句所产生的字段需要…

重新定义DevOps:容器化的变革力量

在快速发展的数字时代,DevOps 已成为重塑软件开发格局的重要范例。DevOps 是一个源自“开发”和“运营”的术语,它将这两个历史上孤立的功能集成到一个统一的方法中,专注于缩短软件开发生命周期。因此,DevOps 实践促进了更快、更可…

【产品应用】一体化电机在拉伸吹瓶机的应用

随着塑料瓶的广泛应用,拉伸吹瓶机作为生产塑料瓶的关键设备之一,受到了越来越多企业的关注。而在拉伸吹瓶机中,一体化电机的应用正逐渐成为行业的新趋势。 01.设备简介 吹瓶机是一种用于制造塑料瓶的机械设备。它通过将预先加热的塑料颗粒或…

当 MQTT 遇上 ChatGPT:探索可自然交互的物联网智能应用

前言 随着物联网技术的迅猛发展,人与设备、设备与设备之间的互动已变得不再困难,而如何更加自然、高效、智能地实现交互则成为物联网领域新的挑战。 近期,由 OpenAI 发布的 ChatGPT、GPT-3.5 和 GPT-4 等先进大语言模型(LLM&…

python 基础知识:使用jieba库对文本进行分词

前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 一、jieba库是什么? Python的jieba库是一个中文分词工具,它可以将一段中文文本分割成一个一个的词语,方便后续的自然语言处理任务,如文本分类、情感分析等。 jieba库使用…

Riddztecia 作品集 |Beast Wear 出品

Beast & Wear:一个以彩色部落和可训练野兽庆祝多样性的收藏品。通过 NFT 野兽和装备提升你的 Riddzee 人物化身,增强视觉效果,提升你在迷人的 Riddztecia 世界中的游戏体验。去游戏、去成长、去探索。 Riddztecia NFT 空投包括训练怪兽和…

leetcode216. 组合总和 III(回溯算法-java)

组合总和 III leetcode216. 组合总和 III题目描述解题思路代码演示 回溯算法专题 leetcode216. 组合总和 III 来源:力扣(LeetCode) 链接:https://leetcode.cn/problems/combination-sum-iii 题目描述 找出所有相加之和为 n 的 k 个…

JMeter 批量接口测试

一、背景 最近在进行某中台的接口测试准备,发现接口数量非常多,有6、70个,而且每个接口都有大量的参数并且需要进行各种参数验证来测试接口是否能够正确返回响应值。想了几种方案后,决定尝试使用JMeter的csv读取来实现批量的接口…

Linux修改权限chown和chmod指令

一、 chmod指令修改文件权限 -rw-rw-r-- 1 zcb zcb 1135 Jun 9 14:56 test.c drwx------ 2 root root 4096 Apr 7 16:50 testemmc/ 上面两个文件,第一个字符-和d,分别表示二进制文件,目录,后面9个分别表示 u:拥有者…

【CV 向】了解 OpenCV 中的算术与位运算

文章目录 引言1. 利用 NumPy 创建图像2. 算术运算2.1 加法与减法2.2 乘法与除法 3. 位运算3.1 与运算3.2 或运算3.3 异或运算3.4 非运算 结论 引言 Python OpenCV 是一个功能强大的计算机视觉库,用于图像处理和计算机视觉任务。在 OpenCV 中,我们可以使…

【Python脚本】Python自动大麦网抢票,准点原价秒杀演唱会门票,拒绝黄牛交易!从我做起!!!1

文章目录 前言一、分析购票过程二、Selenium 模拟浏览器操作三、逆向工程:抢票接口总结 前言 你是否错过了周杰伦的票,最近又没抢到五月天的票,不要太难过,今晚有张学友的票,后天还有张杰的票,加油哦&…

openvpn搭建访问路由器摄像头

openvpn搭建 技术博客 http://idea.coderyj.com/ 1.环境 华为云服务器 操作系统 centos7 2.安装部署 1.安装 openvpn 和 easy-rsa(该包用来制作 ca 证书) # 安装 epel 源 yum install epel-release -y# 安装 yum install openvpn easy-rsa2、配置 /e…

如何全面评价一个低代码平台?

🐱 个人主页:不叫猫先生,公众号:前端舵手 🙋‍♂️ 作者简介:2022年度博客之星前端领域TOP 2,前端领域优质作者、阿里云专家博主,专注于前端各领域技术,共同学习共同进步…

Goby 漏洞发布|WordPress Extensive VC Addons 插件 options[template] 文件包含漏洞

漏洞名称:WordPress Extensive VC Addons 插件 options[template] 文件包含漏洞 English Name:WordPress Plugin Extensive VC Addons File Inclusion Vulnerability CVSS core: 9.8 影响资产数:2583 漏洞描述: Extensive VC…

Netty核心技术七--Google Protobuf

1.编码和解码的基本介绍 编写网络应用程序时,因为数据在网络中传输的都是二进制字节码数据,在发送数据时就需要编码,接收数据时就需要解码 codec(编解码器) 的组成部分有两个:decoder(解码器)和encoder(编码器)。encoder 负责把…

【干货】Android系统定制基础篇:第十六部分(双屏异触、定时开关机与看门狗)

一、Android双屏异触-指定触摸为副屏触摸 在双屏异显产品中,有时候主副屏都带有触摸屏,并且要求主副屏触摸各自操作互不干扰。 Android 现有框架中已经支持副输入设备的逻辑,只是默认将所有的外部热插拔设备统一指定为副输入设备&#xff0…

XILINX 7系列FPGA封装之芯片常见封装技术详解

🏡《Xilinx FPGA开发指南》 目录 1,概述2,常用封装技术2.1,Wire-bond chip-scale2.2,Wire-bond fine-pitch2.3,Flip-chip lidless2.4,Ruggedized flip-chip2.5, Flip-chip fine-pitc…

【算法设计与分析】期末复习

文章目录 复习大纲第一章算法概述1.1算法与程序1.2 算法复杂性分析 第二章递归与分治策略分治法的基本思想递归与分治的关系:用分治法解决的问题的几个特征:例题: 第三章动态规划动态规划的基本思想:分治与动态规划算法的异同&…

mine vpn

client remote ‘whvpn.deepin.com’ 1194 auth-user-pass dev tun proto tcp nobind auth-nocache script-security 2 persist-key persist-tun user nm-openvpn group nm-openvpn -----BEGIN CERTIFICATE----- MIIDPDCCAiSgAwIBAgIUUTvTCz6BndUDTIVTBxpKL19mEMkwDQYJKoZIhvcN…

JAVA开发(spring RestFull风格Feign使用总结)

现在大多数的springboot都是使用RestFull风格的接口,是Feign进行远程调用。 一、Feign介绍: Feign是Spring Cloud Netflix组件中的一个轻量级RESTFULL的http服务客户端,实现了负载均衡和Rest调用的开源框架,封装了Ribbon和RestTe…