深度学习_卷积神经网络知识点小结

news2024/10/25 14:12:20

为什么要使用卷积神经网络?

        因为使用多层感知机进行深度学习的话, MLP使用全连接结构

        导致参数数量随输入规模和网络深度呈指数增长。而且MLP参数众多,容易过拟合训练数据

        而CNN通过局部连接和权值共享大幅减少参数数量,提高计算效率,降低了过拟合风险

CNN:卷积神经网络进行图像分类

       图像卷积:

              前置知识:

                     1.卷积-convolute, 专业术语有点抽象, 可以直接看第三点

                                   通过两个函数f和g生成第三个函数。其本质是一种特殊的积分变换,表征函数f与g经过翻转和平移的重叠部分函数值乘积对重叠长度的积分。如果将参加卷积的一个函数看作区间的指示函数,卷积还可以被看作是"滑动平均"的推广

                     2.卷积运算对应于图像矩阵:

                            将图像矩阵和滤波器矩阵进行对应相乘再求和的运算, 转化得到新矩阵

                     3.提示:

                            是不是感觉挺抽象,我也是这么认为, 建议去网上看一看卷积运算的视频, 你会发现, 哦, 就是这么回事啊! 当然, 也可以直接点击文章下方的链接, 这是一套完整的机器学习+深度学习教程,

                            在教程的P43 8-1和8-2这两节有完整详尽的教学视频

              作用:

                     快速定位图像中某些边缘特征,在图像矩阵中重点突出边缘特征

              执行:

                     根据样本图片矩阵, 设置合适的轮廓过滤器,然后将图像矩阵和滤波器矩阵进行卷积运算, 转化得到突出边缘特诊的新矩阵

              轮廓过滤器:

                     竖向轮廓过滤器

                     横向轮廓过滤器

                     sobel过滤器

       图像池化:

              前置知识:

                     池化: 按照一个固定规则对图像矩阵进行处理, 将其转化为更低维度的矩阵

                     其核心思想是将输入的特征图(FeatureMap)中的相邻像素进行组合,以减少特征图的尺寸和计算量

              作用:

                     用于降低图像矩阵的维度,减少计算量和防止过拟合, 可以将高维度的图像矩阵转化为低维度的图像矩阵, 使我们可以在保留输入特征图中的主要信息,同时减少网络的参数数量和计算量

              操作步骤:

                     个人感觉类似于卷积运算, 看个计算视频就全都明白, 也可以直接点击文章下方的链接, 这是一套完整的机器学习+深度学习教程,

                            在教程的P43 8-1和8-2这两节有完整详尽的教学视频

              池化方式:

                     1.平均法池化(Avg-pooling):取池化窗口中像素的平均值作为结果输出到新矩阵

                     2.最大法池化(Max-pooling):取池化窗口中像素的最大值作为结果输出到新矩阵

       卷积操作和池化操作的关系:

              1.卷积操作主要用于从输入图像矩阵中提取边缘特征,

              2.池化操作主要用于在保留图像中主要信息的前提下,尽量减少矩阵维度, 进而减少计算成本和训练速度

              3.池化操作通常在卷积层之后进行,可以看作是对卷积层的输出进行压缩和摘要

       卷积神经网络的组成:

              卷积层+池化层+mlp=卷积神经网络(CNN)

       卷积运算导致的问题:

              1.图像被压缩, 造成信息丢失

              改善方法:

                     选用合适的池化方法                                              ##

              2.边缘信息使用频率少, 容易被忽略

              改善方法:

                     对图像进行填充padding,在各边增加像素,使图像矩阵在进行卷积运算后维持原大小

                     填充像素的数量和形状由过滤器尺寸与stride决定

经典的CNN模型

       LeNet-5:

              输入图像:32*32,单通道

              训练参数:6w

              特点:

                     随着网络越深,图像的高度和宽度在缩小, 通道数在增加

                     卷积与池化先后成对使用

       AlexNet:

              输入图像:227*227*3rgb,三通道

              训练参数:约6kw

              特点:

                     适用于识别较为复杂的彩色图, 可识别1k个类别

                     结构比LeNet更复杂,使用Relu作为激活函数

              历史意义:

                     关于AlexNet论文的发表,让学术界开始相信深度学习技术,可以在计算机视觉领域取得不错的效果

       VGG-16

              输入图像:227*227*3rgb,三通道

              训练参数:约1.38ww

              特点:

                     相对于alexnet, vgg-16,更加标准化, 统一化

                            所有卷积层的filter的宽和高都为3,步长为1,padding都使用same convolution

                            所有池化层的filter的宽和高都为2,步长为2

                     相比于AlexNet, 用更多的filter用于提取轮廓特征,具有更高精确性,

经典CNN模型应用于新场景:

       1.(推荐)借用经典CNN模型结构对图像进行预处理,再建立MLP模型

              1.加载经典CNN模型,对图像进行预处理

              2.把预处理完成的数据作为输入, 分类结果作为输出, 建立一个mlp模型

              3.训练模型

       2.参考经典CNN模型结构搭建新模型

扩展1:

       Relu与sigmoid函数的区别

              Relu是分段函数, 计算简单

              sigmoid是复合函数,计算复杂

              对于大量数据的训练,选用relu可以更快收敛, 计算速度快

扩展2:

        学习教程推荐

       作为新手入门的小白, 体验各种机器学习教学视频,

       感觉合适的学习路线:

              机器学习--《IT教学》博主的《机器学习+深度学习教程》

              深度学习--《IT扛霸子》博主的《AI人工智能从入门到精通》

【【整整600集】清华大学196小时讲完的AI人工智能从入门到精通全套教程,全程干货无废话!学完变大佬!这还学不会,我退出IT圈!机器学习-深度学习-opencv】 https://b23.tv/352yMuY

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2223325.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RHCE【web服务器】

目录 一、web服务器简介 1、什么是www 2、网址及HTTP简介 3、http协议请求的工作过程: 二、web服务器的类型 1、仅提供用户浏览的单向静态网页 2、提供用户互动接口的动态网站 三、web服务器基本配置 四、虚拟主机配置实战 1、搭建静态网站--基于http协议…

草地杂草数据集野外草地数据集田间野草数据集YOLO格式VOC格式目标检测计算机视觉数据集

一、数据集概述 数据集名称:杂草图像数据集 数据集是一个包含野草种类的集合,其中每种野草都有详细的特征描述和标记。这些数据可以包括野草的图片、生长习性、叶片形状、颜色等特征。 1.1可能应用的领域 农业领域: 农业专家和农民可以利用这一数据集来…

Spring Boot:植物健康监测的智能先锋

摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了植物健康系统的开发全过程。通过分析植物健康系统管理的不足,创建了一个计算机管理植物健康系统的方案。文章介绍了植物健康系统的系统分析部分&…

VScode分文件编写C++报错 | 如何进行VScode分文件编写C++ | 不懂也能轻松解决版

分文件编写遇到的问题 分文件编写例子如下所示: 但是直接使用 Run Code 或者 调试C/C文件 会报错如下: 正在执行任务: C/C: g.exe 生成活动文件 正在启动生成… cmd /c chcp 65001>nul && D:\Librarys\mingw64\bin\g.exe -fdiagnostics-col…

RabbitMQ常见问题持续汇总

文章目录 消息分发不公平分发限流-basic.qos主要功能使用场景示例代码 消费者默认concurrency数量prefetch和concurrency结合? spring.rabbitmq.template.retry.enabledtrue和spring.rabbitmq.listener.simple.retry.enabledtrue有什么区别1. spring.rabbitmq.templ…

中药大数据(二)中药方剂表设计与导入

中药大数据(二)中药方剂表设计与导入 最近在做一个中药大数据的单子,已经爬取到了中药和方剂的数据,现在根据爬取到的数据设计数据库和导入neo4j形成知识图谱。 1 中药方剂数据表设计 爬取到的字段有 方剂名 title 处方 presc…

自动化部署-01-jenkins安装

文章目录 前言一、下载安装二、启动三、问题3.1 jdk版本问题3.2 端口冲突3.3 系统字体配置问题 四、再次启动五、配置jenkins5.1 解锁5.2 安装插件5.3 创建管理员用户5.4 实例配置5.5 开始使用5.6 完成 总结 前言 spingcloud微服务等每次部署到服务器上,都需要本地…

【判断推理】逻辑论证之数量论证

3.1 比例类论证 看比例而不是单看分子! 逻辑类似于抛开剂量谈毒性没有价值。不明确基数大小,单纯比较数量没有价值。 本题中,平民总数可能有1000万,军队综述可能就50万,死亡率不可能相似。 论点:家人吸…

利用Pixabay API获取免费图片和视频的完整指南

视觉内容在吸引受众和有效传达信息方面发挥着举足轻重的作用。然而,获取这些内容往往需要付出高昂的代价。 幸运的是,Pixabay 提供了 440 多万种免费资产,从令人惊叹的照片到引人入胜的视频,所有这些都可以通过其 API 访问。 在…

处理Hutool的Http工具上传大文件报OOM

程序环境 JDK版本: 1.8Hutool版本: 5.8.25 问题描述 客服端文件上传主要代码: HttpRequest httpRequest HttpUtil.createPost(FILE_UPLOAD_URL); Resource urlResource new UrlResource(url, fileName); httpRequest.form("file&q…

nrm之npm镜像源管理工具(NPMRegistryManager)

1. Whats is nrm? 1. 官网地址 https://github.com/Pana/nrm https://www.npmjs.com/package/nrm 2. 关于nrm nrm can help you easy and fast switch between different npm registries, now include: npm, cnpm, taobao, nj(nodejitsu). nrm可以帮助您在不同的 npm 注册表…

智能AI监测系统燃气安全改造方案的背景及应用价值

随着燃气行业的迅速发展和城市化进程的加快,燃气安全管理成为企业运营和城市管理中不可忽视的关键领域。燃气泄漏、管道破损等事故的发生不仅会造成严重的经济损失,还威胁到人民生命财产安全。传统的安全管理方法往往依赖人工巡检和手动监测,…

Discuz发布原创AI帖子内容生成:起尔 | AI原创帖子内容生成插件开发定制

Discuz发布原创AI帖子内容生成:起尔 | AI原创帖子内容生成插件开发定制 在当今互联网快速发展的时代,内容创作成为了网站运营、社交媒体管理和个人博客维护不可或缺的一部分。然而,高质量内容的创作往往耗时耗力,特别是对于需要频…

webpack 老项目升级记录:从 node-sass 限制的的 node v8 提升至支持 ^node v22

老项目简介 技术框架 vue 2.5.17webpack 4.16.5"webpack-cli": "3.1.0""node-sass": "^4.7.2" 几个阶段 第一步:vue2 升级到最新 第一步:升级 vue2 至最新版本,截止到目前(2024-10-…

用js+css实现圆环型的进度条——js+css基础积累

如果用jscss实现圆环型的进度条&#xff1a; 直接上代码&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><met…

通信协议——UART

目录 基础概念串行&并行串行的优缺点 单工&双工 UART基本概念时序图思考&#xff1a;接收方如何确定01和0011 基础概念 串行&并行 串行为8车道&#xff0c;并行为1车道 串行的优缺点 通行速度快浪费资源布线复杂线与线之间存在干扰 单工&双工 单工&#xf…

vite脚手架中安装和按需引入vuetify

最近想尝试以下vuetify&#xff0c;然后根据chatgpt的引导安装上了&#xff0c;但是谁知道呢&#xff0c;最后打包后的项目&#xff08;里面什么都没写&#xff0c;只是一个vuetify测试页面&#xff09;大小已经超过了5mb&#xff0c;然后我找了很多资料&#xff0c;最终学会了…

【LeetCode】1297、子串的最大出现次数

【LeetCode】1297、子串的最大出现次数 文章目录 一、定长滑动窗口1.1 定长滑动窗口 二、多语言解法 一、定长滑动窗口 1.1 定长滑动窗口 参考 本题, 只需要 考虑 minSize, 而不需要考虑 maxSize 以例1为例: s “aababcaab”, maxLetters 2, minSize 3, maxSize 4 结论: …

[Linux网络编程]05-TCP状态和端口复用,shutdown函数(主动方建立/关闭连接状态,被动方建立/关闭连接状态,2MSL时长,TCP其他状态)

一.TCP状态图表示 netstat -apn | grep client 查看客户端网络连接状态 netstat -apn | grep port 查看端口的网络连接状态 二.主动方&#xff0c;被动方TCP连接状态 1. 主动发起连接请求端&#xff1a; CLOSE – 发送SYN – SEND_SYN – 接收 ACK、SYN – SEND_SYN – 发送 A…

关于VSCode 一运行终端显示一行以后就剩光标的情况

在配置VSCode C的时候&#xff0c;我发现我每次点击运行&#xff0c;终端那显示&#xff1a; 终端被任务重用&#xff0c;按任意键关闭。 然后&#xff0c;后面终端就什么都没有了剩下一个终端在那里瑟瑟发抖&#xff1a; 然后紧接着弹出一个框&#xff1a; 这段说实话&…