吴恩达深度学习笔记(8)

news2024/10/23 23:57:43

计算机视觉

包括:图像分类也叫做图像识别、目标检测等

一个小的图像可能1M,但是他的像素是一个超级大向量,如果直接深度学习那么运算量会很大,因此需要运用卷积运算

卷积运算是卷积神经网络的基础单元之一。下面用边缘检测理解卷积如何进行运算。

过滤器又称为核,对于复杂的图像我们可以将其设为为参数,通过后向传播学习,自动获得。

填充

是构建深度神经网络时,需要对基本卷积进行的操作。

进行卷积的两个缺陷:

  • 1、每次卷积计算过后图像都会变小。
  • 2、图像角落或者边缘的像素在输出过程中只会被使用一次,中间像素会用到很多次,丢失了许多图片靠近边界的信息。

一种是不填充,另一种是保持输入和输出一致,所以过滤器一般都是奇数。

卷积步长

带步长的卷积是在卷积神经网络中组成基础卷积模块的另一个部分。

步长等于2时:

输入与输出的维度(向下取整)

实际真正的卷积都是将核矩阵针对水平和垂直方向做一个镜面对称(反转),因此上述的过程用的是核矩阵本身,故上述计算过程应该称为交叉相关,但是多数深度学习网络都称其为卷积

三维卷积

一个体积核可以检测一个特征,两个核检测两个特征,,,,(深度/通道)

卷积网络中的一层:

单层卷积神经网络:
利用两个不同的过滤器对三维输入进行卷积运算,的到不同的输出,最终我们要将这些输出变成单程卷积神经网络,还需要对每一个输出添加一个偏差(是一个实数,应用广播机制,对矩阵中的每一个元素添加一个偏差),可以继续添加非线性转换ReLU,最终通过添加偏差与非线性转换得到一个矩阵输出。最后将不同的输出矩阵放在一起得到一个体积输出,就是卷积神经网络的一层

将其与非卷积单层前向传播神经网络对应,卷积核类似于权矩阵,上述例子中有两个过滤器,也就是两个特征,特征使得卷积神经网络不太容易过拟合。

深度卷积神经网络ConvNet:

池化层:

深度卷积神经网络通常还使用池化层减少展示量,提高计算速度,使一些特征的检测功能更强大。

如果把4X4的区域看作某个特征的集合,即神经网络某个层中的激活状态,一个大的数字,意味着它或许检测到了一个特定的特征。池化层做的其实是,如果在过滤器中任何地方检测到了这些特征,就保留最大值,如果特征没有被检测到,可能左侧上方的四分之一区域就没有这个特征,于是那些数值的最大值仍然相当小。

池化层有一套超参(步长、尺寸),但是没有任何参数需要学习,没有需要梯度下降算法学习的东西。还有均值采样,但是没有最大化采样使用频率高。

CNN示例

受到经典神经网络的启发(LeNet-5),网络中存在很多超参数,不要试着创造自己的超参数组,而是要阅读文献,看看其他人使用的超参数。去学习一定数量的神经网络的实例,去看看别人如何做的,从中获得灵感将这些构件组合在一起

为什么卷积在神经网络中如此有用,如何将卷积放在神经网络中,如何用有标签的数据训练卷积神经网络:

卷积层相较于只有完全连接的神经层优势:参数共享与连接的稀疏性

卷积神经网络参数很少的原因有两个:

  • 参数共享:在特征检测器中,例如垂直边缘检测对于图像的一部分是有用的,那么对于另一部分可能也是有用的,所有一个卷积核循环检测图像所有位置,找到垂直的边缘
  • 避免只有相对少的参数的方法建立稀疏的联系

卷积神经网络会被用来捕捉平移不变,当一张图片移动了几个像素格,它还应该产生非常相似的特征,给他相同的标签;同时,因为使用了相同的滤网,图片的各个部分,平移之前与平移之后的图层,帮助神经网络自然而然的学会更稳定或者更佳的捕捉到平移不变需要的特性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2221969.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Qt】控件——Qt多元素控件、常见的多元素控件、多元素控件的使用、List Widget、Table Widget、Tree Widget

文章目录 QtQt多元素控件List WidgetTable WidgetTree Widget Qt Qt多元素控件 List Widget 使用 QListWidget 能够显示一个纵向的列表。 属性说明currentRow当前被选中的是第几行。count一共有多少行。sortingEnabled是否允许排序。isWrapping是否允许换行。itemAlignment元素…

软件架构的 “4+1” 视图(附视图案例)

简介 Philippe Kruchten 在《IEEE Software》上发表的《The 41 View Model of Architecture》论文中提出了“41”视图方法,该方法被RUP采纳。“41”视图模型通过逻辑视图、进程视图(也称为处理视图)、物理视图、开发视图 和 场景视图 五个视…

YOLOv9改进,YOLOv9引入FLAttention注意力机制(ICCV2023),并二次创新RepNCSPELAN4结构

摘要 自我注意的二次计算复杂度在将 Transformer 模型应用于视觉任务时,这是一个长期存在的问题。除了减少注意力区域外,线性注意力也被认为是避免过多计算成本的有效解决方案。通过使用精心设计的映射函数来逼近 Softmax,线性注意力可以在自注意力操作中切换计算顺序并实现…

HTTP Proxy环境下部署Microsoft Entra Connect和Health Agents

在企业环境中,时常需要通过使用HTTP Proxy访问Internet,在使用HTTP Proxy访问Internet的环境中部署Microsoft Entra Connect和Microsoft Entra Connect Health Agents可能会遇到一些额外的配置步骤,以便这些服务能够正常连接到Internet。 一…

再Android10上实现检测AHD摄像头是否接入

项目有个需要,需要知道tp9951是否接入AHD摄像头 1,驱动层可以通过读取寄存器的值来检测是否接入AHD摄像头 tp9951_write_reg(0x40, 0x00); //select decoder page tp9951_write_reg(0x41, ch); val tp9951_read_reg(TP_INPUT_STATUS_REG);…

vscode默认添加python项目的源目录路径到执行环境(解决ModuleNotFoundError: No module named问题)

0. 问题描述 vscode中编写python脚本,导入工程目录下的其他模块,出现ModuleNotFoundError: No module named 错误 在test2的ccc.py文件中执行print(sys.path) 查看路径 返回结果发现并无’/home/xxx/first_demo’的路径,所以test2下面的文…

Vscode + EIDE +CortexDebug 调试Stm32(记录)

{// 使用 IntelliSense 了解相关属性。 // 悬停以查看现有属性的描述。// 欲了解更多信息,请访问: https://go.microsoft.com/fwlink/?linkid830387"version": "0.2.0","configurations": [{"cwd": "${workspaceRoot…

w~自动驾驶合集9

我自己的原文哦~ https://blog.51cto.com/whaosoft/12320882 #自动驾驶数据集全面调研 自动驾驶技术在硬件和深度学习方法的最新进展中迅速发展,并展现出令人期待的性能。高质量的数据集对于开发可靠的自动驾驶算法至关重要。先前的数据集调研试图回顾这些数据集&…

Djang学习- URL反转

代码中url书写规范&#xff1a; 、 url反向解析 urls: path(test/url, views.test_url),path(test_result/<int:age>, views.test_result, name"rl") views: def test_url(request):return render(request, test_url.html)def test_result(request,age):re…

Vue3学习:vite项目中图片不能显示,报错 require is not defined

今天做了一个案例“给你喜欢的人送花”&#xff0c;如果喜欢谁&#xff0c;就给谁送花&#xff0c;最多可以送5朵。运行效果如下。 这个项目是使用 npm create vitelatest 命令创建的。 包括2个组件&#xff1a; 根组件App.vue子组件HelloVote.vue。 目录结构如图所示&#x…

资讯 | 财富通科技政务协同办公管理软件通过麒麟软件适配认证

2024年9月25日&#xff0c;财富通科技研发的政务协同办公管理软件成功通过中国国产操作系统麒麟软件的适配认证。本次认证是继公司区块链产品“基于区块链的企业及人员资质数字证书服务平台”认证以后得第二次认证。这一成就标志着财富通科技在推动国产软件生态建设方面迈出了坚…

基于SSM+微信小程序的家庭记账本管理系统(家庭1)

&#x1f449;文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1、项目介绍 1、管理员端功能有首页、个人中心、用户管理&#xff0c;消费详情管理、收入详情管理、系统管理等。 2、用户端功能有首页、消费详情、收入详情、论坛信息、我的等功能。 2、项目技术 …

数据结构作业day2

作业一&#xff1a;结构体数组存储学生信息&#xff08;姓名&#xff0c;年龄&#xff0c;分数&#xff09;&#xff0c;完成输入学生信息&#xff0c;输出学生信息&#xff0c;求学生成绩之和&#xff0c;求最低学生成绩。 main.c #include "test.h"int main(int …

GitLab 老旧版本如何升级?

极狐GitLab 正式对外推出 GitLab 专业升级服务 https://dl.gitlab.cn/cm33bsfv&#xff01; 专业的技术人员为您的 GitLab 老旧版本实例进行专业升级&#xff01;服务详情可以在官网查看详细解读&#xff01; 那些因为老旧版本而被攻击的例子 话不多说&#xff0c;直接上图&a…

视频转GIF,5个简单好用的转换工具任你选!

GIF&#xff08;Graphics Interchange Format&#xff09;&#xff0c;作为一种轻量级的图像文件格式&#xff0c;因其能够存储多帧图像形成简单动画而广受欢迎。无论是动画影视片段&#xff0c;还是日常生活的小确幸&#xff0c;GIF都能将其定格为生动的视觉语言。当我们想要将…

FileLink跨网文件摆渡系统:重构跨网文件传输新时代

在数字化浪潮的推动下&#xff0c;企业对于数据的高效利用和安全管理提出了前所未有的要求。面对不同网络环境间的文件传输难题&#xff0c;传统方法往往显得力不从心&#xff0c;不仅效率低下&#xff0c;还存在极大的安全隐患。而FileLink跨网文件摆渡系统的出现&#xff0c;…

深信服超融合HCI6.8.0R2滚动热升级至HCI6.9.1

PS&#xff1a;滚动热升级没有业务影响&#xff0c;集群内主机逐台升级&#xff0c;会自动迁移运行中的虚拟机至其他主机&#xff1b; 整体巡检加上升级完成大概要三个小时的时间。如果在升级过程中&#xff0c;有跨集群迁移的任务&#xff0c;需要先停掉&#xff0c;不然无法…

excel将文本型数字转变为数值型数字

问题导入&#xff1a;复制数字到excel表格中&#xff0c;但是表格中数字显示为文本&#xff0c;且无法通过常规方法转变为可进行四则运算的数字。例如&#xff1a;在i3单元格中输入常规的转换方法仍然报错。在j3单元格中输入ISTEXT(H3)显示h3单元格确实为文本。 解决办法&#…

记录:网鼎杯2024赛前热身WEB01

目录扫描&#xff0c;发现上传点&#xff0c;判断可能存在文件上传漏洞&#xff0c;并根据文件后缀判断网站开发语言为php 编写蚁剑一句话木马直接上传 蚁剑连接 这里生成 的flag是随机的&#xff0c;因为烽火台反作弊会随机生成环境&#xff0c;在一顿查找后&#xff0c;在hom…

自动驾驶系列—激光雷达点云数据在自动驾驶场景中的深度应用

&#x1f31f;&#x1f31f; 欢迎来到我的技术小筑&#xff0c;一个专为技术探索者打造的交流空间。在这里&#xff0c;我们不仅分享代码的智慧&#xff0c;还探讨技术的深度与广度。无论您是资深开发者还是技术新手&#xff0c;这里都有一片属于您的天空。让我们在知识的海洋中…