【无标题】动手学深度学习_现代神经网络_未完

news2025/1/5 10:47:37

这里写目录标题

      • 深度学习之前的网络
    • AlexNet
      • AlexNet得到了竞赛冠军
      • AlexNet架构
      • Alex net更多细节
        • 数据增强
    • VGG
    • NiN
    • 知识补充
      • flop
      • 暂退法 drop_out

深度学习之前的网络

1、核方法
机器学习
SVM现在还是很广泛的使用,因为对调参的需求不那么大,对调参不太敏感
特征抽取

卷积神经网络 通常运用在图片上,
计算机视觉问题 描述成几何问题,从几何学而来

计算机视觉中 曾见最重要的是特征工程
如果特征抽取的好,直接用简单的多分类模型SVM

硬件的发展趋势

样本大小,内存,CPU
内存放不下数据集
计算能力 增长速度大于 数据集的增长速度,构造更深的神经网络,算力换精度

因为采用随机梯度下降,内存要求不那么高

Min list手写数字识别
imageNet

AlexNet

AlexNet得到了竞赛冠军

1、丢弃法 模型的控制

2、letnet激活函数由sigmoid换成relu之后,效果有提升(从数值稳定性来理解,relu算梯度快,而且不容易出现梯度消失和梯度爆炸的现象)

相比于lenet的average pooling,这里用maxpooling,使得输出值更大,梯度相对更大,训练比较容易一点

不仅更大更深,观念上的改变

之前的传统机器学习:人工特征提取和SVM相当于分开的两个过程
现在的AlexNet分类器和CNN一起训练,CNN学到的很可能就是分类器想要的
构造CNN相对简单,不需要太多计算机视觉相关的知识来进行人工特征提取
端到端的学习,原始的序列到最后的结果

AlexNet架构

卷积层
图片变大,需要更大的核窗口
输出通道数变大,6变成96,图片模式比较多需要去识别
stride够大,减轻计算负担
池化层
池化窗口也稍稍增大
conv是重叠的,pool不重叠
**pad=1,输入和输出的尺寸是一样的??输入和输出得高宽是一样的 **

都是两个隐藏层
在这里插入图片描述
Dense层就是所谓的全连接神经网络?就是全连接层
稠密层,也称全连接层,就是把特征提取成一维帮助最后分类

Alex net更多细节

加入dropout层做模型的正则化??

数据增强

随机截取一块,调整亮度,对原始图片基础上增加一些变种
在这里插入图片描述

VGG

不规则,变大的lenet但是变大得很随意,这里加一点那里加一点
需要更好的设计思想,框架更加regular一些
在这里插入图片描述
占内存,计算量大不便宜

不规则
组成卷积块,再把卷积块拼上去

VGG就是模块化得Alexnet,用块的方式使代码变得很简洁
在这里插入图片描述
选择3*3,神但是窄,效果更好
替换成n个重复的VGG块
在这里插入图片描述

11,16,19指的是 含有可训练参数的层的总数,也就是不包括激活层,池化层这种不含训练参数的层

NiN

知识补充

flop

(Floating Point Operations Per Second,浮点操作/秒)计算CPU浮点能力的一个单位

暂退法 drop_out

Dropout具体工作流程
假设我们要训练这样一个神经网络,如图2所示。
在这里插入图片描述
输入是x输出是y,正常的流程是:我们首先把x通过网络前向传播,然后把误差反向传播以决定如何更新参数让网络进行学习。使用Dropout之后,过程变成如下:

(1)首先 随机(临时)删掉网络中一半的隐藏神经元,输入输出神经元保持不变(图3中虚线为部分临时被删除的神经元)

在这里插入图片描述
(2) 然后把输入x通过修改后的网络前向传播,然后把得到的损失结果通过修改的网络反向传播。一小批训练样本执行完这个过程后,在没有被删除的神经元上按照随机梯度下降法更新对应的参数(w,b)。

(3)然后继续重复这一过程:

恢复被删掉的神经元(此时被删除的神经元保持原样,而没有被删除的神经元已经有所更新
从隐藏层神经元中随机选择一个一半大小的子集临时删除掉(备份被删除神经元的参数)。
对一小批训练样本,先前向传播然后反向传播损失并根据随机梯度下降法更新参数(w,b) (没有被删除的那一部分参数得到更新,删除的神经元参数保持被删除前的结果)。
不断重复这一过程。
深度学习中Dropout原理解析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1260610.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IP代理的巨大潜力,为什么跨境业务需要它?

IP说简单不简单,说复杂也不复杂,打个比方,IP就好比我们上网的一个门牌号,每家每户都会有一个门牌号,而且是唯一的地址。而代理IP(代理服务器)是一个位于中间的服务器,充当客户端和目…

GPT还远远不是真正的智能

GPT是一个基于深度学习的自然语言处理模型,它可以生成逼真的文本。虽然GPT在生成文本方面取得了显著的进展,但它并不具备真正的智能。GPT是通过训练模型来学习语言模式,它不具备理解、推理、判断和主动学习的能力。它只是根据已有的语料库生成…

解决git与huggingface项目下载速度慢或者失败的问题

git clone 项目报错 比如使用git clone 下载项目: git clone https://github.com/ChuRuaNh0/FastSam_Awsome_TensorRT.git有时候会报以下错误: fatal: unable to access ‘https://github.com/xxx.git/’: Failed to connect to github.com port 443 …

JUC下常用的类

一、Semaphore 信号量 new Semaphore(10) 可以把他理解成停车场,最多停10辆车,多个车进来如果满了就去排队,车走了,车位就空出来了,排队的线程就可以进来主要下面2个方法 Acquire获取锁:通过CAS原子性减1&…

mobaxterm 设置文本编辑器、上传文件 、下载文件、修改文件夹或者文件权限

前言 自带的编辑如下 功能比较弱,我们可以设置外部编辑器为默认的编辑器 设置编辑器 设置sh文件的默认编辑器 我们可以在windows上新建一个1.sh文件 右键-属性 设置默认编辑器:点击更改 选择vscode编辑器 mobaxterm用vscode打开文件进行编辑 右键…

蓝桥杯day01——根据给定数字划分数组

题目描述 给你一个下标从 0 开始的整数数组 nums 和一个整数 pivot 。请你将 nums 重新排列,使得以下条件均成立: 所有小于 pivot 的元素都出现在所有大于 pivot 的元素 之前 。所有等于 pivot 的元素都出现在小于和大于 pivot 的元素 中间 。小于 piv…

Python读取照片的Exif信息: 解锁图片背后的故事

更多Python学习内容:ipengtao.com 大家好,我是涛哥,今天为大家分享 Python读取照片的Exif信息: 解锁图片背后的故事,文章2700字,阅读大约12分钟,大家enjoy~~ 在数字摄影时代,我们拍摄的照片不仅…

深入了解Rabbit加密技术:原理、实现与应用

一、引言 在信息时代,数据安全愈发受到重视,加密技术作为保障信息安全的核心手段,得到了广泛的研究与应用。Rabbit加密技术作为一种新型加密方法,具有较高的安全性和便捷性。本文将对Rabbit加密技术进行深入探讨,分析…

什么是Cyclomatic Complexity循环复杂度

Cyclomatic Complexity,可以翻译成 循环复杂度圈复杂度圈复杂性回路复杂性 循环复杂度是软件工程中的一个定量度量,表示程序或函数的复杂性。它衡量程序源代码中线性独立路径或分支的数量。如果一个函数的循环复杂度太高了,就需要进行重构。…

如何使得HAL库STM32代码可以复制,重复使用

在上面这个代码使用标准库写的,但是这个方法可以放在HAL库代码里面没有问题, 如果所有引脚的初始化都是用CubeMX生成,那么只要引脚有变化,Hal库代码就每次都要使用CubeMX生成,而且因为引脚不确定导致要移植的代码不一…

计算机基础知识59

MySQL的卸载流程 1、先停止MySQL服务:右键“此电脑”,选择“管理”,之后选择“服务和应用程序”--“服务”,在服务中找到“MySQL”,右键选择“停止”。 2、找到“控制面板”--“程序和功能”,找到MySQL&…

[python]离线加载fetch_20newsgroups数据集

首先手动下载这个数据包 http://qwone.com/~jason/20Newsgroups/20news-bydate.tar.gz 下载这个文件后和脚本放一起就行,然后 打开twenty_newsgroups.py文件(在fetch_20newsgroups函数名上,右键转到定义即可找到) 之后运行代码即…

SpringBoot监控Redis事件通知

Redis的事件通知 Redis事件通过 Redis 的订阅与发布功能(pub/sub)来进行分发, 因此所有支持订阅与发布功能的客户端都可以在无须做任何修改的情况下, 使用键空间通知功能。 因为 Redis 目前的订阅与发布功能采取的是发送即忘&am…

MySQL进阶-锁

✨作者:猫十二懿 ❤️‍🔥账号:CSDN 、掘金 、语雀 、Github 🎉公众号:猫十二懿 一、MySQL 锁 锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资源(CPU、RAM、…

Excel如何比较两列数据的不同

当遇到exel有两个列表的数据,需要比较得到他们的不同的部分,并且得到一个不同的值的列表。示例如下: 目的是:通过比较,知道Column2的哪些值不在在Column1里。 WPS直接提供了这一个功能,如下图:…

基于Python获取亚马逊的评论信息的处理

文章目录 一、分析亚马逊的评论请求二、获取亚马逊评论的内容三、亚马逊评论信息的处理四、代码整合4.1 代理设置4.2 while循环翻页 总结关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书籍四、Python工具包项目源码合集①Python工具…

理解Android无埋点技术

首先什么是无埋点呢,其实所谓无埋点就是开发者无需再对追踪点进行埋码,而是脱离代码,只需面对应用界面圈圈点点即可追加随时生效的事件数据点。 无埋点的好处 其实无埋点并不是完全不用写代码,而是尽可能的少写代码。开发者将SDK集…

策略算法与Actor-Critic网络

策略算法 教程链接 DataWhale强化学习课程JoyRL https://johnjim0816.com/joyrl-book/#/ch7/main 策略梯度 与前面的基于价值的算法不同,这类算法直接对策略本身进行近似优化。 在这种情况下,我们可以将策略描述成一个带有参数 θ θ θ的连续函数…

案例032:基于微信小程序的电子商城购物平台的设计与开发

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

软件测试回归测试流程

回归测试作为软件生命周期的一个组成部分,在整个软件测试过程中占有很大的工作量比重,软件开发的各个阶段都会进行多次回归测试。在渐进和快速迭代开发中,新版本的连续发布使回归测试进行的更加频繁,而在极端编程方法中&#xff0…