深度学习 Lecture 4 Adam算法、全连接层与卷积层的区别、图计算和反向传播

深度学习 Lecture 4 Adam算法、全连接层与卷积层的区别、图计算和反向传播

news2026/3/28 19:29:28

一、Adam算法（自适应矩估计）

全名：Adapative Moment Estimation

目的：最小化代价函数（和梯度下降一样）

本质：根据更新学习率后的情况自动更新学习率的值(可能是自动增大，也可能是自动变小）

它在全局不止有一个学习率，就是说每个式子的学习率都有可能有所不同。

优点：对学习率的选择更具有鲁棒性，通常比梯度下降还要快

注意：在代码中设置它的时候需要标注一个初始的学习率先

代码：

这里把初始学习率设置为le-3了

from_logits = True是为了让计算结果更加精确

SparseCategoricalCrossentropy是稀疏矩阵的交叉熵，它可以让结果出现在某个范围中

二、全连接层 (Dense layer)

含义：就是这一层里的每个神经元都从前一层得到所有的激活

三、卷积层（Convolutional layer)

含义：每个神经元只得到一部分

比如说，对于一张图片，卷积层是只接收图片的某一部份数据的，而不是整张图片

作用：

1. 加快计算速度

2.需要的数据较少

3.不容易过拟合

如果在神经网络中有多个卷积层，这个神经网络就叫卷积神经网络。

四、图计算（Computation graph)

就是，一组节点，这些节点通过边缘或箭头相连，其实就是把每个计算步骤，单独作为一个步骤，去一步一步计算。

五、反向传播（back prop)

上图是前向传播，就是从左到右进行一步一步的计算，而反向传播就是从右到左，计算导数。

在机器学习中,很多算法最后都会转化为求一个目标损失函数（loss function）的最小值。这个损失函数往往很复杂，难以求出最值的解析表达式。而梯度下降法正是为了解决这类问题。直观地说一下这个方法的思想：我们把求解损失函数最小值的过程看做“站在山坡某处去寻找山坡的最低点”。我们并不知道最低点的确切位置，“梯度下降”的策略是每次向“下坡路”的方向走一小步，经过长时间的走“下坡路”最后的停留位置也大概率在最低点附近。这个“下坡路的方向”我们选做是梯度方向的负方向，选这个方向是因为每个点的梯度负方向是在该点处函数下坡最陡的方向。至于为什么梯度负方向是函数下降最陡的方向请参考大一下的微积分教材，或者看看这个直观的解释。在神经网络模型中反向传播算法的作用就是要求出这个梯度值，从而后续用梯度下降去更新模型参数。反向传播算法从模型的输出层开始，利用函数求导的链式法则，逐层从后向前求出模型梯度。

比如上图的最终计算节点是J = d^2/2，反向传播的第一步将询问如果d的值稍微改变一点，那j的值会改变多少？

假如算出来是2，就在J到d的这个板块的方向上写一个2，这个值是j对于输入值d的导数

这是第一步。

下一步是查看之前的节点，并询问j对于a的导数是什么？

算出来是2，就在d-a这个线上写2。

照这样的思路，一直往前推j对每个参数的导数，一直推到j对最前面（第一个输入值）的导数，在这里面是w。

反向传播的作用，就是计算出最初的输入值与输出值之间存在的导数关系（即输入的参数对输出值的影响是几倍？）这样的话，就能节省调整参数的时间。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1535101.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于python+vue共享单车信息系统的设计与实现flask-django-php-nodejs

基于python+vue共享单车信息系统的设计与实现flask-django-php-nodejs

课题主要分为二大模块：即管理员模块和用户模块，主要功能包括：用户、区域、共享单车、单车租赁、租赁归还、报修信息、检修信息等；快速发展的社会中，人们的生活水平都在提高，生活节奏也在逐渐加快。为了节省…

阅读更多...

酷开科技OTT大屏营销重构新生，让营销被看见

酷开科技OTT大屏营销重构新生，让营销被看见

在过去的十年间，中国视听新媒体产业迎来了发展的黄金时代。这一时期，见证了视听新媒体业态的广泛涌现，它们不仅迅速成长和扩张，而且逐步走向了成熟。互联网电视的兴起，为消费者带来了多样化的视听内容享受方式&#xf…

阅读更多...

【Linux多线程】线程的概念

【Linux多线程】线程的概念

【Linux多线程】线程的概念目录【Linux多线程】线程的概念Linux线程的概念什么是线程重新定义线程和进程进程地址空间第四讲线程的优点线程的缺点线程异常线程的用途 Linux进程VS线程进程和线程关于进程线程的问题 Linux线程控制POSIX线程库创建线程如何给线程传参&#xff…

阅读更多...

鸿蒙Harmony应用开发—ArkTS-全局UI方法（菜单）

鸿蒙Harmony应用开发—ArkTS-全局UI方法（菜单）

在页面范围内关闭通过bindContextMenu属性绑定的菜单。说明： 从API Version 8开始支持。后续版本如有新增内容，则采用上角标单独标记该内容的起始版本。 ContextMenu.close 方法描述close(): void可以通过该方法在页面范围内关闭通过bindContextMenu给…

阅读更多...

onlyoffice创建excel文档

onlyoffice创建excel文档

前提安装好onlyoffice然后尝试api开发入门编写代码 <html> <head><meta charset"UTF-8"><meta name"viewport"content"widthdevice-width, user-scalableno, initial-scale1.0, maximum-scale1.0, minimum-scale1.0"&…

阅读更多...

3D高斯泼溅的崛起

3D高斯泼溅的崛起

沉浸式媒体领域正在以前所未有的速度发展，其中 3D 高斯溅射成为一项关键突破。这项技术在广泛的应用中看起来非常有前景，并且可能会彻底改变我们未来创建数字环境以及与数字环境交互的方式。在本文中，我们将通过与摄影测量和 NeRF 等前辈进…

阅读更多...

数学建模（Topsis python代码案例）

数学建模（Topsis python代码案例）

目录介绍： 模板： 案例： 极小型指标转化为极大型（正向化）： 中间型指标转为极大型（正向化）： 区间型指标转为极大型（正向化）： 标…

阅读更多...

低压MOS在无人机上的应用-REASUNOS瑞森半导体

低压MOS在无人机上的应用-REASUNOS瑞森半导体

一、前言无人机的结构由机身、动力系统、飞行控制系统、链路系统、任务载荷等几个方面组成的。无人机动力系统中的电机，俗称“马达”，是无人机的动力来源，无人机通过改变电机的转速来改变无人机的飞行状态。即改变每个电机的速度&#xf…

阅读更多...

灵境矩阵：开启无代码写作新时代，AI智能平台引领创作潮流

灵境矩阵：开启无代码写作新时代，AI智能平台引领创作潮流

灵境矩阵 “灵境杯”智能体创意大赛，瓜分百万超级奖励在当今数字化快速发展的时代，人工智能（AI）技术正逐渐渗透到我们生活的方方面面。从智能家居到自动驾驶，AI的应用领域不断扩大，而今天，我们…

阅读更多...

在基于Android相机预览的CV应用程序中使用 OpenCL

在基于Android相机预览的CV应用程序中使用 OpenCL

查看：OpenCV系列文章目录（持续更新中......） 上一篇：OpenCV4.9.0在Android 开发简介下一篇：在 MacOS 中安装本指南旨在帮助您在基于 Android 相机预览的 CV 应用程序中使用 OpenCL ™。教程是为 Android Studio 20…

阅读更多...

软考系统架构设计师系列知识点之云原生架构设计理论与实践（1）

软考系统架构设计师系列知识点之云原生架构设计理论与实践（1）

所属章节： 第14章. 云原生架构设计理论与实践第1节云原生架构产生背景云原生（Cloud Native）是近几年云计算领域炙手可热的话题，云原生技术已成为驱动业务增长的重要引擎。同时，作为新型基础设施的重要支撑技术&…

阅读更多...

DMHS同步之MYSQL to MYSQL

DMHS同步之MYSQL to MYSQL

一、环境情况二、源端及目的端安装MySQL，可参考网上资料，此处省略安装过程三、目的端安装配置unixODBC 1.上传unixODBC-2.3.12.tar.gz包到/opt下 2.解压 cd /opt tar -zvxf unixODBC-2.3.12.tar.gz复制 3.安装 cd unixODBC-2.3.11 ./configure …

阅读更多...

使用 React antd 的ProFormSelect组件搜索查询多选的写法

使用 React antd 的ProFormSelect组件搜索查询多选的写法

使用 React antd 的ProFormSelect组件搜索查询多选的写法需求：需要一个搜索框，可以选择员工，（员工人数多无法一次性获取，全部放入options中），所以需要使用搜索功能，而且是可以多…

阅读更多...

WebXR实践——利用aframe框架浏览器展示全景图片

WebXR实践——利用aframe框架浏览器展示全景图片

一、效果话不多说，先上效果二、代码 index.html <!DOCTYPE html> <html><head><meta charset"utf-8"><title>360° Image</title><meta name"description" content"360° Imag…

阅读更多...

【QT入门】 Qt槽函数五种常用写法介绍

【QT入门】 Qt槽函数五种常用写法介绍

声明：该专栏为本人学习Qt知识点时候的笔记汇总，希望能给初学的朋友们一点帮助(加油！) 往期回顾： 【QT入门】实现一个简单的图片查看软件-CSDN博客【QT入门】图片查看软件(优化)-CSDN博客【QT入门】 lambda表达式(函数)详解-CSDN…

阅读更多...

odoo扩展导出pdf功能

odoo扩展导出pdf功能

1. 说明: odoo原生导出功能扩展导出pdf文件功能, 如有额外需求请联系博主 2. 版本说明: odoo版本: odoo15 其他odoo版本未进行测试,如有需要自行测试 3. 地址: 该补丁代码放在github仓库, 地址: https://github.com/YSL-Alpaca/odoo_export_pdf 4. 改补丁依赖于第三方软件wkh…

阅读更多...

数学建模（灰色关联度 python代码案例）

数学建模（灰色关联度 python代码案例）

目录介绍： 模板： 案例：哪些原因影响结婚率数据标准化： 灰色关联度系数： 完整代码： 结果： 介绍： 灰色关联度是一种多指标综合评价方法，用于分析和评价不同指标之…

阅读更多...

【MySQL】对表的相关操作（DDL）

【MySQL】对表的相关操作（DDL）

👦个人主页：Weraphael ✍🏻作者简介：目前学习计网、mysql和算法 ✈️专栏：MySQL学习 🐋 希望大家多多支持，咱一起进步！😁 如果文章对你有帮助的话欢迎评论&#x1f4ac…

阅读更多...

软件杯深度学习大数据股票预测系统 - python lstm

软件杯深度学习大数据股票预测系统 - python lstm

文章目录 0 前言1 课题意义1.1 股票预测主流方法 2 什么是LSTM2.1 循环神经网络2.1 LSTM诞生 2 如何用LSTM做股票预测2.1 算法构建流程2.2 部分代码 3 实现效果3.1 数据3.2 预测结果项目运行展示开发环境数据获取最后 0 前言 🔥 优质竞赛项目系列，今天…

阅读更多...

AI助力生产制造质检，基于YOLOv5全系列【n/s/m/l/x】参数模型开发构建工业生产制造场景下的瓷砖瑕疵检测识别分析系统

AI助力生产制造质检，基于YOLOv5全系列【n/s/m/l/x】参数模型开发构建工业生产制造场景下的瓷砖瑕疵检测识别分析系统

瓷砖生产环节一般经过原材料混合研磨、脱水、压胚、喷墨印花、淋釉、烧制、抛光，最后进行质量检测和包装。得益于产业自动化的发展，目前生产环节已基本实现无人化。而质量检测环节仍大量依赖人工完成。一般来说，一条产线需要配数名质检工&…

阅读更多...

推荐文章

最新文章