深度学习基础训练流程

news2025/2/28 13:47:37

深度学习基础训练流程

前言

本文只是本人学习笔记记录，文中部分图片来源网络，如有侵权请联系我进行删除

1、深度学习基础

1.1 深度学习

深度学习是机器学习的一个分支，目的是找到一组良好的参数θ，使得θ表示的数学模型能够很好地从训练集中学到映射关系：fθ：x→y， x, y∈D(train)，从而利用训练好的fθ(x),x∈D(test)去预测新样本。神经网络属于机器学习的一个研究分支，它特指利用多个神经元参数化映射函数fθ的模型

在这里插入图片描述

分类
- 非监督学习
- 监督学习
  - 分类
  - 回归

1.2 神经网络主要包含两个流程

前向传播，计算损失
- 神经网络前向传播从输入层到输出层：前向传播就是从输入层开始（Layer1），经过一层层的Layer，不断计算每一层的神经网路得到的结果及通过激活函数（一般使用Relu函数）的本层输出结果，最后得到输出的过程，流动的数据
- 一般就是搭建网络，将不同层次的网络层（如：全连接层）堆叠在一起，数据从输入层到输出层，搭建一个函数映射关系
反向传播，更新参数
- 前向传播计算出了预测值y¯，就可以根据y¯和真实值y的差别来计算损失L(y¯,y)，反向传播就是根据损失函数L(y¯,y)来反方向地计算每一层的a、z、w、b的偏导数（梯度），从最后一层逐层向前去改变每一层的权重，也就是更新参数，其核心是损失L对每一层的每一个参数求梯度的链式求导法则。流动的是梯度
- 反向传播（BP）算法，更新网络的参数，模型优化, SGD

$\theta = \theta - \eta\frac{d(J(\theta ))}{d(\theta )}$

在这里插入图片描述

流程图

在这里插入图片描述

1.3 网络层分类

全连接层
- fc
激活层
- relu
卷积层
- cnn
BN层

1.4 全连接层

输出节点与每个输入节点相连
问题
- 过多的参数，导致计算缓慢
- 对于图像信息，容易丢失空间信息

1.5 卷积神经网络

卷积层

局部相关性
```
  	- 只与周围的像素有关
```
权值共享性
```
  	- 一个卷积核提取一种特征
```

卷积计算
- 相关超参数
  - 步长 stride
  - 填充 padding
  - 卷积核大小 kernel
- 输出尺寸计算
  - h新=（h+2*ph-k）/ s + 1
  - w新=（w+2*pw-k）/ s + 1
池化层

在这里插入图片描述

对图像进行降采样，减少图像参数，平移不变性

1.6 图像处理方向

图像识别
目标检测
语义分割
实例分割

1.7 什么是深度学习框架

tensorlfow
- 一般编程语言 python，易开发，模块多
- tensorflow框架训练
  - 科学计算库，python的一个包
  - 为什么使用框架
    - 完成反向传播，自动求导
    - 提供基础API接口
      - 卷积层、全连接层、池化层等
      - 优化器
- 环境
  - cpu
  - gpu
    - 并行计算，矩阵运算

2 训练

2.1 输入数据（需自己处理）

数据归一化
- 使得预处理的数据被限定在一定的范围内，从而消除奇异样本数据导致的不良影响。
类别编码
- one-hot

2.2 网络层前向传播（使用API搭建网络）

数据在层之间流动，计算每一层的输出

2.3 计算损失（API提供，选择类型）

MAE
MAE
交叉熵损失

2.4 网络层反向梯度更新（框架完成）

bp算法
梯度在层之间流动，先计算最后一层的梯度，然后梯度回传

2.5 更新参数（API提供，须选择优化器即可）

模型参数
- 网络学习的参数，即需要优化的参数
超参数
- 提前设定好的参数（学习率），不能被训练的参数
常用的优化方法
- SGD
- Adam

3 预测

在这里插入图片描述

输入数据
网络层前向传播
输出结果

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/361182.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

K8S多节点二进制部署

K8S多节点二进制部署

目录一、多 Maser 集群架构的了解二、master2 节点部署 1、从 master01 节点上拷贝证书文件、各master组件的配置文件和服务管理文件到 master02 节点 2、修改配置文件kube-apiserver中的IP 3、在 master02 节点上启动各服务并设置开机自启 4、查看node节点状态三、负…

阅读更多...

1-MATLAB APP Design-图像的输入与输出

1-MATLAB APP Design-图像的输入与输出

一、APP 界面设计展示新建一个空白的APP，在此次的学习中，我们会用到编辑字段（文本框）、按钮、坐标区和面板，首先在界面中拖入一个编辑字段（文本框），在文本框中输入内容：图形的输入与输出，调整背景颜色，字体的颜色为黑色，字体的大小调为25.

阅读更多...

开通腾讯位置服务

开通腾讯位置服务

文章目录一、开通腾讯位置服务步骤二、腾讯位置服务SDK三、小程序项目中，创建 lib 目录，把SDK文件放入其中一、开通腾讯位置服务步骤因为签到流程中要获取用户当前所在地址的信息，所以需要把定位坐标缓存成地址，恰好腾讯位置服务…

阅读更多...

【 java 8】Lambda 表达式

【 java 8】Lambda 表达式

📋 个人简介 💖 作者简介：大家好，我是阿牛，全栈领域优质创作者。😜📝 个人主页：馆主阿牛🔥🎉 支持我：点赞👍收藏⭐️留言&#x1f4d…

阅读更多...

MySQL 性能优化思路和工具

MySQL 性能优化思路和工具

MySQL 性能优化思路和工具一、优化思路作为架构师或者开发人员，说到数据库性能优化，你的思路是什么样的？ 或者具体一点，如果在面试的时候遇到这个问题：你会从哪些维度来优化数据库，你会怎么回答&#x…

阅读更多...

Hive内部表与外部表的区别具体说明

Hive内部表与外部表的区别具体说明

目录 1.在/opt/atguigu/目录下，新建两个txt文件 2.在hadoop的web端递归创建一个目录，存储这两个文件 3.查看web端的文件一、内部表： 1.创建一个内部表，并指定内部表的存储位置 2.查看内部表，内部表中没有数据 …

阅读更多...

技术学习-消息队列

技术学习-消息队列

什么是消息队列可以简单理解为存放消息的队列，数据结构模型和队列一样，都是先进先出。主要用不同线程(Thread)/进程(Process) 为什么需要消息队列 (1)不同进程之间传递消息是，因为进程的耦合度高，改动一个进程，引发…

阅读更多...

基于SVPWM改进的永磁同步电机直接转矩控制二更

基于SVPWM改进的永磁同步电机直接转矩控制二更

导读：本期对基于SVPWM的永磁同步电机直接转矩控制进行全面的分析和仿真搭建。之后与传统的DTC进行比较，凸显基于SVPWM改进的DTC方法的有效性。如果需要文中的仿真模型，关注微信公众号：浅谈电机控制，留言获取。一、传统…

阅读更多...

Long型数据后端查询结果为null，返回前端显示-1，使用@JsonSerialize注解

Long型数据后端查询结果为null，返回前端显示-1，使用@JsonSerialize注解

使用场景在开发中，我们将对象序列化为JSON传输给前端，有时候我们的某个或者某些字段需要特殊处理，比如我们有一个日期字段，我们希望当日期为NULL时给前端不返回NULL而返回为未完成等信息，或者我们有一些状态字段&…

阅读更多...

达梦数据库（DM8）集成使用 Geoserver（2.22.2）以及其他对应版本详解

达梦数据库（DM8）集成使用 Geoserver（2.22.2）以及其他对应版本详解

达梦数据库（DM8）集成使用 Geoserver（2.22.2） 以及其他对应版本详解系统环境版本Geoserver 驱动对应版本达梦 8 集成 Geoserver 过程试错过程问题总结项目需要国产化，选择使用达梦数据库，在技术测试阶段&…

阅读更多...

K-近邻算法（KNN）

K-近邻算法（KNN）

K-近邻算法（KNN） K nearest neighbour 0、导引如何进行电影分类众所周知，电影可以按照题材分类，然而题材本身是如何定义的?由谁来判定某部电影属于哪个题材?也就是说同一题材的电影具有哪些公共特征?这些都是在进行电影…

阅读更多...

美创科技荣获“PostgreSQL中国最佳运维服务商”

美创科技荣获“PostgreSQL中国最佳运维服务商”

近日，由中国开源软件推进联盟PostgreSQL分会&中科院软件所&CSDN联合举办主办的“中国PostgreSQL数据库生态大会”在北京中科院软件所隆重召开。美创科技受邀参加，三位顶级数据库技术专家亮相，分享美创科技在数据库内核技术、PostgreS…

阅读更多...

IMX6ULL学习笔记（17）——工程管理

IMX6ULL学习笔记（17）——工程管理

一、简介之前我们把所有源码文件放在一个文件夹下。这样做存在两个主要问题，第一，代码存放混乱不易阅读。第二，程序可移植性差。如果工程源文件达到几十、甚至数百个的时候，这样一股脑全部放到根目录下就会使工程显得混乱不堪。…

阅读更多...

STM32开发（13）----获取唯一设备标识符UID

STM32开发（13）----获取唯一设备标识符UID

获取唯一设备标识符UID前言一、什么事UID二、实验过程1.CubeMx配置2.代码实现3.实验结果总结前言这一章节介绍如何获取STM32芯片中的唯一的ID号的两种方法。一、什么事UID 在许多项目中，识别设备是必要的。从简单的设备描述到更复杂的设备，如 USB 串…

阅读更多...

$Open3d入门$

Open3d入门

目录点云数据 1 主成分分析 1.1 Method 1.2 Results 2 表面法线估计 2.1 Method 2.2 Results 3 体素网格下采样 3.1 Method 3.2 Results 点云数据常用数据下载（免积分） 1 主成分分析 1.1 Method 对点云进行主成分分析（PCA&…

阅读更多...

[5/101] 101次面试之经典面试题

[5/101] 101次面试之经典面试题

目录 01、什么是黑盒测试? 02、为什么要做黑盒测试? 03、你在软件生命周期中的哪些测试阶段用到过黑盒测试? 04、什么是白盒测试？ 05、白盒测试与黑盒测试有什么区别？ 06、为什么要对程序进行单元测试？ 07、由谁来做单元测试&#…

阅读更多...

RK3566添加湿度传感器以及浅析hal层

RK3566添加湿度传感器以及浅析hal层

RK3566添加一款温湿度传感器gxht3x.挂在i2c总线下。驱动部分就不多做解析。大致流程硬件接好i2c线以及vcc gnd。后看数据手册。初始化寄存器，然后要读数据的话读那个寄存器，读出来的数据要做一个转化,然后实现open read write ioctl函数就行了。本文主要…

阅读更多...

【LeetCode】剑指 Offer 10- Ⅲ. 矩形覆盖 p79 -- Java Version

【LeetCode】剑指 Offer 10- Ⅲ. 矩形覆盖 p79 -- Java Version

题目链接：无 1. 题目介绍（10- Ⅲ. 矩形覆盖 ） 我们可以用2x1的小矩形横着或者竖着去覆盖更大的矩形。请问用n个2x1的小矩形无重叠地覆盖一个2xn的大矩形，总共有多少种方法？ 【测试用例】： 示例 1&#xff…

阅读更多...

[学习笔记]Rocket.Chat业务数据备份

[学习笔记]Rocket.Chat业务数据备份

Rocket.Chat 的业务数据主要存储于mongodb数据库的rocketchat库中，聊天中通过发送文件功能产生的文件储存于/app/uploads中（文件方式设置为"FileSystem"），因此在对Rocket.Chat做数据移动或备份主要分为两步，…

阅读更多...

JavaScript高级程序设计读书分享之4章——4.2执行上下文与作用域

JavaScript高级程序设计读书分享之4章——4.2执行上下文与作用域

JavaScript高级程序设计(第4版)读书分享笔记记录适用于刚入门前端的同志执行上下文变量或函数的上下文决定了它们可以访问哪些数据，以及它们的行为。在浏览器中，全局上下文就是我们常说的 window 对象（第 12 章会详细介绍）&am…

阅读更多...

推荐文章

最新文章