pytorch学习笔记（十）

pytorch学习笔记（十）

news2026/2/13 13:38:13

一、损失函数

举个例子

比如说根据Loss提供的信息知道，解答题太弱了，需要多训练训练这个模块。

Loss作用：1.算实际输出和目标之间的差距

2.为我们更新输出提供一定的依据（反向传播）

看官方文档

每个输入输出相减取平均取绝对值再取平均

第一个损失函数：L1Loss

（差的绝对值取平均）

需要注意输入输出

N=batch_size你有多少个数据

第一个损失函数：MSELoss

（平方差误差，平方取平均）

稳妥的写法是先引入nn，然后再找到MSEloss()这个方法，避免由于拼写出错而报错

二、交叉熵

算交叉熵一般都要soft-max的，和是1

这里的-x[class]，只对目标分类计算，这里的目标分类class=1，因此-x[class]=-0.2

如果预测输出为[0.8,0.9,0.8]这种的预测概率很高又很接近的就不行，分类器的效果就不是很好。

为了让这部分比较大，只有当output和Target完全命中的时候，这一项就比较大，就是会相匹配。

Target的N是要求多少个batchsize，如实际的对哈士奇的分类，类别有三个，但是每次输入的图片只有一个也就是batchsize等于1。

另外，还需要注意：

输入必须是没有处理过的对每一类的得分。

以代码为例：

三、反向传播

利用上一次的的网络来说明

1.计算实际输出和目标之间的差距

DataLoader这边就是一个数据的加载，加载的目标数据是dataset，输入的batch_size为64

为了观察输出方便，将batch_size设置为1

图片输入进去有以下输出

target

分类问题可以用交叉熵误差

神经网络输出和真实输出的一个差距

2.为我们更新输出提供一定的一句（反向传播）

每个卷积的卷积核就需要调优的参数，给每个卷积核参数设置了一个grad（梯度），每一个节点（待更新参数）都会求出一个对应梯度，优化过程中针对这个梯度进行优化，最终实现整体loss最优。

以梯度下降法进行说明，

删除了反向传播之后，发现梯度不更新了

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1379398.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Springboot + vue 停车管理系统

Springboot + vue 停车管理系统

Springboot vue 停车管理系统项目描述系统包含用户和管理员两个角色用户：登录、注册、个人中心、预定停车位、缴费信息管理员：登录、用户信息管理、车位信息管理、车位费用管理、停泊车辆管理、车辆进出管理、登录日志查询运行环境 jdk1.8 idea …

阅读更多...

畸变矫正-深度学习相关论文学习

畸变矫正-深度学习相关论文学习

目录 DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction SimFIR: A Simple Framework for Fisheye Image Rectification with Self-supervised Representation Learning Model-Free Distortion Rectification Framework Bridged by Di…

阅读更多...

UCB Data100：数据科学的原理和技巧：第十一章到第十二章

UCB Data100：数据科学的原理和技巧：第十一章到第十二章

十一、恒定模型、损失和转换原文：Constant Model, Loss, and Transformations 译者：飞龙协议：CC BY-NC-SA 4.0 学习成果推导出在 MSE 和 MAE 成本函数下恒定模型的最佳模型参数。评估 MSE 和 MAE 风险之间的差异。理解变量线性化的必要…

阅读更多...

Java中锁的解决方案

Java中锁的解决方案

前言在上一篇文章中，介绍了什么是锁，以及锁的使用场景，本文继续给大家继续做深入的介绍，介绍JAVA为我们提供的不同种类的锁。 JAVA为我们提供了种类丰富的锁，每种锁都有不同的特性，锁的使用场景也各不相…

阅读更多...

【C】volatile 关键字

【C】volatile 关键字

目录 volatile1）基本概念2）用途：禁止编译器优化3）总结 volatile 1）基本概念 const是C语言的一个关键字。 const用于告诉编译器相应的变量可能会在程序的控制之外被修改，因此编译器不应该对其进行优化。 …

阅读更多...

mac 使用brew卸载node

mac 使用brew卸载node

1.查看当前的node版本 node -v 2.查看使用brew 安装的版本，可以看到本机装了14、16、18版本的node brew search node 3.卸载node brew uninstall node版本号 --force 如分别删除14、16、18版本的node命令如下 brew uninstall node14 --force brew uninstall no…

阅读更多...

【排序篇1】插入排序、希尔排序

【排序篇1】插入排序、希尔排序

目录一、插入排序二、希尔排序一、插入排序思路： 插入排序就像玩扑克牌，抽出一张牌作为比较的元素，与前面的牌依次进行比较，小于继续往前比较，大于等于停下插入到当前位置。图示： void InsertSort(…

阅读更多...

高效便捷的远程管理利器——Royal TSX for Mac软件介绍

高效便捷的远程管理利器——Royal TSX for Mac软件介绍

Royal TSX for Mac是一款功能强大、操作便捷的远程管理软件。无论是远程桌面、SSH、VNC、Telnet还是FTP，用户都可以通过Royal TSX轻松地远程连接和管理各种服务器、计算机和网络设备。 Royal TSX for Mac提供了直观的界面和丰富的功能，让用户能够快速便…

阅读更多...

RT-Thread I/O设备模型

RT-Thread I/O设备模型

I/O设备模型绝大部分的嵌入式系统都包括一些I/O（Input/Output，输入/输出）设备，例如仪器上的数据显示屏、工业设备上的串口通信、数据采集设备上用于保存数据的Flash或SD卡，以及网络设备的以太网接口等，都…

阅读更多...

openGauss学习笔记-195 openGauss 数据库运维-常见故障定位案例-分析查询语句运行状态

openGauss学习笔记-195 openGauss 数据库运维-常见故障定位案例-分析查询语句运行状态

文章目录 openGauss学习笔记-195 openGauss 数据库运维-常见故障定位案例-分析查询语句运行状态195.1 分析查询语句运行状态195.1.1 问题现象195.1.2 处理办法 openGauss学习笔记-195 openGauss 数据库运维-常见故障定位案例-分析查询语句运行状态 195.1 分析查询语句运行状态…

阅读更多...

池化、线性、激活函数层

池化、线性、激活函数层

一、池化层池化运算是深度学习中常用的一种操作，它可以对输入的特征图进行降采样，从而减少特征图的尺寸和参数数量。池化运算的主要目的是通过“收集”和“总结”输入特征图的信息来提取出主要特征，并且减少对细节的敏感性。在池化运算中…

阅读更多...

可盐可甜的红色马甲背心

可盐可甜的红色马甲背心

膨体棉腈面料不易皱，搭配阿兰花菱形镂空设计真的绝绝子，红色吸睛又美观随便搭配一件衬衫去穿，自带文艺气息氛围感直接拉满出街拍照很出片，时髦又气质女孩子的甜美，温柔等都可以突显有喜欢的可以尝试一下哟…

阅读更多...

... * Images are published to: /custom_ns/custom_camera/custo ...

... * Images are published to: /custom_ns/custom_camera/custo ...

using yaml rules: yaml.safe_load() failed mapping values are not allowed herein "<unicode string>", line 205, column 42:... * Images are published to: /custom_ns/custom_camera/custo ... 说出来有点不信，居然是这个注释可能不安…

阅读更多...

关于达梦DMHS实时同步工具开启预提交参数后导致同步日志报错问题的分析

关于达梦DMHS实时同步工具开启预提交参数后导致同步日志报错问题的分析

【问题现象】 DMHS日志报错，影响行数与期望行数不同【报错原因】数据库提交操作比较耗时，为加快同步速度，当两个事务操作的数据没有交集（事务之间没有关联的表）时，两个事务可以并行执行，并行执行的事务提交时，并不受事务提交先后顺序的限制，有可能后提交的…

阅读更多...

【目标检测】YOLOv5算法实现(七)：模型训练

【目标检测】YOLOv5算法实现(七)：模型训练

本系列文章记录本人硕士阶段YOLO系列目标检测算法自学及其代码实现的过程。其中算法具体实现借鉴于ultralytics YOLO源码Github，删减了源码中部分内容，满足个人科研需求。本系列文章主要以YOLOv5为例完成算法的实现，后续修改、增加相关模…

阅读更多...

随机过程——卡尔曼滤波学习笔记

随机过程——卡尔曼滤波学习笔记

一、均方预测和随机序列分解考虑随机序列使用预测定义称为的均方可预测部分。若相互独立，则是均方不可预测的。定义随机序列的新息序列 V(k)基于样本观测的条件均值为0，即均方不可预测。 V(k)与是正交的，即。二、卡尔曼滤波 …

阅读更多...

2024-01-11 部署Stable Diffusion遇挫记

2024-01-11 部署Stable Diffusion遇挫记

点击 <C 语言编程核心突破> 快速C语言入门部署Stable Diffusion遇挫记前言一、一如既往的GitHub部署二、使用的感受总结 create by Stable Diffusion; prompt: fire water llama 前言要解决问题: 由于近期的努力, 已经实现语音转文字模型, 通用chat迷你大模型的本地…

阅读更多...

JVM基础（11）——G1垃圾回收器

JVM基础（11）——G1垃圾回收器

作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO 联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖&…

阅读更多...

一文了解2024年AMC8竞赛模拟考试安排的重点和注意事项（附资源）

一文了解2024年AMC8竞赛模拟考试安排的重点和注意事项（附资源）

各位报名参加2024年AMC8竞赛的家长和孩子们注意了！今天到明天就可以参加AMC8竞赛的模拟考试了，本文结合本次模拟考试的常见问题为大家进行了梳理，站在参赛者的角度把2024年AMC8的模拟考试的关键事项和要点说清楚，让您最准确、快速…

阅读更多...

大模型日报-20240113

大模型日报-20240113

击败 8 名人类规划师：清华团队提出强化学习的城市空间规划模型 https://mp.weixin.qq.com/s/GkL5peKCOJLh4pLjiTeIFw 近年来，以更加宜居为导向，「15 分钟城市」概念得到了更多关注，其核心是居民在 15 分钟内可步行或骑行到基本服…

阅读更多...

推荐文章

最新文章