pytorch的CrossEntropyLoss交叉熵损失函数默认是平均值

news2026/3/29 21:03:09

pytorch中使用nn.CrossEntropyLoss()创建出来的交叉熵损失函数计算损失默认是求平均值的，即多个样本输入后获取的是一个均值标量，而不是样本大小的向量。

net = nn.Linear(4, 2)
loss = nn.CrossEntropyLoss()
X = torch.rand(10, 4)
y = torch.ones(10, dtype=torch.long)
y_hat = net(X)
l = loss(y_hat, y)
print(l)

打印的结果：tensor(0.7075, grad_fn=<NllLossBackward0>)

以上是对10个样本做的均值的标量

net = nn.Linear(4, 2)
loss = nn.CrossEntropyLoss(reduction='none')
X = torch.rand(10, 4)
y = torch.ones(10, dtype=torch.long)
y_hat = net(X)
l = loss(y_hat, y)
print(l)

在构造CrossEntropyLoss时候加入 reduction='none'，就把默认求平均取消掉了

打印结果：

tensor([0.6459, 0.7372, 0.6373, 0.6843, 0.6251, 0.6555, 0.5510, 0.7016, 0.6975,
        0.6849], grad_fn=<NllLossBackward0>)

以上是10个样本各自的loss值

上图是pytorch的CrossEntropyLoss的构造方法，默认是 reduction='mean'

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/834057.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

最新ChatGPT商用网站源码+支持ai绘画+GPT4.0+Prompt角色+MJ以图生图+思维导图生成！

Jenkins Gerrit Trigger实践

1.创建Gerrit Trigger 2.jenkins master节点生成gerrit用户的密钥这里的用户名得写登录gerrit后个人信息中的 Username 3.gerrit 配置刚刚jenkins生成密钥的公钥 4.gerrit 用户加入群组不加这个群组，下一步测试就会报错“User aeshare has no capability conn…

阿里云ssl免费数字证书快过期如何更换

1.登陆阿里云找到ssl 查看快过期的证书数字证书管理服务-ssl证书 2.创建免费的证书，对应过期证书的域名 3.下载新证书 pem key放在本地此处记录本地的下载路径 /Users/dorsey/Downloads/10791167_lzzabc.cn_nginx/lzzabc.cn.pem /Users/dorsey/Downloads/1…

sheetJs / xlsx-js-style 纯前端实现导出 excel 表格及自定义单元格样式

文章目录一、安装二、创建基础工作表三、设置单元格宽度/高度/隐藏单元格四、分配数字格式五、超链接六、单元格注释七、公式八、合并单元格九、自定义单元格样式十、项目地址一、安装 xlsx 地址：https://www.npmjs.com/package/xlsxSheetJs 地址：htt…

中断管理

其实，关于中断的概念和定义在之前已经反复学习和实践了，这节主要讲和FreeRTOS相关的中断知识。中断优先级任何中断的优先级都大于任务！ 在我们的操作系统，中断同样是具有优先级的，并且我们也可以设置它的优先级&a…

Quic协议 0-RTT

目录 1、Quic协议 2、Quic直接通过TLS握手进行建立链接，TLS是1.3版本 3.1、通过缓存服务器公钥实现0-RTT，服务器通过kdf密钥派生机制，来产生会话加密key，保证数据向前安全性 3.2、通过PKN来实现数据重传保证数据完整性&…

Yalmip入门教程(4)-约束条件定义的相关函数

博客中所有内容均来源于自己学习过程中积累的经验以及对yalmip官方文档的翻译：https://yalmip.github.io/tutorials/ 这篇博客将详细介绍yalmip工具箱中约束条件定义等相关函数的用法。 1.约束条件定义的相关函数 1.1 alldifferent函数 alldifferent函数用于表示…

计算机毕设深度学习疫情社交安全距离检测算法 - python opencv cnn

文章目录 0 前言1 课题背景2 实现效果3 相关技术3.1 YOLOV43.2 基于 DeepSort 算法的行人跟踪 4 最后 0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升，传统的毕设题目缺少创新和亮点，往往达不到毕业答辩的要求，这两…

跨境多商户中日韩英多语言商城搭建（PC+小程序+H5），搭建方案

随着全球化的推进，跨境电商正变得越来越普遍。在本文中，我们将介绍跨境电商系统开发中多语言商城独立站的部署搭建方案。准备工作在开始部署搭建之前，需要准备以下环境： 服务器，确保服务器具备足够的性能和稳定性。 …

09-向量的范数_范数与正则项的关系

⛳向量的范数范数的公式是向量每个分量绝对值 P 次方再用幂函数计算 P 分之一，这里 P 肯定是整数 1，2，3…到正无穷都是可以的向量的范数就是把向量变成一个标量，范数的表示就是两个竖线来表示，然后右下角写上 P&a…

2023 电赛 E 题激光笔识别有误--使用K210/Openmv/树莓派/Jetson nano实现激光笔在黑色区域的目标检测

1. 引言 1.1 激光笔在黑色区域目标检测的背景介绍在许多应用领域，如机器人导航、智能家居和自动驾驶等，目标检测技术的需求日益增加。本博客将聚焦于使用K210芯片实现激光笔在黑色区域的目标检测。激光笔在黑色区域目标检测是一个有趣且具有挑战性的…

redis发布订阅模型

文章目录发布与订阅1.频道订阅和退订1.1订阅频道subscribe**伪代码** 1.2 退订频道伪代码 2.模式订阅和退订2.1订阅模式psubscribe2.2 退订模式 3.发送消息3.1 消息发送频道订阅者伪代码 3.2消息发送模式订阅者伪代码总结的Publish4.查看订阅消息4.1 pubsub channels4.2 pubs…

从前序与中序遍历序列构造二叉树，从中序与后序遍历序列构造二叉树

目录从前序与中序遍历序列构造二叉树从中序与后序遍历序列构造二叉树从前序与中序遍历序列构造二叉树题目链接给定两个整数数组 preorder 和 inorder ，其中 preorder 是二叉树的先序遍历， inorder 是同一棵树的中序遍历，请构造二叉树并返…

深度学习Redis（2）：持久化

前言在上一篇文章中，介绍Redis的内存模型，从这篇文章开始，将依次介绍Redis高可用相关的知识——持久化、复制(及读写分离)、哨兵、以及集群。本文将先说明上述几种技术分别解决了Redis高可用的什么问题；然后详细介绍Redis的持…

8.3 作业 c高级

1.递归实现，输入一个数，输出这个数的每一位： #include<myhead.h>void print_digit(int num) {if(num<10){printf("%d",num);puts("");}else{print_digit(num/10); //递归打印除最后一位外的数printf("%…

10.物联网操作系统之低功耗管理

一。低功耗管理概念及其应用 1.STM32低功耗设计详解 STM32的电源管理系统主要分为： 备份域调压器供电电路 ADC电源电路 2.低功耗模式 1.运行模式 2.睡眠模式 3.停机模式 4.待机模式 （1）睡眠模式在睡眠模式中，仅关闭了内核时钟&…

【计算机网络】网络层协议 -- ICMP协议

文章目录 1. ICMP协议简介2. ICMP协议格式3. ping命令4. ping命令与端口号没有关系！！！5. traceroute命令 1. ICMP协议简介 ICMP（Internet Control Message Protocol，控制报文协议），用于在IP主机…

22.Netty源码之解码器

highlight: arduino-light 抽象解码类 https://mp.weixin.qq.com/s/526p5f9fgtZu7yYq5j7LiQ 解码器 Netty 常用解码器类型： ByteToMessageDecoder/ReplayingDecoder 将字节流解码为消息对象；MessageToMessageDecoder 将一种消息类型解码为另外一种消息类…

关于时间的基本概念

年的标准——纪元 Era Epoch 在中国古代， 皇帝会订立年号来纪年， 比如贞观就是唐太宗订立的年号， 于是天下使用贞观元年，贞观二年的方式来纪年。皇帝可以因为各种原因更换年号，比如武则天在位21年， 使用了…

【vue】 el-table解决分页不能筛选全部数据的问题

前言最近开发前端项目表格的时候，使用的是el-table，用到了对应的筛选功能，如下图所示但发现实际只能筛选当前页，通过百度查找相关文章，发现原因是把筛选条件定义在列上，解决方法：所以我们把f…