PyTorch-----torch.nn.Softmax()函数

news2025/7/13 1:29:48

Softmax原理

Softmax 函数是一种常用的激活函数，通常用于多分类问题中。它将一个含有多个实数值的向量（通常称为 logits）转换成一个概率分布，使得每个元素都在 (0, 1) 区间内，并且所有元素的和为 1。

假设我们有一个实数值向量 z，其中 z = [z1, z2, ..., zn]，其中 zi 是向量 z 的第 i 个元素。Softmax 函数将向量 z 转换为一个概率分布向量 p = [p1, p2, ..., pn]，其中 pi 表示类别 i 的概率。

Softmax 函数的定义如下：

其中，zi 是 logits 向量 z 的第 i 个元素，n 是 logits 向量 z 的长度（即类别的数量），e 是自然对数的底（约等于 2.71828）。

Softmax 函数的计算过程如下：

对 logits 向量 z 中的每个元素进行指数化（即计算 e 的 z 次方）。
计算所有指数化的值的和（即分母部分）。
将每个指数化的值除以总和，得到归一化后的概率值。

Softmax 函数的一个关键特性是它的输出是一个概率分布，即所有输出值的和为 1，因此可以用于表示多个互斥的类别的概率。

在神经网络中，Softmax 函数通常作为输出层的激活函数使用，用于将网络的最后一层输出转换为概率分布，以便进行多分类任务的训练和预测。

softmax应用

torch.nn.Softmax 是 PyTorch 中的一个类，用于计算 softmax 函数。softmax 函数常用于多分类问题中，将一个具有任意实数值的向量转换为一个概率分布，使得每个元素都在 (0, 1) 之间，并且所有元素的和为 1。

在 PyTorch 中，torch.nn.Softmax 可以作为一个层（Layer）添加到神经网络模型中，也可以作为一个函数使用。它的语法如下：

torch.nn.Softmax(dim=None)

dim（可选）：指定 softmax 函数计算的维度。默认值为 -1，表示最后一个维度。

torch.nn.Softmax 类初始化后可以调用其 forward 方法来计算 softmax 函数。另外，你也可以直接使用 torch.softmax() 函数来计算 softmax。

下面是使用 torch.nn.Softmax 类的一个示例：

import torch
import torch.nn as nn

# 创建一个 3x4 的输入张量
input_tensor = torch.randn(3, 4)

# 创建 Softmax 层
softmax_layer = nn.Softmax(dim=1)

# 对输入张量应用 Softmax 层
output_tensor = softmax_layer(input_tensor)

print(output_tensor)

这里，我们首先创建了一个 3x4 的输入张量 input_tensor，然后创建了一个 softmax 层，并将其应用于输入张量。最终得到的 output_tensor 是一个概率分布，其中每一行的元素都在 (0, 1) 之间，并且每一行的元素之和为 1。

你也可以使用 torch.softmax() 函数直接计算 softmax，示例如下：

output_tensor = torch.softmax(input_tensor, dim=1)

这与使用 softmax 层的结果是相同的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1549916.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

PyTorch-----torch.nn.Softmax()函数

相关文章

YOLOv5实战记录02 模型检测

iOS17 隐私协议适配详解

SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

阿里云ubuntu服务器搭建可视化界面

STM32使用HAL库SPI驱动W25Q16 使用FATFS文件系统+USB虚拟U盘

【深度学习】语义分割（FCN网络/DeepLabV3网络）学习记录

强化安全防护：升级桌面网管软件提升医院信息系统安全

喜报｜珈和科技入选2023“武汉未来之星TOP100”

Unity角色多人同步

PyTorch----torch.nn.init.kaiming_normal_

锂离子电池SOC预测 | python代码实现基于Basisformer时间序列锂离子电池SOC预测研究

unity学习（73）——服务器异常--无法处理 123类型的数据包

大文件压缩多个小文件

矢量(向量)数据库

Kafka详细教程（一）

ssm小区车库停车系统开发mysql数据库web结构java编程计算机网页源码eclipse项目

开源博客项目Blog .NET Core源码学习（12：App.Application项目结构分析）

k8s入门到实战（七）—— 回顾:使用yaml文件配置pv、pvc、configmap部署mysql服务

Day22 LeedCode:235.二叉搜索树的最近公共祖先 701.二叉搜索树的插入操作 450.删除二叉搜索树的结点

基于Arduino IDE 野火ESP8266模块一键配网的开发