激活函数总结(九):Softmax系列激活函数补充(Softmin、Softmax2d、Logsoftmax)

news2024/11/26 22:27:01

激活函数总结(九):Softmax系列激活函数补充

  • 1 引言
  • 2 激活函数
    • 2.1 Softmin激活函数
    • 2.2 Softmax2d激活函数
    • 2.3 Logsoftmax激活函数
  • 3. 总结

1 引言

在前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLU)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:
在这里插入图片描述

最后,对于文章中没有提及到的激活函数,大家可以通过评论指出,作者会在后续的文章中进行添加补充。

2 激活函数

2.1 Softmin激活函数

Softmin(软化最小值)是一种激活函数,类似于Soft在这里插入代码片max 激活函数。它被用于多类别分类问题,通常作为神经网络的输出层的激活函数。与Softmax激活函数不同,Softmin激活函数将原始分数转化为一个概率分布,但它的逻辑是选择具有最小值的类别获得较高的概率。Softmin 的计算公式如下:
S o f t m i n ( x i ) = e − x i ∑ j = 1 N e − x j Softmin(x_i) = \frac{e^{-x_i}}{\sum_{j=1}^{N} e^{-x_j}} Softmin(xi)=j=1Nexjexi
在 Softmax 中,分数越高的类别获得更高的概率,而在 Softmin 中,分数越低的类别获得更高的概率。

特点:

  • 强调最小值:与Softmax激活函数不同,Softmin激活函数强调具有最小值的类别。在Softmax中,分数较高的类别获得更高的概率,而在Softmin中,分数较低的类别获得更高的概率。

Softmin可以在某些强调低分数类别的问题中有用,一般情况下均用Softmax。

2.2 Softmax2d激活函数

Softmax2D 激活函数是对二维矩阵(或张量)的操作,类似于一维数据中的 Softmax 激活函数,但是应用在矩阵的每一行上。这种操作常用于多类别分类任务,其中每一行代表一个样本的原始分数或 logits,而每个列代表一个类别。Softmax2D 激活函数通过对每一行的原始分数进行 Softmax 运算,将其转化为概率分布

在数学上,给定一个二维矩阵 X X X,其每一行包含原始分数(logits) x i j x_{ij} xij,其中 i i i 是样本索引, j j j 是类别索引,Softmax2D 激活函数可以表示为:
Softmax2D ( x i j ) = e x i j ∑ k = 1 C e x i k \text{Softmax2D}(x_{ij}) = \frac{e^{x_{ij}}}{\sum_{k=1}^{C} e^{x_{ik}}} Softmax2D(xij)=k=1Cexikexij

其中, C C C 是总类别数, k k k 表示对每一行的求和。

Softmax2D 激活函数的应用场景类似于多类别分类问题,但其中每个样本都有一个关联的原始分数矩阵,需要将每行的原始分数转化为概率分布以进行分类。这样说有点抽象,下面给出具体的例子:

  • 图像分类: 在图像分类任务中,每个图像可能属于多个类别,例如图像中可能包含多个物体。通过应用 Softmax2D
    激活函数,可以将每个图像的原始分数转化为关于每个类别的概率分布,从而实现多类别分类。
  • 目标检测: 在目标检测任务中,每个目标可能属于不同的类别,并且每个图像中可能存在多个目标。Softmax2D
    可以用于将每个检测框(bounding box)的原始分数转化为各个类别的概率,帮助判断检测框中所包含的物体。
  • 语音识别: 在语音识别任务中,每个语音片段可能对应多个语音标签,如多个说话者的声音。通过应用 Softmax2D
    激活函数,可以将语音片段的原始分数转化为与每个说话者相关的概率分布。
  • 多标签分类: 一些问题中,一个输入可能对应于多个标签,而不仅仅是单个类别。Softmax2D
    可以用于将输入的原始分数映射到每个标签的概率分布,以实现多标签分类。
  • 文本分类: 在文本分类中,一篇文章可能属于多个主题或类别。通过将文章的原始分数应用 Softmax2D
    激活函数,可以将其转化为关于每个主题的概率分布,实现多类别文本分类。

2.3 Logsoftmax激活函数

LogSoftmax(对数软最大值)是一种常用的激活函数,通常用于多类别分类问题中神经网络的输出层。它将输入的原始分数(logits)转化为对数概率分布,以便更好地处理数值稳定性和训练的问题。LogSoftmax 激活函数的计算方式如下:
LogSoftmax ( x i ) = log ⁡ ( e x i ∑ j = 1 N e x j ) \text{LogSoftmax}(x_i) = \log\left(\frac{e^{x_i}}{\sum_{j=1}^{N} e^{x_j}}\right) LogSoftmax(xi)=log(j=1Nexjexi)
其中, x i x_i xi 是第 i i i 个类别的原始分数, N N N 是总类别数。

优点:

  • 数值稳定性: LogSoftmax能够稳定处理输入的数值范围,避免了指数函数可能导致的数值溢出问题,尤其在输入的原始分数较大的情况下。
  • 计算效率: 由于LogSoftmax在计算中包含对数操作,而对数计算通常比指数计算更为高效,尤其在计算机中。
  • 数学性质: LogSoftmax的输出也是对数概率,有时可以在数学分析和处理中更加方便

缺点:

  • 不直接表示概率: LogSoftmax输出的是对数概率,如果需要获得实际的概率分布,还需要进一步计算指数操作,这可能增加计算复杂性
  • 不适用于所有情况:尽管LogSoftmax在训练中能够稳定计算,但它在一些情况下可能并不是最优选择,特别是在需要实际概率分布或对输出进行进一步处理时。

当前,Logsoftmax函数计算速度快优化效率高,确实取得了一定的优势!!!但是大多数情况下,还是Softmax激活函数占据一定的趋势!!!但是,Logsoftmax算是一个常用的激活函数,如果效果不好的时候可以尝试一下!!!

3. 总结

到此,使用 激活函数总结(九) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/881102.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python中执行调用JS的多种方法汇总

1. 写在前面 做爬虫的人大家都知道,现在国内Web或App普遍防护都做的很好,且越有价值的网站这方面越强 再小再弱的网站现在或多或少都要整点反爬 JS在反爬中应用非常广泛,现在做爬虫工程师基本都要懂JS,因为各种JS加密需要逆向&…

聊聊JDK1.0到JDK20的那些事儿 | 京东云技术团队

1.前言 最近小组在开展读书角活动,我们小组选的是《深入理解JVM虚拟机》,相信这本书对于各位程序猿们都不陌生,我也是之前在学校准备面试期间大致读过一遍,emm时隔多日,对里面的知识也就模糊了。这次开始的时候从前面…

zookeeper未授权访问漏洞处理

方法一:设置指定ip访问 a、登陆zookeeper:./zkCli.sh -server :(ps:需cd到zookeeper的bin目录下执行) b、查看当前权限:getAcl /(ps:默认为’world,anyone) c、添加可访问IP:setAcl / ip:192.16…

HCIP-OpenStack搭建

1、OpenStack概述 OpenStack是一种云操作系统,OpenStack是虚拟机、裸金属和容器的云基础架构。可控制整个数据中心的大型计算、存储和网络资源池,所有资源都通过API或Web界面进行管理。 为什么称OpenStack是云操作系统? 云一般指云计算&…

中间件(二)dubbo负载均衡介绍

一、负载均衡概述 支持轮询、随机、一致性hash和最小活跃数等。 1、轮询 ① sequences:内部的序列计数器 ② 服务器接口方法权重一样:(sequences1)%服务器的数量(决定调用)哪个服务器的服务。 ③ 服务器…

C 内存分配器 mimalloc

有论文 … … https://www.microsoft.com/en-us/research/publication/mimalloc-free-list-sharding-in-action/ 可以减少内存碎片,微软研究院2019 年开源出的内存分配器 代码,适配linux

YOLOv5改进系列(21)——替换主干网络之RepViT(清华 ICCV 2023|最新开源移动端ViT)

【YOLOv5改进系列】前期回顾: YOLOv5改进系列(0)——重要性能指标与训练结果评价及分析 YOLOv5改进系列(1)——添加SE注意力机制 YOLOv5改进系列(2

AI周公解梦-在线AI解梦大师

AI周公解梦-在线AI解梦大师 废话不多啥,直接上效果图 展示链接https://zuowen.toolxq.com/front/ai/jiemeng/jiemeng 梦是人类心灵深处的奇妙现象,它们在科学、文化和心理层面都具有重要的意义和启发。以下是关于梦对个人的意义和启发的一些观点&#x…

Markdown使用笔记

Markdown使用笔记 一、段落与强调 important denotes the impossible thing to do Because your ugly appearance, you cannot have a happy ending. 使用*括起来的为斜体 使用**括起来的是粗体 使用~~括起来的是删除线 在句子后面添加<br>即可换行 二、标题 在…

HD Supply EDI 项目案例

HD Supply Inc.是一家总部位于美国的工业分销公司。该公司成立于1983年&#xff0c;总部位于佐治亚州亚特兰大市。它主要提供广泛的工业产品、设备和解决方案&#xff0c;涵盖建筑、能源、制造、设施维护等多个行业。其产品和服务包括管道、阀门、暖通空调设备、电气设备、工具…

java对象和json类型转换

fastjson参考 参考&#xff1a;http://doc.yaojieyun.com/www.runoob.com/w3cnote/java-json-instro.html 参考&#xff1a; http://doc.yaojieyun.com/www.runoob.com/w3cnote/fastjson-intro.html 序列化&#xff1a;JSON.toJSONString(person)将Java 对象转换为 JSON 字符串…

DNS服务器的搭建之初体验

第一步关闭防火墙 安装bind 启动服务&#xff0c;设置开机自动启动 安装vim 编辑修改/etc/resolv.conf文件&#xff0c;既修改本机的dns解析文件&#xff0c;增加我们自己的dns服务器地址 这里遇到问题了 这里我们需要重启启动网络服务 重启服务还是不行&#xff0c;那么重…

轻薄的ESL电子标签有哪些特性?

在智慧物联逐渐走进千万家的当下&#xff0c;技术变革更加日新月异。ESL电子标签作为科技物联的重要组成部分&#xff0c;是推动千行百业数字化转型的重要技术&#xff0c;促进物联网产业的蓬勃发展。在智慧零售、智慧办公、智慧仓储等领域&#xff0c;ESL电子标签在未来是不可…

使用GUI Guider工具开发嵌入式GUI应用(4)-使用image组件

使用GUI Guider工具开发嵌入式GUI应用&#xff08;4&#xff09;-使用image组件 文章目录 使用GUI Guider工具开发嵌入式GUI应用&#xff08;4&#xff09;-使用image组件引言在GUI Guider中创建image组件绑定图片在Keil工程中部署、编译和下载总结 引言 在没有使用LVGL和GUI …

【一场专属于开发者的盛会!】------NPCon2023 AI模型技术与应用峰会(北京站)

2023年8月12日&#xff0c;由CSDN官方举办的2023年-NPCon2023 AI模型技术与应用峰会(北京站)在北京格兰云天大酒店荣重召开&#xff01; 话不多说&#xff01;上图~~~ 目录 【会议展望】 【大咖宣讲】 【CSDN活动介绍】 【开谈环节&#xff0c;我有句话说】 【现场人气】…

linux 查看文件被那个进程所调用

使用lsof 命令 显示文件被哪个进程所占用 lsof /var/log/messagesCOMMAND&#xff1a;进程的名称PID&#xff1a;进程标识符USER&#xff1a;进程所有者FD&#xff1a;文件描述符&#xff0c;应用程序通过文件描述符识别该文件。如cwd、txt等TYPE&#xff1a;文件类型&#…

uni——初次加载问题处理(赋值后再调用)

案例描述 此案例中 一进页面接收good_id并调用接口&#xff0c;这个流程正常。 这个changeNum也是一进页面就触发了&#xff08;组件购物车加减自带&#xff09;&#xff0c;且触发的顺序在onload赋值id之前&#xff0c;这时候good_id还是为空&#xff0c;所以接口报错。如何处…

AMD fTPM RNG的BUG使得Linus Torvalds不满

导读因为在 Ryzen 系统上对内核造成了困扰&#xff0c;Linus Torvalds 最近在邮件列表中表达了对 AMD fTPM 硬件随机数生成器的不满&#xff0c;并提出了禁用该功能的建议。 因为在 Ryzen 系统上对内核造成了困扰&#xff0c;Linus Torvalds 最近在邮件列表中表达了对 AMD fTPM…

第4章 微服务框架主体搭建

mini商城第4章 微服务框架主体搭建 一、课题 框架搭建 二、回顾 1、整体业务功能分析 2、根据业务需求设计表结构及字段 三、目标 1、版本控制器的搭建使用 2、能独立自主的搭建微服务框架 3、学会考虑一些公共的工具组件 4、网关模块的应用 四、内容 第1章 版本控…