激活函数总结(三):激活函数补充

news2024/12/29 10:49:36

激活函数总结(三):激活函数补充

  • 1 引言
  • 2 激活函数
    • 2.1 Softmax激活函数
    • 2.2 Softplus激活函数
    • 2.3 Mish激活函数
    • 2.4 Maxout激活函数
  • 3. 总结

1 引言

在前面的文章中已经介绍了过去大家较为常见的激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELU)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:
在这里插入图片描述

最后,对于文章中没有提及到的激活函数,大家可以通过评论指出,作者会在后续的文章中进行添加补充。

2 激活函数

2.1 Softmax激活函数

Softmax函数通常用于多分类问题的输出层。它将每个神经元的原始输出转换为概率分布,确保所有输出的和为1。这使得Softmax函数在进行多分类任务时非常有效。
S o f t m a x ( z i ) = e x p ( z i ) / Σ j e x p ( z j ) Softmax(z_i) = exp{(z_i)}/ Σ_jexp({z_j}) Softmax(zi)=exp(zi)/Σjexp(zj)

其中, z i z_i zi 表示向量 z z z 中的第 i i i 个元素, e x p exp exp 表示自然对数的底数, Σ Σ Σ表示求和符号, j j j 遍历1到N,即对所有N个元素进行求和。
当前对于各种多分类任务都是选用的Softmax激活函数。

2.2 Softplus激活函数

Softplus激活函数是一种常用的平滑激活函数,它被广泛用于深度神经网络中。它是ReLU激活函数的一种平滑版本,解决了ReLU的梯度截断问题。Softplus函数将其输入值映射到一个非负的、平滑的输出范围。Softplus函数的定义和数学图像分别如下所示:
f ( x ) = l n ( 1 + e x ) f(x) = ln(1 + e^x) f(x)=ln(1+ex) 在这里插入图片描述
Softplus函数的特点是:

  • 平滑性:与ReLU不同,Softplus在所有点上都是可导的,没有梯度截断问题。这使得在使用基于梯度的优化算法时更加稳定
  • 输出范围:Softplus的输出范围是(0, +∞),它总是返回一个非负的值。
  • 近似线性:对于较大的输入值,Softplus函数的输出值近似于输入值。这使得它在某些情况下可以起到线性激活函数的作用。

与ReLU相比,Softplus函数在输出值上更平滑,避免了ReLU的神经元死亡问题。然而,由于它的输出范围包含0,因此在一些情况下,Softplus可能并不适合作为隐藏层的激活函数,因为它可能导致神经元输出接近于0,从而影响梯度的传播

当前没有得到普遍使用,Mish激活函数是其升级版本!!!

2.3 Mish激活函数

对激活函数的研究一直没有停止过,ReLU还是统治着深度学习的激活函数,不过,这种情况有可能会被Mish改变。Mish是另一个与ReLU和Swish非常相似的激活函数。正如论文所宣称的那样,Mish可以在不同数据集的许多深度网络中胜过它们。公式如下:
y = x   ∗ t a n h ( l n ( 1 + e x ) ) y=x \ * tanh(ln(1+e^x)) y=x tanh(ln(1+ex))

Mish激活函数是一个平滑的曲线,平滑的激活函数允许更好的信息深入神经网络,从而得到更好的准确性和泛化;在负值的时候并不是完全截断,允许比较小的负梯度流入。实验中,随着层深的增加,ReLU激活函数精度迅速下降,而Mish激活函数在训练稳定性、平均准确率(1%-2.8%)、峰值准确率(1.2% - 3.6%)等方面都有全面的提高。如下图:
在这里插入图片描述
Mish论文: https://arxiv.org/pdf/1908.08681.pdf
当前更多的是用于YOLO目标检测中。

2.4 Maxout激活函数

Maxout是一种非常灵活的激活函数,由Ian J. Goodfellow等人在2013年的论文《Maxout Networks》中提出。Maxout激活函数在某些情况下可以作为其他激活函数的替代品,并且在一些网络架构中表现出色。Maxout激活函数的定义和数学图像分别如下所示:
M a x o u t ( x ) = m a x ( w 1 ∗ x + b 1 , w 2 ∗ x + b 2 , . . . , w n ∗ x + b n ) Maxout(x) = max(w1 * x + b1, w2 * x + b2, ... , wn * x + bn) Maxout(x)=max(w1x+b1,w2x+b2,...,wnx+bn)在这里插入图片描述
其中, w 1 、 w 2 、 b 1 、 b 2 、 w n 、 b n w1、w2、b1、b2、wn、bn w1w2b1b2wnbn是可学习的参数。根据不同的方式,Maxout可以拟合任意的的凸函数。作者从数学的角度上也证明了这个结论,即只需2个 maxout 节点就可以拟合任意的凸函数了(相减),前提是”隐隐含层”节点的个数可以任意多。

优点:

  • 非线性:Maxout引入了非线性的特性,使得神经网络能够学习更复杂的特征和模式。
  • 灵活性:Maxout激活函数是一种非常灵活的激活函数,因为它可以适应不同的数据分布和任务,通过学习最优的参数来适配不同的情况。
  • 增加网络的表达能力:Maxout允许神经网络在每个神经元处学习多个线性函数,从而增加了网络的表达能力,有助于提高模型的性能。

缺点:

  • 参数较多:增加了网络的计算和内存开销。

在处理图像和语音等数据时有所使用,但是使用频率不高!

3. 总结

到此,使用 激活函数总结(三) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/873467.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

42 | 航空公司客户价值分析

民航的竞争除了三大航空公司之间的竞争之外,还将加入新崛起的各类小型航空公司、民营航空公司,甚至国外航空巨头。航空产品生产过剩,产品同质化特征愈加明显,于是航空公司从价格、服务间的竞争逐渐转向对客户的竞争。 目前航空公司已积累了大量的会员档案信息和其乘坐航班…

vscode debug python 带参数

两种方法 第一种: 1,侧边栏选择运行和调试 2,请先创建一个launch.json文件 3,并选择配置文件为python文件 此时你的工作目录下会多一个目录.vscode和该目录下一个launch.json文件,该文件则配置了你的debug配置。在…

JZ40最小的K个数

题目地址:最小的K个数_牛客题霸_牛客网 题目回顾: 解题思路: 注意本题不需要去重。 最简单的方法:排序后数组顺序是由小到大的,也就是说此时数组前k个数就是我们要求的结果。 整体代码: public ArrayLi…

WPF 界面结构化处理

文章目录 概要一、xaml界面结构化处理二、逻辑树与视觉树 概要 WPF 框架是开源的,但是不能跨平台,可以使用MAUI,这个框架可以跨平台,WPF源码可以在github上下载,下载地址:https://gitbub.com/dotnet/wpf。…

【推荐系统】wss课程-排序

排序01-多目标模型 这节课的内容是推荐系统排序的多目标模型。这节课的内容分两部分。 - 第一部分是模型结构。模型把用户特征、物品特征、统计特征、场景特征作为输入,输出对多个指标的预估。 - 第二部分内容是降采样和校准。在实际的推荐系统中,正负…

Mybatis三剑客(一)在springboot中自动生成Mybatis【generator】

1、pom.xml中新增plugin <plugin><groupId>org.mybatis.generator</groupId><artifactId>mybatis-generator-maven-plugin</artifactId><version>1.3.7</version><configuration><overwrite>true</overwrite><…

Dynamic Web TWAIN Crack

Dynamic Web TWAIN Crack 文件编辑 提供 GUI 和非 GUI 图像编辑器 内置基本图像编辑界面&#xff0c;如旋转、裁剪、镜像、翻转、擦除和更改图像大小 支持向图像添加彩色矩形 支持文字注释 提供图像交换功能 支持清除图像的指定区域并用颜色填充清除的区域 内置变焦 提供多图像…

Simulink建模:位运算

本文研究Simulink中常用的按位运算的建模方法。 文章目录 1 引入2 位运算模块2.1 移位模块2.1 按位逻辑运算 3 代码生成4 位运算的应用4.1DBC矩阵解析4.2 bool信号打包 5 总结 1 引入 在计算机的基础课中&#xff0c;学过把一个十进制数转换成二进制数。例如&#xff0c;十进…

每天一道leetcode:712. 两个字符串的最小ASCII删除和(动态规划中等)

今日份题目&#xff1a; 给定两个字符串s1 和 s2&#xff0c;返回 使两个字符串相等所需删除字符的 ASCII 值的最小和 。 示例1 输入: s1 "sea", s2 "eat" 输出: 231 解释: 在 "sea" 中删除 "s" 并将 "s" 的值(115)加入…

【【萌新的STM32学习-8】】

萌新的STM32学习-8 STM32CubeMX 是由 ST 公司开发的图形化代码自动生成工具&#xff0c;能够快速生成初始化代码&#xff0c; 如配置 GPIO&#xff0c;时钟树&#xff0c;中间件等&#xff0c;使用户专注于业务代码的开发。现在 ST 主推 HAL 库代码&#xff0c; 经典的标准外设…

82. 删除排序链表中的重复元素 II

题目链接&#xff1a;力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台 解题思路&#xff1a;设置一个新的哑元节点result&#xff0c;作为头节点&#xff0c;将head中不重复地节点依次链接到哑元节点后面&#xff0c;最后返回result.next 初始值&…

Dynamic CRM开发 - 实体介绍

实体简介 在CRM中,实体(Entity)是数据的基本载体,也是构建业务逻辑网络的基础节点。 实体可以理解为数据库中的一张表(实体中的字段对应数据库表的字段),比如创建一个实体存储客户信息,创建一个实体存储产品信息,产品实体里可以创建一个查找类型的字段(类似表的外键)…

尚医通(医院预约挂号系统)笔记

文章目录 一. 登录系统1. 手机登录1.1 业务流程1.2 代码1.3 JWT 2. 微信登陆2.1 业务流程2.2 代码2.3 OAthu2 3. 用户认证与网关整合 二. 预约挂号1. 业务流程及模块设计 一. 登录系统 1. 手机登录 1.1 业务流程 传入手机号和验证码校验手机号和验证码是否为空校验手机验证码…

阿里云新用户和老用户是如何界定的?产品首购资格是什么?

阿里云新用户条件是什么&#xff1f;针对新用户优惠有哪些&#xff1f;阿里云新用户怎么算&#xff1f;新用户购买云服务器、域名等更优惠&#xff0c;如何获取新用户特价资格&#xff1f;阿里云新用户是指从未购买阿里云产品的用户&#xff08;域名除外&#xff09;&#xff0…

《TCP IP网络编程》第十六章

第 16 章 关于 I/O 流分离的其他内容 16.1 分离 I/O 流 「分离 I/O 流」是一种常用表达。有 I/O 工具可区分二者&#xff0c;无论采用哪种方法&#xff0c;都可以认为是分离了 I/O 流。 2次 I/O 流分离&#xff1a; 第一种是第 10 章的「TCP I/O 过程」分离。通 shutdown(soc…

英语——时态

动词随着所表现出的时间而改变的形态&#xff0c;称为时态&#xff0c;包含以下12种 现在过去将来一般一般现在时一般过去时一般将来时进行现在进行时过去进行式将来进行时完成现在完成时过去完成时将来完成时完成进行现在完成进行时过去完成进行时将来完成进行时 1 现在时 …

考公-判断推理-类比推理

第七节课 例题 例题 例题 例题 目无全牛&#xff1a;很熟练 不以为然&#xff1a;不认为正确 不孚众望&#xff1a;不能让人信服 例题 步人后尘&#xff1a;走别人的老路 例题 见义勇为是助人为乐的一种 例题 例题-全同 例题 并列关系 例题 例题 例题 例题 进士…

C++QT教程3——手册4.11.1自带教程(笔记)——创建一个基于Qt Widget的应用程序

文章目录 创建一个基于Qt Widget的应用程序创建Text Finder项目素材文件 填补缺失的部分设计用户界面完成头文件完成源文件创建资源文件 编译和运行程序 参考文章 创建一个基于Qt Widget的应用程序 本教程介绍如何使用Qt Creator创建一个小型Qt应用程序&#xff0c;名为Text F…

docker — 容器网络

一、概述 Docker容器每次重启后容器ip是会发生变化的。 这也意味着如果容器间使用ip地址来进行通信的话&#xff0c;一旦有容器重启&#xff0c;重启的容器将不再能被访问到。 而Docker 网络就能够解决这个问题。 Docker 网络主要有以下两个作用&#xff1a; 容器间的互联…

阿里云轻量应用服务器_2核4G4M_2核2G3M_性能测评

阿里云轻量应用服务器2核2G3M带宽108元一年&#xff0c;系统盘为50GB高效云盘&#xff1b;轻量服务器2核4G4M带宽&#xff0c;60GB高效云盘297.98元12个月。目前轻量应用服务器只有2核2G和2核4G有活动&#xff0c;阿里云百科分享阿里云轻量应用服务器入口&#xff1a; 目录 阿…