激活函数总结(十):激活函数补充(Identity、LogSigmoid、Bent Identity)

news2025/1/10 23:48:24

激活函数总结(十):激活函数补充

  • 1 引言
  • 2 激活函数
    • 2.1 Identity激活函数
    • 2.2 LogSigmoid激活函数
    • 2.3 Bent Identity激活函数
  • 3. 总结

1 引言

在前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLUSoftminSoftmax2dLogsoftmax)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:
在这里插入图片描述

最后,对于文章中没有提及到的激活函数,大家可以通过评论指出,作者会在后续的文章中进行添加补充。

2 激活函数

2.1 Identity激活函数

Identity 激活函数,也称为线性激活函数,是一种最简单的激活函数之一。它的作用是将输入直接传递到输出,不进行任何变换。换句话说,当使用 Identity 激活函数时,神经网络的输出将与输入完全相同,这意味着任何线性组合或变换都不会发生。其数学表达式和数学图像分别如下所示:
I d e n t i t y ( x ) = x Identity(x)=x Identity(x)=x在这里插入图片描述
优点:

  • 简单、易于理解和计算:线性激活函数是可微分的,这使得基于梯度的优化方法如梯度下降法可以很好地运行。

缺点:

  • 无非线性:没有办法提供非线性,无论堆叠多少层,最后的输出仍然是输入的线性组合,这限制了模型的表达能力。不能处理复杂的非线性问题,对于深度神经网络并不适用。

通常用于连续性数值的回归预测中,在深度网络中很少应用。。。

2.2 LogSigmoid激活函数

LogSigmoid激活函数是在 Sigmoid 激活函数的基础上进行 Log 操作。其数学表达式和数学图像分别如下所示:
f ( x ) = ln ⁡ ( 1 1 + exp ⁡ ( − x ) ) f(x) = \ln\left(\frac{1}{1 + \exp(-x)}\right) f(x)=ln(1+exp(x)1)在这里插入图片描述

优点:

  • 平滑性:与 Sigmoid 相似,LogSigmoid 激活函数也是平滑的,但在输入远离零时,其输出变化更为平缓,有助于梯度的稳定传播。
  • 控制输出范围:LogSigmoid 的输出范围在负无穷到 0 之间,可以将输入数据映射到一个更小的范围。

缺点:

  • 梯度消失问题:虽然在输入远离零时梯度变化较为平缓,但仍然可能会遇到梯度消失的问题,特别是在深层网络中。

考虑到Sigmoid当前的使用环境,LogSigmoid在当前也很少使用。。。

2.3 Bent Identity激活函数

激活函数 Bent Identity 是介于 IdentityReLU 之间的一种折衷选择。它允许非线性行为,尽管其非零导数有效提升了学习并克服了与 ReLU 相关的静默神经元的问题。由于其导数可在 1 的任意一侧返回值,因此它可能容易受到梯度爆炸消失的影响。其数学表达式和数学图像分别如下所示:
f ( x ) = x 2 + 1 − 1 2 + x f(x) = \frac{\sqrt{x^2 + 1} - 1}{2} + x f(x)=2x2+1 1+x
在这里插入图片描述

优点:

  • 平滑性: Bent Identity激活函数是一个平滑的函数,这意味着它在整个输入范围内都具有连续的导数。这有助于稳定的梯度传播,可以在训练神经网络时避免梯度爆炸或梯度消失问题。
  • 适度非线性: Bent Identity激活函数在输入为负时呈现线性增长,而在输入为正时呈现较缓的非线性增长。这可以使其在一些任务中具有适度的非线性表达能力,从而更好地捕捉输入数据中的特征。
  • 输出范围: Bent Identity激活函数的输出范围是负无穷到正无穷,这在某些情况下可能有用。与一些其他激活函数(如Sigmoid或Tanh)相比,它不会限制输出的范围,可能更适合处理具有广泛范围的数据。

缺点:

  • 相对复杂: Bent Identity激活函数的表达式比较复杂,可能会在实现和计算上引入一些额外的复杂性。这可能会影响训练和推理的效率。
  • 较少的使用: Bent Identity激活函数相对较少被广泛使用,因此关于其性能和适用性的实证研究可能相对有限。这可能导致难以确定在特定问题上是否比其他更常见的激活函数表现更好。
  • 调参复杂性: 选择激活函数涉及到一些超参数的调优。由于Bent Identity不像一些更常见的激活函数那样广泛使用,可能需要更多的实验来找到最佳的超参数设置。

总体而言:Identity和ReLU的结合并没有带来很好的效果,整体使用情况还不如ReLU激活函数。。。

3. 总结

到此,使用 激活函数总结(十) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/886543.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【校招VIP】测试方案之等价类

考点介绍: 在校招中,等价类也是重要的考查点。等价类划分是一种典型的黑盒测试设计方法,使用该方法主要对测试子项进行测试规格分析,得到用例,而不用对系统内部处理进行深入了解,它也是目前测试设计过程中使…

Python Opencv实践 - 图像金字塔

import cv2 as cv import numpy as np import matplotlib.pyplot as pltimg cv.imread("../SampleImages/pomeranian.png", cv.IMREAD_COLOR) print(img.shape)#图像上采样 #cv.pyrUp(src, dstNone, dstsizeNone, borderTypeNone) #参考资料:https://blo…

大势智慧软硬件技术答疑第九期

1.在使用模方修模大面积水面时,原模型没有瓦片的区域修补不了,软件也没有新增瓦片,怎么解决? 答:规则分块的数据,然后用新版本模方处理,设置好对应的空间框架。 2.重建大师密集匹配-纠正影像失败…

生产订单负数WIP处理方法(未发生费用准备金)

这个月财务在月结的时候反馈生产成本与制造费用不一致相差20多万, 先查看3611 制造相关的成本中心看上去过量与吸收不足均是0,都是ok的。 再查看一下啊 S_ALR_87013127 工单的投入产出平衡检查:订单结算后,实际成本借方实际成本贷…

[GitOps]微服务版本控制:使用ArgoCD 部署Grafana Loki

背景介绍 请回答:你们是如何保证线上部署的服务,从服务版本到参数配置,都是和测试通过的版本是一致的呢? 本文将介绍GitOps的基本原理以及ArgoCD的使用:ArgoCD部署Grafana Loki 到k8s集群。 本文项目地址&#xff1…

File Inclusion

File Inclusion 服务器执行PHP文件时,可以通过文件包含函数加载另一个文件中的PHP代码,并且当PHP来执行,这会为开发者节省大量的时间。这意味着您可以创建供所有网页引用的标准页眉或菜单文件。当页眉需要更新时,您只更新一个包含…

Curson 编辑器

Curson 汉化与vacode一样 Curson 自带chat功能 1、快捷键ctrlk(代码中编辑) 2、快捷键ctrll 右侧打开窗口

最新MPAS跨尺度、可变分辨率模式实践技术应用及典型案例分析

目录 一、MPAS 模式基本信息 二、MPAS 代码获取及结构 三、MPAS 移植、编译及运行实践 四、MPAS 全球均匀网格的运行 五、MPAS 全球非均匀网格的运行 六、MPAS 区域网格的运行 七、MPAS 运行中的配置 八、MPAS结果处理、分析及可视化 九、了解 MPAS代码的结构、主要模…

攻防世界-web-fileclude

1. 题目描述 打开链接,可以看到如下代码: 代码意思很简单,让我们传递两个参数,一个file1,一个file2,如果file2的内容为hello ctf,那么就可以在代码中include file1 2. 思路分析 这道题显然是…

Android Stodio编译JNI项目,Cmake出错:Detecting C compiler ABI info - failed

在使用Android Stodio编译JNI项目时出现Cmake错误,报错如下: Execution failed for task :app:configureCMakeDebug[arm64-v8a]. > [CXX1429] error when building with cmake using C:\Users\Dell\AndroidStudioProjects\MyApplication2\app\src\ma…

BDA初级分析——认识SQL,认识基础语法

一、认识SQL SQL作为实用技能,热度高、应用广泛 在对数据分析人员的调查中SQL长期作为热度排名第-一的编程语言超过Python和R SQL:易学易用,高效强大的语言 SQL:Structured Query Language 结构化查询语言 SQL:易学…

svn 过滤文件

1. 右键点击,依次选择 TortoiseSVN -> Settings 2. 添加需要过滤的后缀/关键词【 *.iml *.idea *.jar *.class 】

周期 角频率 频率 振幅 初相角

周期 角频率 频率 振幅 初相角 当我们谈论傅里叶级数或波形分析时,以下术语经常出现: 周期 T T T: 函数在其图形上重复的时间或空间的长度。周期的倒数是频率。 频率 f f f: 周期的倒数,即一秒内波形重复的次数。单位通常为赫兹&#xff…

Unity引擎使用InteriorCubeMap采样制作假室内效果

Unity引擎制作假室内效果 大家好,我是阿赵。   这次来介绍一种使用CubeMap做假室内效果的方式。这种技术名叫InteriorCubeMap,是UE引擎自带的节点效果。我这里是在Unity引擎里面的实现。 一、效果展示 这个假室内效果,要动态看才能看出效…

Centos上df命令执行无结果卡住没反应记录

记录linux服务器上df命令卡住,解决办法: 报错如下,执行df命令一直卡着,不返回结果,没反应: 想着是之前挂载的其他盘符,由于迁移导致的磁盘卡住,执行如下命令: strace d…

c++实现哈希桶

闭散列的回顾 在前面的学习中我们知道了闭散列的运算规则,当两个数据计算得到的位置发生冲突时,它会自动的往后寻找没有发生冲突的位置,比如说当前数据的内容如下: 当插入的数据为33时计算的位置为3,可是位置3已经被占…

经典人体模型SMPL介绍(一)

SMPL是马普所提出的经典人体模型,目前已成为姿态估计、人体重建等领域必不可少的基础先验。SMPL基于蒙皮和BlendShape实现,从数千个三维人体扫描结果得来,后通过PCA统计学习得来。 论文:SMPL: A Skinned Multi-Person Linear Mode…

教学资源VR设备中控系统为教师带来了许多便利

为提升VR实训室教学的质量,虚拟课堂VR中控系统作为一种新型的教学辅助工具,为学生和教师带来了许多独特的优势。 虚拟课堂VR中控系统作为一种新型的教育工具,为教师带来了许多便利,提高了教学质量和效果。教师可以在VR教室里的触摸…

常识判断

头像 carrin~👻 产品经理 225/753 75/302.5 30/152 15/101.5 等差数列,所以最后一个是10/101 收起 60 回复 发布于 2020-02-18 16:33