激活函数总结(十三):Tanh系列激活函数补充(LeCun Tanh、TanhExp)

news2024/9/24 23:23:23

激活函数总结(十三):Tanh系列激活函数补充

  • 1 引言
  • 2 激活函数
    • 2.1 LeCun Tanh激活函数
    • 2.2 TanhExp激活函数
  • 3. 总结

1 引言

在前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLUSoftminSoftmax2dLogsoftmaxIdentityLogSigmoidBent IdentityAbsoluteBipolarBipolar SigmoidSinusoidCosineArcsinhArccoshArctanh)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:
在这里插入图片描述

最后,对于文章中没有提及到的激活函数,大家可以通过评论指出,作者会在后续的文章中进行添加补充。

2 激活函数

2.1 LeCun Tanh激活函数

论文链接:LeCun, Yann A., Léon Bottou, Genevieve B. Orr, and Klaus-Robert Müller. “Efficient backprop.” In Neural networks: Tricks of the trade, pp. 9-48. Springer, Berlin, Heidelberg, 2012.

LeCun Tanh 激活函数是双曲正切函数(tanh)的缩放平移版本一种双曲正切函数(tanh)的变种,由深度学习领域的著名科学家Yann LeCun提出。这个变种的目标改善双曲正切函数在某些情况下可能导致的梯度问题。其数学表达式为和数学图像分别如下所示:
f ( x ) = 1.7159 ∗ tanh ⁡ ( 2 3 x ) f(x)=1.7159 * \tanh ( \frac2 3 x) f(x)=1.7159tanh(32x)在这里插入图片描述
这里的 1.7159 1.7159 1.7159 2 3 \frac2 3 32 都是根据实验经验选择的。
优点:

  • 缓解梯度爆炸问题: LeCun Tanh 函数通过对双曲正切函数进行缩放平移,将输出范围限制在 [-1.7159, 1.7159],相比标准双曲正切函数的 [-1, 1] 范围,有助于缓解梯度爆炸问题,使得训练更加稳定
  • 非线性变换: 与标准双曲正切函数相比,LeCun Tanh 函数在中间区域接近线性,同时仍保留了非线性的特性。这可能有助于更好地在网络中引入非线性变换,从而提高网络的表达能力。
  • 适用于中心化数据: LeCun Tanh 函数在输出的非线性部分具有对称性,适用于均值为零中心化数据。

缺点:

  • 梯度消失问题: 尽管 LeCun Tanh函数通过缩放提高了输出范围,但在函数的两端,即当输入远离零时,仍然存在梯度消失的问题。这可能在深层网络中影响梯度传播和训练。

虽然理论上而言:LeCun Tanh激活函数因其特性会被一些特殊问题应用,但是在当前深度学习模型的背景下很难得到广泛应用。。。

2.2 TanhExp激活函数

论文链接:Liu, Xinyu, and Xiaoguang Di. “TanhExp: A smooth activation function with high convergence speed for lightweight neural networks.” IET Computer Vision 15, no. 2 (2021): 136-150.

TanhExp激活函数是一种用于轻量级神经网络的具有高收敛速度的平滑激活函数,在不增加网络规模的情况下,只需要少量的训练周期和不增加额外参数,TanhExp就可以提高轻量级神经网络的容量。TanhExp的数学表达式为和数学图像分别如下所示:
f ( x ) = x t a n h ( e x ) f(x) = xtanh(e^x) f(x)=xtanh(ex)在这里插入图片描述

优点:

  • 线性变换:在正部分,一旦输入大于 1,TanhExp 几乎等于线性变换,输出值和输入值的变化不超过0.01。如上所述,ReLU系列都旨在修改负部分,同时保留正部分的初始形式。这是因为线性变换在训练中是合理的,而以前的非分段平滑激活函数忽略了这个属性。
  • 加速参数:TanhExp显示出接近零陡峭梯度,这可以加速网络中参数的更新。它以最小值 -0.3532 为以下边界,上方为无界。负值可能会使激活的平均值接近于零,从而加速学习过程。正部分近似线性,当输入大于0时变化不超过01.1,梯度略大于其他平滑激活函数。这些属性使 TanhExp 能够比同类产品更快地计算和收敛,同时提供更好的结果。
  • 鲁棒性好:实验结果显示,当网络更深入时,网络会受到过度拟合的影响,而TanhExp 的精度几乎没有下降。此外,即使添加了噪声更改数据集,TanhExp 函数仍保持稳定。实验结果如下图所示:
    在这里插入图片描述

缺点:

  • 具有一定适用范围:当前作者仅在轻量级网络中进行使用,无法验证深度网络中该激活函数的效果。。。

虽然理论上而言:TanhExp激活函数具有较好的效果,但是在当前深度学习模型的背景下还未得到广泛应用。。。。

3. 总结

到此,使用 激活函数总结(十三) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/900228.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

pytorch 42 C#使用onnxruntime部署内置nms的yolov8模型

在进行目标检测部署时,通常需要自行编码实现对模型预测结果的解码及与预测结果的nms操作。所幸现在的各种部署框架对算子的支持更为灵活,可以在模型内实现预测结果的解码,但仍然需要自行编码实现对预测结果的nms操作。其实在onnx opset===11版本以后,其已支持将nms操作嵌入…

2.基于SpringBoot3集成SpringDoc Swagger3

1. 引入依赖 我们在build.gradle中引入依赖 implementation org.springdoc:springdoc-openapi-starter-webmvc-ui:2.1.0 implementation org.springdoc:springdoc-openapi-starter-webmvc-api:2.1.02. 新增SpringDocConfig.java文件 Configuration public class SpringDocCo…

ElasticSearch 数据聚合、自动补全(自定义分词器)、数据同步

文章目录 数据聚合一、聚合的种类二、DSL实现聚合1、Bucket(桶)聚合2、Metrics(度量)聚合 三、RestAPI实现聚合 自动补全一、拼音分词器二、自定义分词器三、自动补全查询四、实现搜索款自动补全(例酒店信息&#xff0…

【图论】最短路的传送问题

一.分层图问题(单源传送) (1)题目 P4568 [JLOI2011] 飞行路线 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) (2)思路 可知背景就是求最短路问题,但难点是可以使一条路距离缩短至0&#xf…

excel逻辑函数篇2

1、IF(logical_test,[value_if_true],[value_if_false]):判断是否满足某个条件,如果满足返回一个值,如果不满足则返回另一个值 if(条件,条件成立返回的值,条件不成立返回的值) 2、IFS(logical_test1,value_if_true1,…):检查是否…

虚拟机问题

虚拟机无法识别USB设备 经排查为VMware USB Arbitration Service 没有启动,但是VMware USB Arbitration Service依赖于VMware Workstation Server启动 VMware USB Arbitration Service(VMUSBArbService)是由 VMware 虚拟化软件提供的一个服务,用于协调和管理主机系统上的…

每日一题——接雨水(单调栈)

接雨水——单调栈 题目链接 单调递增的栈还是单调递减的栈 我们常说的**”积水成洼“**,指的就是说:当两边地势高于中间的地势时,中间的区域就成了洼地,也就可以积水了。 这一题就是如此,我们需要通过一个栈来记录数…

UE4中关于利用粒子系统做轨迹描绘导致系统流畅性下降的问题

UE4中关于利用粒子系统做轨迹描绘导致系统流畅性下降的问题 文章目录 UE4中关于利用粒子系统做轨迹描绘导致系统流畅性下降的问题前言假设及验证1. 过多的粒子发射器影响仿真系统2. 粒子数目太多,降低粒子发射频率,同时增大粒子显示范围3. 把信息输出到屏…

揭秘程序员的鄙视链,你在哪一层?看完我想哭

虽然不同的编程语言都有其优缺点,而且程序员之间的技能和能力更加重要,但是有些程序员可能会因为使用不同的编程语言而产生鄙视链。 以下是一些可能存在的不同编程语言程序员之间的鄙视链: 低级语言程序员鄙视高级语言程序员:使用…

Java教程:如何使用切面环绕方法对所有接口进行添加出入参日志保存功能

背景: ----在很多时候我们做开发时,往往只是提供一个对外接口来进行前后端调试,或第三方系统联调,并使用log进行日志打印,每当出现问题进行排查时,只需要查看服务器日志就可以定位到问题,从而解…

Three.js程序化3D城市建模【OpenStreetMap】

对于我在 Howest 的研究项目,我决定构建一个 3D 版本的 Lucas Bebber 的“交互式讲故事的动画地图路径”项目。 我将使用 OSM 中的矢量轮廓来挤出建筑物的形状并将它们添加到 3js 场景中,随后我将对其进行动画处理 推荐:用 NSDT编辑器 快速搭…

在抽象类中使用@Autowired注入其他bean

概述 今天写代码时,使用模板设计模式,需要在抽象类中使用Autowired注入指定的Bean,然后调用指定方法。 问题 发现Autowired注解有红色下划线 解决 其实没有什么关系,只要实现类继承这个抽象方法,然后加入IOC容器&am…

深入理解SSO原理,项目实践使用一个优秀开源单点登录项目(附源码)

深入理解SSO原理,项目实践使用一个优秀开源单点登录项目(附源码)。 一、简介 单点登录(Single Sign On),简称为 SSO。 它的解释是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。 ❝ 所谓一次登录,处处登录。同样一处退出,处处退出。 ❞ 二…

内核配置知识

Linux内核配置系统的组成 Linux内核源码很多,有上千条配置选项,配置相当复杂。 为了更好选择自己想要的功能配置,linux内核源码组织了一个配置系统; 配置系统包括三部分: Makefile:负责整体的配置编译 …

人工智能在网络安全中的作用:当前的局限性和未来的可能性

人工智能 (AI) 激发了网络安全行业的想象力,有可能彻底改变安全和 IT 团队处理网络危机、漏洞和勒索软件攻击的方式。 然而,对人工智能的能力和局限性的现实理解至关重要,并且存在许多挑战阻碍人工智能对网络安全产生直接的变革性影响。 在…

Python学习 -- 高阶、闭包、回调、偏函数与装饰器探究

Python函数作为编程的核心,涵盖了众多令人兴奋的概念,如高阶函数、闭包、回调、偏函数和装饰器。本篇博客将深入研究这些概念,结合实际案例为你解析函数的精妙,以及如何巧妙地运用它们来构建更强大、灵活的程序。 高阶函数&#…

模型数据处理-数据放入 session和@ModelAttribute 实现 prepare 方法详细讲解

😀前言 本文详细讲解了模型数据处理-数据放入 session和ModelAttribute 实现 prepare 方法详细讲解 🏠个人主页:尘觉主页 🧑个人简介:大家好,我是尘觉,希望我的文章可以帮助到大家&#xff0c…

518. 零钱兑换 II

518. 零钱兑换 II 原题链接:完成情况:解题思路:参考代码: 原题链接: 518. 零钱兑换 II https://leetcode.cn/problems/coin-change-ii/description/ 完成情况: 解题思路: 参考代码&#xff1…

数据在内存中的存储(deeper)

数据在内存中的存储(deeper) 一.数据类型的详细介绍二.整形在内存中的存储三.浮点型在内存中的存储 一.数据类型的详细介绍 类型的意义: 使用这个类型开辟内存空间的大小(大小决定了使用范围)如何看待内存空间的视角…

GBU816-ASEMI新能源专用整流桥GBU816

编辑:ll GBU816-ASEMI新能源专用整流桥GBU816 型号:GBU816 品牌:ASEMI 封装:GBU-4 恢复时间:>50ns 正向电流:8A 反向耐压:1600V 芯片个数:4 引脚数量&#xff1…