激活函数总结(二十四):激活函数补充(SquaredReLU、ModReLU)

news2024/10/6 8:22:43

激活函数总结(二十四):激活函数补充

  • 1 引言
  • 2 激活函数
    • 2.1 SquaredReLU激活函数
    • 2.2 ModReLU激活函数
  • 3. 总结

1 引言

在前面的文章中已经介绍了介绍了一系列激活函数 (SigmoidTanhReLULeaky ReLUPReLUSwishELUSELUGELUSoftmaxSoftplusMishMaxoutHardSigmoidHardTanhHardswishHardShrinkSoftShrinkTanhShrinkRReLUCELUReLU6GLUSwiGLUGTUBilinearReGLUGEGLUSoftminSoftmax2dLogsoftmaxIdentityLogSigmoidBent IdentityAbsoluteBipolarBipolar SigmoidSinusoidCosineArcsinhArccoshArctanhLeCun TanhTanhExpGaussianGCUASUSQUNCUDSUSSUSReLUBReLUPELUPhishRBFSQ-RBFISRUISRLUSQNLPLUAPLInverse CubicSoft ExponentialParametricLinearPiecewise Linear UnitCLL)。在这篇文章中,会接着上文提到的众多激活函数继续进行介绍,给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图:
在这里插入图片描述

2 激活函数

2.1 SquaredReLU激活函数

论文链接:So, David, Wojciech Mańke, Hanxiao Liu, Zihang Dai, Noam Shazeer, and Quoc V. Le. “Searching for Efficient Transformers for Language Modeling.” Advances in Neural Information Processing Systems 34 (2021): 6010-6022.

SquaredReLU(平方线性整流单元)激活函数是一种非线性激活函数,是对传统 ReLU 激活函数的变体之一。它在输入为负值时执行类似 ReLU 的截断操作,并将正值部分取平方。这种激活函数在一些深度学习模型中用于增加非线性性能防止梯度消失问题。其数学表达式和数学图像分别如下所示:
f ( x ) = { x 2 , if  x ≥ 0 0 , if  x < 0 f(x)=\begin{cases} x^2, & \text{if } x \geq 0 \\ 0, & \text{if } x < 0 \\ \end{cases} f(x)={x2,0,if x0if x<0在这里插入图片描述
优点:

  • 增加非线性性: 平方线性整流单元引入了平方操作,使得输出在正值区间具有更强非线性性能,有助于模型学习更复杂的特征。
  • 避免梯度消失: 类似于 ReLU,平方线性整流单元在正值区间保持梯度不为零,从而有助于防止梯度消失问题。
  • 适用于稀疏输入: 平方线性整流单元对于输入中的稀疏性较强的情况可能表现得更好。

缺点:

  • 不适用于负值: 与 ReLU 类似,平方线性整流单元在负值区间输出恒定为零,这可能导致信息丢失
  • 可能出现梯度爆炸: 在正值区间,平方线性整流单元的梯度是 2x,在 x 较大时,可能导致梯度爆炸问题。
  • 不适用于所有任务: 平方线性整流单元的设计主要针对特定的问题,可能在某些任务中表现不佳。

总体来说,平方线性整流单元是一种尝试增加非线性性能和避免梯度消失问题的激活函数。但是其存在的梯度爆炸导致当前很少使用。。。。

2.2 ModReLU激活函数

论文链接:Arjovsky, Martin, Amar Shah, and Yoshua Bengio. “Unitary evolution recurrent neural networks.” In International conference on machine learning, pp. 1120-1128. PMLR, 2016.

ModReLU(Modified Rectified Linear Unit)是一种激活函数,它是对传统的ReLU(Rectified Linear Unit)的一种改进和扩展。ReLU是一种常用的激活函数,它在输入大于零时输出与输入相等,在输入小于等于零时输出为零。而ModReLU试图通过在输入小于某个阈值时引入一个非线性斜率来增加模型的表达能力。其数学表达式和数学图像分别如下所示:
f ( x ) = { ( ∣ x ∣ + b ) ∗ x ∣ x ∣ , if  ∣ x ∣ + b ≥ 0 0 , if  ∣ x ∣ + b ≤ 0 f(x)=\begin{cases} (|x|+b)* \frac{x}{|x|}, & \text{if } |x|+b \geq 0 \\ 0, & \text{if } |x|+b \leq 0 \\ \end{cases} f(x)={(x+b)xx,0,if x+b0if x+b0在这里插入图片描述

优点:

  • 非线性缩放: 在输入小于零时,激活函数通过乘以 x ∣ x ∣ \frac{x}{|x|} xx 来引入非线性,这使得模型在输入小于零时仍然具有梯度。这有助于解决传统ReLU在这种情况下可能出现的梯度消失问题。
  • 连续可微性: 这个激活函数在大部分区域都是连续可微的,这对于基于梯度的优化算法(如反向传播)是有利的。
  • 对抗异常值: 当输入的绝对值小于 b 时,输出为零。这种行为可以在一定程度上对抗异常值的影响,使模型对异常值更具有鲁棒性。

缺点:

  • 额外的超参数: 这个激活函数引入了额外的超参数 b,而且对于不同的任务和模型,可能需要仔细调整这个参数。这增加了调参的复杂性。
  • 不同iable(不可导)点: 尽管在大部分区域内可导,但在 ∣x∣+b=0 的点上是不可导的,这可能影响一些依赖于导数的优化算法或操作。
  • 计算成本: 这个激活函数的计算相对复杂,包括绝对值运算和分段函数。这可能会增加模型的计算成本,尤其在批量处理时。

总的来说,这个激活函数在一些方面对传统的ReLU进行了改进,但也带来了一些额外的复杂性和计算成本。当前较少使用。。。。

3. 总结

到此,使用 激活函数总结(二十四) 已经介绍完毕了!!! 如果有什么疑问欢迎在评论区提出,对于共性问题可能会后续添加到文章介绍中。如果存在没有提及的激活函数也可以在评论区提出,后续会对其进行添加!!!!

如果觉得这篇文章对你有用,记得点赞、收藏并分享给你的小伙伴们哦😄。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/947666.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【iOS】折叠cell

文章目录 前言一、实现效果二、折叠cell的实现原理三、实现折叠cell的高度变化四、实现选中点击的单元格总结 前言 在暑假的3GShare中用到了折叠cell控件&#xff0c;特此总结博客记录 一、实现效果 二、折叠cell的实现原理 首先我们需要知道ScrollView的是TableView的父类&a…

c++11 标准模板(STL)(std::basic_ostringstream)(四)

定义于头文件 <sstream> template< class CharT, class Traits std::char_traits<CharT> > class basic_ostringstream;(C11 前)template< class CharT, class Traits std::char_traits<CharT>, class Allocator std::allo…

Anaconda Prompt输入jupyter lab无反应

问题&#xff1a;Anaconda Prompt界面输入指令无反应 原因&#xff1a;公司电脑勒索病毒防御工具阻止了进程 解决&#xff1a;找到黑名单恢复进程

Modahub魔搭社区:星环向量数据库Transwarp Hippo团队的详细介绍

目录 团队概况 团队特色 团队实践 未来展望 团队概况 星环向量数据库团队,这是一个在星环内部颇具特色的团队。我们的特色在于,我们不仅专注于数据库领域,而且还涵盖了数据应用以及人工智能领域。这种跨领域的合作让我们能够提供更全面、更深入的服务。 我们团队的一个重…

Android Activity启动流程一:从Intent到Activity创建

关于作者&#xff1a;CSDN内容合伙人、技术专家&#xff0c; 从零开始做日活千万级APP。 专注于分享各领域原创系列文章 &#xff0c;擅长java后端、移动开发、人工智能等&#xff0c;希望大家多多支持。 目录 一、概览二、应用内启动源码流程 (startActivity)2.1 startActivit…

Facebook message tag 使用攻略

Messenger 讯息传不出去&#xff1f;无法发送FB 讯息给非好友&#xff1f; 2020年3月&#xff0c;Facebook 为了防止用户被过多的推广或垃圾讯息困扰而更新使用条款&#xff0c;现在商家要用FB传讯息给所有人&#xff08;包括非好友&#xff09;&#xff0c;应该使用 Facebook …

【管理运筹学】第 6 章 | 运输问题(4,表上作业法 | 闭回路调整法以及特殊情况 | 产销不平衡的运输问题)

文章目录 引言二、表上作业法2.3 改进的方法 —— 闭回路调整法2.4 表上作业法中的特殊情况&#xff08;一&#xff09;无穷多最优解&#xff08;二&#xff09;退化 三、产销不平衡的运输问题3.1 产量大于销量3.2 销量大于产量 写在最后 引言 接下来我们学习表上作业法的最后…

Cocos独立游戏开发框架中的Socket网络模块

引言 本系列是《8年主程手把手打造Cocos独立游戏开发框架》&#xff0c;欢迎大家关注分享收藏订阅。 Socket模块是Cocos游戏开发框架中的重要组成部分之一。通过Socket模块&#xff0c;开发者可以轻松实现游戏中的网络通信功能&#xff0c;使得玩家可以与其他玩家进行实时交互…

Linux 指令心法(一) `ls` 列出目录内容

文章目录 命令的概述和用途命令的用法命令行选项和参数的详细说明命令的示例命令的注意事项或提示 命令的概述和用途 ls 是 “list” 的缩写&#xff0c;它的主要作用是列出目录的内容。 使用 ls 命令可以查看目录中的文件和子目录&#xff0c;以及它们的属性、大小、修改日期…

EasyRecovery15专业mac苹果电脑数据电脑恢复软件

EasyRecovery作为一款专业的电脑数据恢复软件&#xff0c;除了有着优秀的数据恢复能力外&#xff0c;还有许多便捷的操作技巧。今天&#xff0c;我就为大家介绍一下&#xff0c;EasyRecovery下载及恢复界面中的一些使用小技巧。 EasyRecovery 16功能特色 1.EasyRecovery易于使…

第三章 Redis常用命令

第三章 Redis常用命令 学习目标 1 什么是Redis的五大数据类型 redis的存储时 key-value形式的,这里的五大类型指的是 value的五种数据类型 2 相关命令 1 如何对键进行一些操作 2 String类型的value值如何进行操作 3 List 类型的value如何进行操作 4 Set类型的value如何进行…

响应式图片与 CSS image-set

响应式图片 前置知识 art direction problem光栅图像与矢量图像 raster image and vector images img 能否担此重任 sizessrcset实际看一看 picture: img 的好姐妹 source实际看一看 CSS image-set 语法兼容性 其他注意事项 响应式图片 图片在网页中占据了 超过 60% 的浏览带…

第十八章、【Linux】认识与分析登录文件

18.1 什么是登录文件 什么是登录文件&#xff1f;简单地说&#xff0c;就是记录系统活动信息的几个文件&#xff0c;例如&#xff1a;何时何地何人&#xff0c;做了什么工作。换句话说就是&#xff1a;记录系统在什么时候由哪个程序做了什么样的行为时&#xff0c;发生了什么事…

V4L2 摄像头应用编程

目录 V4L2 简介V4L2 摄像头应用程序打开摄像头查询设备的属性/能力/功能设置帧格式、帧率 ALPHA/Mini I.MX6U 开发板配套支持多种不同的摄像头&#xff0c;包括正点原子的ov5640&#xff08;500W 像素&#xff09;、 ov2640&#xff08;200W 像素&#xff09;以及ov7725&#x…

java定时任务cron表达式每周执行一次,执行时间与实际时间不一样的坑!!!

java springboot 利用schedule执行定时任务是很常用的功能&#xff0c;有一个很常用的网站就是在线Cron表达式生成器&#xff0c;但是在这个网站最近遇到一个坑。 我要每周一下午一点执行一次&#xff0c;我把我写的表达式在这个网站验证了&#xff0c;是可以的&#xff0c;况…

VSCode - 一键删除每行前面的行号数字

ctrl f 打开查找 输入正则表达式&#xff0c;并点击使用正则查找&#xff1a; 带点的&#xff1a;^\s*([0-9])\. 不带点&#xff1a;^\s*([0-9]) 综合起来&#xff1a;^\s*([0-9])[\.]* 替换为空格

手机怎么剪视频?分享一些剪辑工具和注意事项

视频剪辑是一种将多个视频片段进行剪切、合并和编辑的技术&#xff0c;它可以帮助我们制作出精彩的视频作品。如今&#xff0c;随着智能手机的普及&#xff0c;我们可以随时随地使用手机进行视频剪辑。本文将为大家介绍一些手机剪辑工具和注意事项&#xff0c;帮助大家更好地进…

全新抖音快手小红书去水印系统网站源码 | 支持几十种平台

全新抖音快手小红书去水印系统网站源码 | 支持几十种平台

Zynq GTX全网最细讲解,aurora 8b/10b编解码,OV5640摄像头视频传输,提供2套工程源码和技术支持

目录 1、前言免责声明 2、我这里已有的 GT 高速接口解决方案3、GTX 全网最细解读GTX 基本结构GTX 发送和接收处理流程GTX 的参考时钟GTX 发送接口GTX 接收接口GTX IP核调用和使用 4、设计思路框架视频源选择OV5640摄像头配置及采集动态彩条视频数据组包GTX aurora 8b/10b数据对…

INSTANCE 2022数据集

论文链接&#xff1a;https://arxiv.org/abs/2301.03281 数据集链接&#xff1a;Home - Grand Challenge github baseline&#xff1a;GitHub - PerceptionComputingLab/INSTANCE2022: Official repository of MICCAI 2022 INSTANCE challenge 数据集得自己填表申请 比赛是…