激活函数总结（四十六）：激活函数补充(Nipuna、StarReLU)

news2025/1/15 23:58:39

激活函数总结（四十六）：激活函数补充

1 引言
2 激活函数
- 2.1 Nipuna激活函数
- 2.2 StarReLU激活函数
3. 总结

1 引言

在前面的文章中已经介绍了介绍了一系列激活函数 (Sigmoid、Tanh、ReLU、Leaky ReLU、PReLU、Swish、ELU、SELU、GELU、Softmax、Softplus、Mish、Maxout、HardSigmoid、HardTanh、Hardswish、HardShrink、SoftShrink、TanhShrink、RReLU、CELU、ReLU6、Threshold、Sinc、GLU、SwiGLU、GTU、Bilinear、ReGLU、GEGLU、Softmin、Softmax2d、Logsoftmax、Identity、LogSigmoid、Bent Identity、Absolute、Bipolar、Bipolar Sigmoid、Sinusoid、Cosine、Arcsinh、Arccosh、Arctanh、LeCun Tanh、TanhExp、Gaussian 、GCU、ASU、SQU、NCU、DSU、SSU、SReLU、BReLU、PELU、Phish、RBF、SQ-RBF、ISRU、ISRLU、SQNL、PLU、APL、Inverse Cubic、Soft Exponential、ParametricLinear、Piecewise Linear Unit、CLL、SquaredReLU、ModReLU、CosReLU、SinReLU、Probit、Smish、Multiquadratic、InvMultiquadratic、PSmish、ESwish、CoLU、ShiftedSoftPlus、Logit、Softsign、ELiSH、Hard ELiSH、Serf、FReLU、QReLU、m-QReLU、FReLU、CReLU、KAF、Siren、ARiA、m-arcsinh、PAU、DELU、PDELU、CosLU、NFN、Hermite、AHAF、SERLU、ShiLU、ReLUN、SSFG、Gumbel Cross Entropy、ScaledSoftSign、NormLinComb、NLSIG、EvoNorms、Smooth Step、LinComb)。在这篇文章中，会接着上文提到的众多激活函数继续进行介绍，给大家带来更多不常见的激活函数的介绍。这里放一张激活函数的机理图：
在这里插入图片描述

2 激活函数

2.1 Nipuna激活函数

论文链接：NIPUNA: A Novel Optimizer Activation Function for Deep Neural Networks

背景：整流线性单元（ReLU）最近已成为最流行和广泛使用的激活函数。ReLU存在一些缺陷，例如，它仅在反向传播期间单位为正而为零时才处于活动状态。这导致神经元死亡（死亡的ReLU）和偏见的转变。但是，与ReLU激活函数不同，Swish激活函数不会保持稳定或向单个方向移动。这项研究提出了一种名为NIPUNA的新激活函数，用于深度神经网络。它结合了饱和和非饱和激活的优点。它显示了自门控整流线性单元，该单元由ReLU和Swish的自门控特性驱动。其数学表达式和数学图像分别如下所示：

$\\ g(x)=\frac{x}{1+e^{-βx}}$
在这里插入图片描述
优点：

分段特性：该函数具有分段的特性，取 $x$ 与 $g (x)$ 的最大值
提升了一定的计算速度：它避免了接近零梯度的缓慢训练时间

缺点：

计算速度较慢：存在指数计算任务，在实际计算中会导致整体计算速度较慢

该激活函数较为简单，且具有一定的优势，但是实际中不建议使用。。。。（未经过实验验证和权威验证。。）

2.2 StarReLU激活函数

论文链接：MetaFormer Baselines for Vision

StarReLU 是 Squared ReLU 的变种，但特别设计用于缓解分布偏移。其数学表达式和数学图像分别如下所示：
$\cdot (\mathrm{ReLU}(x))^2 + b$
在这里插入图片描述
其中，参数 $s$ 和 $b$ 是所有通道共享的参数，可以设置为常量（ $s = 0.8944 ， b = - 0.4472$ ）或可学习的参数。