激活函数已经成为神经网络中非常重要的一部分,随着各种类型的神经网络模型被人们开发出来,各种激活函数也应运而生,在不同的场景中,取得良好的效果。本文跟据著名的YOLO系列目标检测模型的源码 AlexeyAB Darknet,整理出目前神经网络模型中应用最广泛的20种激活函数,对它们的计算公式、图像特点进行介绍,并使用python代码实现这些激活函数的计算。
1、stair激活函数
如图1所示,stair激活函数的图像就像阶梯一样。它的计算公式如下:
式子中,表示不大于x的整数,
表示对2取余数。
data:image/s3,"s3://crabby-images/b1bcf/b1bcf3dc6962cbe4c22d78dccf6a4dd80ad914ca" alt=""
代码实现如下:
def stair(x):
n=math.floor(x)
if n%2==0:
return math.floor(x/2.0)
else:
return (x-n)+math.floor(x/2.0)
2、hardtan激活函数
如图2所示,hardtan激活函数是通过以直代曲近似实现tan函数,其计算公式如下:
data:image/s3,"s3://crabby-images/19393/19393d9336667683897044859813414f918d2e01" alt=""
代码实现如下:
def hardtan(x):
if x<-1.0:
return -1.0
elif x>1.0:
return 1.0
else:
return x
3、linear激活函数
linear激活函数是线性激活函数,输入x输出也是x,其函数图像如图3所示。
data:image/s3,"s3://crabby-images/76874/76874167db35fbfc887ddccf5d7552efe4b96544" alt=""
代码实现:
def linear(x):
return x
4、logistic激活函数
logistic激活函数又叫sigmoid激活函数,如图4所示,logistic函数可以结果映射到0到1之间。其计算公式如下:
data:image/s3,"s3://crabby-images/8ff10/8ff1016abe2063c3aabb19d0dde738b46ac73b1e" alt=""
代码实现如下:
def logistic(x):
return 1.0/(1.0+math.exp(-x))
5、loggy激活函数
如图5所示,loggy的函数图像跟logistic有点相似,也是把输出映射到0到1之间。其计算公式如下:
data:image/s3,"s3://crabby-images/d4ec4/d4ec4f1c85fd094a1875928bcdaaa513a3ad0713" alt=""
代码实现:
def loggy(x):
return 2.0/(1.0+math.exp(-x))-1.0
6、relu激活函数
relu激活函数为线性整流函数,目的是把小于0的数截取掉,其函数图像如图6所示,其计算公式如下:
data:image/s3,"s3://crabby-images/295ef/295ef4bf35ceba3ddb65484d07de45f101b426cf" alt=""
代码实现如下:
def relu(x):
return x*(x>0)
7、relu6激活函数
relu6和relu一样,也是线性整流函数,不同的是他对大于6的数进行了截断,其函数图像如图7所示,其计算公式如下:
data:image/s3,"s3://crabby-images/3deb0/3deb00c18993a5174e7902d85a19f6488560e391" alt=""
代码实现如下:
def relu6(x):
if x<0:
return 0.0
elif x>6:
return 6.0
else:
return x
8、elu激活函数
elu激活函数的图像如图8所示,其计算公式如下:
data:image/s3,"s3://crabby-images/64037/6403744fdb2ca74b32e51d2bb2732a9693ac0a9b" alt=""
代码实现:
def elu(x):
return (x>=0)*x+(x<0)*(math.exp(x)-1.0)
9、selu激活函数
selu激活函数如图9所示,其计算公式如下:
data:image/s3,"s3://crabby-images/ef026/ef026d10885be97d52afc598d56d20f93d258007" alt=""
代码实现:
def selu(x):
return (x>=0)*1.0507*x+(x<0)*1.0507*1.6732*(math.exp(x)-1.0)
10、relie激活函数
相比于relu激活函数,relie激活函数对于小于零的数据并不会直接截取为0,二是乘以一个小的系数,这个系数为0.01。其函数图像如图10所示,其计算公式如下:
data:image/s3,"s3://crabby-images/75ae5/75ae55e72b9b6883c485f75854de399dcc0cdc86" alt=""
代码实现:
def relie(x):
if x>0:
return x
else:
return 0.01*x
11、ramp激活函数
如图11所示为ramp激活函数,其计算公式如下:
data:image/s3,"s3://crabby-images/a58d8/a58d8ab148d682669c2e63a5255a85c18ec43f3c" alt=""
代码实现:
def ramp(x):
return x*(x>0)+0.1*x
12、leaky激活函数
如图12所示为leaky激活函数的图像,它与relie函数有点像,它的斜率系数要比relie激活函数要大,其计算公式如下:
data:image/s3,"s3://crabby-images/c58ca/c58ca0f2f86a1b31c7fdc0d9322a86666768ec51" alt=""
代码实现如下:
def leaky(x):
if x<0:
return 0.1*x
else:
return x
13、tanh激活函数
tanh激活函数的图像如图13所示,它的取值范围是[-1,1],其计算公式如下:
data:image/s3,"s3://crabby-images/2ae8a/2ae8ac30f3e7fc5c5e68cbfbf2e4016ada636ad0" alt=""
代码实现:
def tanh(x):
return 2.0/(1.0+math.exp(-2.0*x))-1.0
14、gelu激活函数
gelu激活函数的图像如图14所示,其计算公式如下:
式中,tanh为上文提到过的激活函数。
data:image/s3,"s3://crabby-images/1e6cb/1e6cb699ce7569254b15c2add2b9a68d8c58aa34" alt=""
代码实现如下:
def gelu(x):
return 0.5*x*(1.0+math.tanh(0.797885*x+0.035677*math.pow(x,3.0)))
15、softplus激活函数
softplus激活函数的图像如图15所示,其计算公式如下:
data:image/s3,"s3://crabby-images/6b085/6b0855801d1bdb3e8af85a7f328055a62a4a7ce2" alt=""
代码实现:
def softplus(x,threshold):
if x>threshold:
return x
elif x<-threshold:
return math.exp(x)
else:
return math.log(math.exp(x)+1.0)
16、plse激活函数
图16位plse激活函数的图像,其计算公式如下:
data:image/s3,"s3://crabby-images/14bb4/14bb43dfbceeb13191c4ac14fdf7f9ffa08d5537" alt=""
代码实现:
def plse(x):
if x<-4:
return 0.01*(x+4.0)
elif x>4:
return 0.01*(x-4.0)+1.0
else:
return 0.125*x+0.5
17、lhtan激活函数
图17是lhtan激活函数的图像,其计算公式为:
data:image/s3,"s3://crabby-images/e985d/e985de2fd655b307266695edad7b891f6a88bf11" alt=""
代码实现:
def lhtan(x):
if x<0:
return 0.001*x
elif x>1:
return 0.001*(x-1.0)+1.0
else:
return x
18、swish激活函数
图18是swish激活函数的图像,其计算公式如下:
式中,logistic为上文所提到的激活函数,也叫sigmoid激活函数。
data:image/s3,"s3://crabby-images/7edad/7edad8c423bfcd6f5235098a52fca48ec10d6ffa" alt=""
代码实现:
def logistic(x):
return 1.0/(1.0+math.exp(-x))
def swish(x):
return x*logistic(x)
19、mish激活函数
mish激活函数的图像如图19所示,其计算公式如下:
式中tanh,softplus均为上文描述过的激活函数。
data:image/s3,"s3://crabby-images/04613/0461385e1752bec029a2352bff8cad6464e76c44" alt=""
代码实现如下:
def softplus(x,threshold):
if x>threshold:
return x
elif x<-threshold:
return math.exp(x)
else:
return math.log(math.exp(x)+1.0)
def tanh(x):
return 2.0/(1.0+math.exp(-2.0*x))-1.0
def mish(x):
return x*tanh(softplus(x,20.0))
20、hardmish激活函数
hardmish激活函数为mish激活函数的近似形式,它的图像如图20所示,其计算公式如下:
data:image/s3,"s3://crabby-images/38a51/38a512c846a3e6f8811e1ae03c8598894762a771" alt=""
代码实现:
def hardmish(x):
if x>0:
return x
elif x>-2:
return x*x*0.5+x
else:
return 0