目录
1.双层神经网络
计算神经网络层数的时候不包括输入层。
2.逻辑回归的神经网络如何实现
隐藏单元如何计算?
,3x1矩阵
,3x1矩阵,上标[1]表示第一层
向量化(单个训练样本):
隐藏层:,,为4x3矩阵,x为3x1矩阵,为4x1矩阵,为4x1矩阵
输出层:,,为1x4矩阵,为4x1矩阵,为1x1矩阵,为1x1矩阵
向量化(m个训练样本,n个输入特征,隐藏层有k个神经元):
,,,
为kxn矩阵,X为nxm矩阵,为kxm矩阵,为kxm矩阵...
3.激活函数
①sigmoid函数
一般只在二元分类的输出层会用到,因为它值域为[0,1],预测某个物体的概率的取值范围也是[0,1]
②tanh函数
,值域为[-1,1]
③Relu(Rectified linear unit修正线性单元)
sigmoid函数和tanh函数的缺点在于:当z很大或很小时,导数的梯度(函数的斜率)接近0,会拖慢梯度下降算法。通常隐藏层的激活函数都用Relu,Relu的缺点是z<0时,导数为0。
④leak Relu(带泄露的Relu)
比Relu更好,但是不常用。