神经网络复习--神经网络算法模型及BP算法

news2026/2/14 4:45:32

文章目录

神经网络模型的构成
BP神经网络

神经网络模型的构成

三种表示方式：
在这里插入图片描述
神经网络的三要素：

具有突触或连接，用权重表示神经元的连接强度
具有时空整合功能的输入信号累加器
激励函数用于限制神经网络的输出

感知神经网络
在这里插入图片描述

BP神经网络

BP神经网络的学习由信息的正向传播和误差的反向传播两个过程组成，学习规则采用W-H学习规则（最小均方差，梯度下降法），通过反向传播，不断调整网络的权重和阈值，使得网络的误差平方和最小。

BP神经网络模型通用描述：
$z^{(k)} = w^{(k)}x^{(k)} + b^{(k)} \\y^{(k)} = f(z^{(k)})$

$o^{(k)} = f(w^{(k)}o^{(k - 1)} + b^{(k)})$

损失函数的构建 $\frac{1}{2n} \sum\limits_{p=1}^{n}(T_p - Q_p)^2$
预测的输出值减期望的输出值的均方差

梯度下降法：
$W_{(k +1)} = W_{k} - a * \frac{\alpha}{\alpha w_k} * E(w_k, b_k) \\ b_{(k + 1)} = b_k = a * \frac{\alpha}{\alpha b_k} * E(w_k, b_k)$

而：
$\frac{\alpha}{\alpha w_k} * E = \frac{1}{2m} * \sum\limits_{i = 1}^{m} *2 * (w_k x^i + b - y^i) * x^i \\ \frac{\alpha}{\alpha b_k} * E = \frac{1}{2m} * \sum\limits_{i = 1}^{m} *2 * (w_k x^i + b - y^i)$

当采用sigmoid激活函数：
导数： $f'(net^l_j) = f(net^l_j)(1 - f(net^l_j))$
$(\frac{1}{1 + e^{-z}})' = (\frac{1}{1 + e^{-z}}) * (1 - \frac{1}{1 + e^{-z}})$
对于交叉熵损失函数有：
在这里插入图片描述
例题：
给定神经网络如下：

输入值为：x1, x2 = 0.5, 0.3
期望输出值为y1, y2 = 0.23, -0.07
给出正向传播的初始参数为 $w_1$ ~ $w_8$ 为0.2 -0.4 0.5 0.6 0.1 -0.5 -0.3 0.8
采用平方损失函数，梯度下降法求解第一轮更新后的参数。