深度学习中,一般的参数更新方式都是梯度下降法,在使用梯度下降法时,涉及到梯度反向传播的过程,那么在反向传播过程中梯度到底是怎么传递的?结合自己最近的一点理解,下面举个例子简单说明! 一、下面首先是一个简单的神经网络图 二、神经网络图,说明如下: 三、下面是梯度反向传播的推导过程: 四、下面,对上面的梯度反向传播过程的详细推导说明: 五、根据链式法则重写 六、总结