今天见识了 归一化的重要性:归一化 不容易爆炸
深度了解了学习率:其实很多操作 最后的结果都是改变了lr
以房价预测为例:一个点一个点更新 比较 矩阵的更新:
为什么小批量梯度下降 优于随机梯度下降 优于批量梯度下降:
梯度下降的三种方式的优缺点 - 知乎
学习plt画图:
import matplotlib.pyplot as plt
回归用 MSE
分类任务 一般用交叉熵
分类问题中为什么用交叉熵而不用MSE KL散度和交叉熵的关系_分类为什么用交叉熵不用mse_taoqick的博客-CSDN博客
np.vstack 拼接第一个维度 和 np.hstack 拼接第二个维度(传入元组)
为什么二分类用sigmoid?
每日一问之二元分类为什么使用 sigmoid 函数_二分类为什么要用sigmoid函数_caoqi95的博客-CSDN博客