文章目录 七、先介绍几个常用的超参 7.1、过拟合与欠拟合 7.2、学习率调整策略 八、自然语言处理常见的网络结构 8.1、文本卷积神经网络 TextCNN 8.2、循环神经网络 RNN 8.3、Attention (for RNN) 后记 七、先介绍几个常用的超参 7.1、过拟合与欠拟合 奥卡姆剃刀: 两个处于竞争地位的理论能得出同样的结论,那么简单的那个更好。 **防止过拟合的方法(1):**Weight Decay