目录
1.超参数(hyperparameters)
参数(Parameters):,
,
,
,
,
...
超参数:能够控制参数W,b的参数,是在开始学习之前设置的参数。
比如:学习率、梯度下降循环的数量#iterations、隐藏层数量#hidden layers、每一个隐藏层的隐藏单元数量#hidden units...
2.划分数据集
通常将数据集划分为训练集(train sets)、验证集(validation set)、测试集(test sets)。
训练集用来执行训练算法,验证集用来选择表现最好的模型,测试集用来最后评估算法的运行情况。
划分比例:
小数据时代(100~1w条数据):60%/20%/20%
大数据时代(百万条级别):验证集和测试集的比例更小,毕竟验证集只是为了测试哪种算法的性能更好一些,测试集是为了评估最后选择的模型的性能。比如,100w条数据,验证集和测试集各1w就够了。数据更大的话,99.5%/0.25%/0.25%或99.5%/0.4%/0.1%的比例也是可以的。
没有测试集也是可以的。
3.