概率分布:属于每一个类别的概率总和为0,且都>=0,n组类别需要n-1个参数就能算出结果
数据预处理
loss函数
crossentropyloss()函数 CrossEntropyLoss <==> LogSoftmax + NLLLoss。也就是说使用CrossEntropyLoss最后一层(线性层)是不需要做其他变化的;使用NLLLoss之前,需要对最后一层(线性层)先进行SoftMax处理,再进行log操作。
nll损失和交叉熵(crossentropyloss)损失
均值和标准差(固定的)
全连接神经网络要求是矩阵1x28x28->1x784用view函数
momentum冲量值设成0.5
寻找最大值torch.max,dim=1按行寻找;dim=0按列寻找
每10轮进行一次test
转-->大佬笔记