1.由于按照cross_entropy的计算公式,F.cross_entropy(outs,label)这里面的outs和label的应该都是batch_size * one_hot_vec的形状,但是,这个函数呢,第二个label只要是batch_size * scalar即可,那个scalar就是index的位置。。。
2.
3.具体参见这篇文章:
对了,这种分类,似乎需要从0开始的类别
损失函数——F.cross_entropy()中标签形式的探究 - 知乎 (zhihu.com)