看这个解析讲的也挺好的:令人拍案叫绝的Wasserstein GAN - 知乎
1、背景
GAN的训练是delicate和unstable的。需要定义一个连续的距离,来衡量模型distribution和真实distribution之间的差异。
2、贡献
提出了Wasserstein-GAN,用Earth Mover (EM)距离来衡量分布之间的距离,使得GAN的训练更加稳定:
1)无须平衡D和G的训练
2)无须慎重设计网络结构
3)显著减少了模式坍塌现象
3、常用distance
1)Total Variation(TV)
2)Kullback-Leibler(KL)
3)Jensen-Shannon(JS)divergence
4)Earth-Mover(EM)距离 / Wasserstein-1
文章用了大篇幅的理论证明了概率分布在EM distance下是收敛的,而在其他几个distance下是不收敛的。