一、说明
生成对抗网络(GAN)是机器学习中一个相对较新的概念,于2014年首次推出。他们的目标是合成与真实图像无法区分的人工样本,例如图像。GAN 应用程序的一个常见示例是通过从名人人脸数据集中学习来生成人工人脸图像。虽然GAN图像随着时间的推移变得更加逼真,但它们的主要挑战之一是控制其输出,即改变面部图像中的姿势,脸型和头发样式等特定特征。
NVIDIA的一篇新论文《基于风格的生成器架构》(A Style-Based Generator Architecture for GAN)提出了一种应对这一挑战的新模型。StyleGAN逐渐生成人工图像,从非常低的分辨率开始,一直到高分辨率(1024×1024)。通过分别修改每个级别的输入,它可以控制在该级别中表达的视觉特征,从粗略的特征(姿势、脸型)到精细的细节(头发颜色),而不会影响其他级别。
这种技术不仅可以更好地理解生成的输出,还可以产生最先进的结果 - 高分辨率图像看起来比以前生成的图像更真实。