CutMix是一种极其有效的数据增强方式,尤其是在遥感影像语义分割中。这主要是因为遥感影像标注成本较大,在实际业务中通常都是采用局部标注的方式进行标注,如下图所示仅对标注成本较小的区域进行标注,而对标注成本较大的地方进行忽略。这使得标签数据中各种类别边界较少(例如:类别A和类别B都是孤立标注,对于类别A与B的边界没有语义标注),使模型在训练过程中很难准确的的区分类别A与B的边界。这则需要使用CutMix方法将多个图片及其标签进行混合,人为的在标签图片上生成各种类别的边界标注。
CutMix数据增强的跟多介绍可以参考,https://blog.csdn.net/a486259/article/details/123580142。下面是Mixup、CutMix、CutOut三种数据增强方式的对比效果,可以看到CutMix增强方式对于模型训练效果是最佳的。
1、paddleseg中transforms介绍
transforms是paddleseg中增强数据的配置,首先我们可以在其数据配置文件中看到transforms设置项,具体如下所示。可以看到transforms中设置了Resize、ResizeStepScaling、RandomVerticalFlip、RandomHorizontalFlip、RandomDistort、RandomAffine、Normalize等数据增强选项。