数据增强 data augmentation（在PyTorch中，data_transforms通常用于数据集处理，并且经常用于数据增强）

news2025/7/15 11:21:12

数据增强是一种在训练深度学习模型时，通过对输入数据进行变换和修改的方法，以增加训练数据集的大小和多样性，从而提高模型的泛化能力和性能。

PS: PyTorch中，data_transforms具体使用代码可以查看这篇文章：

pytorch中的数据集处理部分data_transforms = { ‘train‘: transforms.Compose([...])...-CSDN博客

以下是关于data_transforms在PyTorch中进行数据增强的几点归纳和详细说明：

数据增强的目的：
- 扩大训练数据集的规模。
- 增加数据集的多样性，帮助模型更好地学习数据的内在模式。
- 降低过拟合风险，提高模型的泛化能力。
PyTorch中的transforms模块：
- PyTorch的torchvision.transforms模块提供了丰富的数据增强和预处理功能。
- 该模块中的函数可以分为两类：针对PIL图像对象的操作函数（如Resize、RandomCrop、RandomHorizontalFlip等）和对Tensor对象的操作函数（如Normalize、ToTensor等）。
常用的数据增强方法：
- 空间位置变换：如平移、旋转、裁剪等。
- 色彩变换：如灰度图、色彩抖动、亮度、饱和度及对比度变换等。
- 形状变换：如仿射变换。
- 上下文场景变换：如遮挡、填充等。
transforms的使用：
- 可以通过transforms.Compose组合多个数据增强步骤。
- 每个变换函数（transform）都接收一个输入（通常是图像或Tensor），并返回一个输出（通常是经过变换的图像或Tensor）。
示例：
- 使用transforms.CenterCrop进行中心裁剪。
- 使用transforms.RandomCrop进行随机裁剪。
- 使用transforms.RandomHorizontalFlip进行随机水平翻转。
- 这些变换可以组合使用，以创建更复杂的数据增强流程。
注意事项：
- 在进行数据增强时，需要确保变换后的数据仍然符合模型的输入要求。
- 不同的任务可能需要不同的数据增强策略。
- 在自定义数据增强方法时，需要注意上下游的输入与输出的格式匹配。