用深度学习模型构建海洋动物图像分类保姆教程

news2026/2/12 22:13:08

在这里插入图片描述

使用深度学习模型构建深度学习海洋动物图像分类模型的完整步骤如下，分为关键阶段和详细操作说明：

1. 数据准备与预处理

1.1 数据集组织

按类别分文件夹存储图像，例如：

dataset/
  train/
      class1/
      class2/
      ...
  val/
      class1/
      class2/
      ...
  test/
      class1/
      class2/
      ...

在这里插入图片描述

1.2 数据增强（训练集）

使用图像增强技术防止过拟合：

from torchvision import transforms

train_transform = transforms.Compose([
    transforms.RandomResizedCrop(224),
    transforms.RandomHorizontalFlip(),
    transforms.ColorJitter(brightness=0.2, contrast=0.2),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

在这里插入图片描述

1.3 数据加载

创建DataLoader：

from torchvision.datasets import ImageFolder

train_dataset = ImageFolder('dataset/train', transform=train_transform)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)

2. 模型构建

2.1 选择ResNet变体

根据任务复杂度选择：
- ResNet18/34：小规模数据集
- ResNet50/101/152：大规模数据集

2.2 加载预训练模型

import torchvision.models as models

model = models.resnet50(pretrained=True)
# 替换全连接层（假设10分类）
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 10)

3. 模型训练配置

3.1 损失函数与优化器

分类任务常用交叉熵损失：

criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=1e-4)

3.2 学习率策略

使用学习率衰减或预热：

scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=5, gamma=0.1)

4. 模型训练

4.1 训练循环

PyTorch训练：

for epoch in range(num_epochs):
    model.train()
    for inputs, labels in train_loader:
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    scheduler.step()

4.2 验证监控

每epoch验证一次：

model.eval()
with torch.no_grad():
    for inputs, labels in val_loader:
        outputs = model(inputs)
        # 计算准确率等指标

在这里插入图片描述

5. 模型评估

5.1 测试集评估

计算分类指标：

from sklearn.metrics import accuracy_score, confusion_matrix

y_true, y_pred = [], []
with torch.no_grad():
    for inputs, labels in test_loader:
        outputs = model(inputs)
        preds = torch.argmax(outputs, dim=1)
        y_true.extend(labels.numpy())
        y_pred.extend(preds.numpy())

print(f"Test Accuracy: {accuracy_score(y_true, y_pred)}")
print(confusion_matrix(y_true, y_pred))