实验代码结构介绍

news2025/10/30 20:47:24

提高模型复用性，让模型对应的配置更加清晰，代码书写条理
学习自https://zhuanlan.zhihu.com/p/409662511

Project
├── checkpoints	# 存放模型
├── data 		# 定义各种用于训练测试的数据集 
├── eval.py		# 测试代码
├── loss.py		# 定义的各种loss
├── metrics.py	# 定义约定俗成的评价指标
├── model/src		# 定义实验中的模型
├── options.py	# 定义各种实验的参数，以命令行形式传入
├── README.md	# 介绍report
├── scripts		# 训练、测试脚本（训练、测试的运行命令）
├── train.py	# 训练代码
└── utils		# 训练工具代码

在这里插入图片描述

文章目录

- Checkpoints
- Scripts
- options.py
- train.py

Checkpoints

训练好的模型放在checkpoints里面，通常保存训练过程中的中间结果。主要包括：模型权重文件、模型配置文件、优化器和日志文件等。

Scripts

每次训练或者测试用的脚本命令。

训练脚本：用于执行模型训练的脚本文件，通常包括定义模型、加载数据、设置损失函数和优化器、执行循环等步骤。
评估脚本：用于评估模型性能的脚本文件。加载训练好的模型或者指定的checkpoints文件，对模型在测试集或验证集上的表现进行评估。
预测脚本：……
数据预处理脚本：用于数据预处理和准备的脚本文件。

options.py

定义实验参数。

def parse_common_args(parser):
    parser.add_argument('--model_type', type=str, default='base_model', help='used in model_entry.py')
    parser.add_argument('--data_type', type=str, default='base_dataset', help='used in data_entry.py')
    parser.add_argument('--save_prefix', type=str, default='pref', help='some comment for model or test result dir')
    parser.add_argument('--load_model_path', type=str, default='checkpoints/base_model_pref/0.pth', help='model path for pretrain or test')
    parser.add_argument('--load_not_strict', action='store_true', help='allow to load only common state dicts')
    parser.add_argument('--val_list', type=str, default='/data/dataset1/list/base/val.txt', help='val list in train, test list path in test')
    parser.add_argument('--gpus', nargs='+', type=int)
    return parser
 
def parse_train_args(parser):
    parser = parse_common_args(parser)
    ...
    return parser
 
def parse_test_args(parser):
    parser = parse_common_args(parser)
    ...
    return parser

路径配置：定义数据集、模型、日志文件等路径

DATA_PATH = '/path/to/dataset/'
MODEL_PATH = '/path/to/models/'
LOG_PATH = '/path/to/logs/'

数据处理

IMAGE_SIZE = (256, 256)
DATA_AUGMENTATION = True

加载模型超参

LEARNING_RATE = 0.001
BATCH_SIZE = 32
MAX_EPOCHS = 10

其他配置

train.py

主要任务是把整体写好的内容串起来

导入必要的库和模块

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from model import MyModel  # 假设模型定义在model.py中
from options import *  # 导入配置选项

数据加载和预处理

# 定义数据预处理和增强方式
transform = transforms.Compose([
    transforms.Resize(IMAGE_SIZE),
    transforms.ToTensor(),
    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

# 加载数据集
train_dataset = datasets.ImageFolder(root=DATA_PATH, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)

模型定义和初始化

# 定义模型
model = MyModel()
# 如果有预训练模型，加载参数
# model.load_state_dict(torch.load(PRETRAINED_MODEL_PATH))

定义损失函数和优化器

criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=LEARNING_RATE)

保存模型

torch.save(model.state_dict(), MODEL_SAVE_PATH)

可选的评估和测试

# 评估模型
model.eval()
with torch.no_grad():
    # 执行评估代码

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1906165.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

实验代码结构介绍

文章目录

Checkpoints

Scripts

options.py

train.py

相关文章

CSS 后代选择器正确写法爸爸儿子之间有代沟

如何选择快手矩阵源码：关键因素解析

【QT】多元素控件

WPS提示打印机异常，但是任然可以打印

企业微信hook接口协议,聊天标签中的联系人变动通知

收藏！2024年程序员的实用神器_new relic idea

“除了C盘都不见了“：现象解析、恢复策略与预防之道

得帆荣获中国信通院低代码标准参编专家认证和低代码白皮书参编单位认可

使用dd命令简单测试磁盘I/O

【MySQL05】【 undo 日志】

合合信息大模型“加速器”重磅上线

FPGA问题

PLM设计协同、PLM在产品开发初期的优化作用

破局 AI 2.0 时代：利用 AI 提升自我核心竞争力

微信小程序的餐厅点餐系统-计算机毕业设计源码71834

【小贪】程序员必备：Shell、Git、Vim常用命令

【嵌入式单片机】之RS-232、RS-485、RS-422比较

新衣服不香了！欧洲人越来越喜欢二手时尚品，国外有哪些二手交易平台？

深入分析 Android BroadcastReceiver (十)(完)

系统架构设计师——计算机体系结构