目录
训练及测试
Training
在你的 PC上训练
Training 多 GPUs
Test
训练及测试
Training
在你的 PC上训练
你可以使用tools/train.py在一台有CPU和可选GPU的机器上训练一个模型。
下面是该脚本的完整用法:
python tools/train.py ${CONFIG_FILE} [ARGS]
默认情况下,MMAction2更喜欢 GPU 而不是 CPU。如果你想在 CPU 上训练一个模型,请清空 CUDA _ VISIBLE _ DevICES 或设置为 -1,使 GPU 对程序来说是不可见的。
CUDA_VISIBLE_DEVICES=-1 python tools/train.py ${CONFIG_FILE} [ARGS]
Training 多 GPUs
我们提供了一个 shell 脚本来启动一个多 GPU 任务,并使用 torch.distribution。
bash tools/dist_train.sh ${CONFIG} ${GPUS} [PY_ARGS]
指定端口运行
PORT=29666 bash tools/dist_train.sh ${CONFIG} ${GPUS} [PY_ARGS]
如果希望启动多个训练jobs并使用不同的 GPU,可以通过指定不同的端口和可见设备来启动它们。
CUDA_VISIBLE_DEVICES=0,1,2,3 PORT=29500 bash tools/dist_train.sh ${CONFIG} 4 [PY_ARGS]
CUDA_VISIBLE_DEVICES=4,5,6,7 PORT=29501 bash tools/dist_train.sh ${CONFIG} 4 [PY_ARGS]
Test
Test with your PC
您可以使用 tools/test.py 在一台带有 CPU 和 GPU (可选)的机器上测试模型。
以下是剧本的全部用法:
python tools/test.py ${CONFIG_FILE} ${CHECKPOINT_FILE} [ARGS]
指定不适用GPU
CUDA_VISIBLE_DEVICES=-1 python tools/test.py ${CONFIG_FILE} ${CHECKPOINT_FILE} [ARGS]
多GPU
bash tools/dist_test.sh ${CONFIG} ${CHECKPOINT} ${GPUS} [PY_ARGS]
指定端口
PORT=29666 bash tools/dist_test.sh ${CONFIG} ${CHECKPOINT} ${GPUS} [PY_ARGS]
多任务不同GPU
CUDA_VISIBLE_DEVICES=0,1,2,3 PORT=29500 bash tools/dist_test.sh ${CONFIG} ${CHECKPOINT} 4 [PY_ARGS]
CUDA_VISIBLE_DEVICES=4,5,6,7 PORT=29501 bash tools/dist_test.sh ${CONFIG} ${CHECKPOINT} 4 [PY_ARGS]