背景:
我们平时想做gpu的压力测试,需要一个简单的可以一键执行的工具来测试,主要要来打满gpu的使用率和显存,这里以8卡4090机器为测试机,驱动版本550.54.14,cuda版本12.3。
开源方案:
gpu-burn一个开源的cuda测试工具,一个专门用来给 NVIDIA GPU 施加压力的工具。
测试方法:
(1)物理服务器或者容器里执行GPU压力测试
# 克隆仓库 git clone https://github.com/wilicc/gpu-burn.git # 进入目录 cd gpu-burn # 编译 make # 将 gpu_burn 程序运行在后台,并将输出重定向到 output.log 文件 ./gpu_burn 60 > output.log 2>&1 &
未运行压测前GPU使用概览:
运行之后:
可以看到GPU的利用率和显存基本都被打满
(2)以容器方式进行测试
git clone https://github.com/wilicc/gpu-burn cd gpu-burn docker build -t gpu_burn . docker run --rm --gpus all gpu_burn