1. watch -n 1 nvidia-smi (最有名,没有之一)
nvidia自带了一个nvidia-smi的命令行工具,会显示GPU使用情况
作为监控 GPU 的工具就显得有点过于简陋了。比如 Process name 栏只显示命令行的程序名,不显示参数,这样输出结果就是一堆 python 和 .../Miniconda3/envs/xxx/python 之类的,完全没有区分性以及进程信息并不包含用户和运行时间等信息。
2. gpustat -i (彩色并简约的显示)
pip install gpustat
显然这种带高亮的显示看起来更舒服,而且可以显示出完整显卡的完整名称,以及正在使用GPU的用户,一个缺点就是不能像nvidia-smi一样显示出各个进程的信息
3. nvtop (完整的信息,需root权限apt安装,不是非常方便)
sudo apt install nvtop
能够非常优雅地全面地监控显卡信息
4. nvitop (完整的信息,可作为Python的库安装,非常方便)
pip ins