安装顺序:Anaconda->cuda->cudnn ->torch(根据cuda安装torch)
1读取anaconda
module load anaconda/2020.11
2读取cuda cudnn
module load cuda/11.1 cudnn/8.2.1_cuda11.x
(查看cuda版本: nvcc -V)
3运行脚本
sbatch train.sh
脚本写法
#!/bin/bash #SBATCH --gpus=1 module load anaconda/2020.11 # 读取anaconda module load cuda/11.1 cudnn/8.2.1_cuda11.x # 读取cuda cudnn source activate 环境名 # 激活环境 export PYTHONUNBUFFERED=1 # 这个是让输出实时更新到输出文件中的,建议加上 python train.py # 运行程序
4查看运行情况
squeue
1 torch安装方法(官网:PyTorch )
官网找之前版本
2 先找cuda版本11.1,再找对应的torch安装指令
2.1可以用conda安装
conda安装torch1.8
conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge
2.2也可以用pip安装
pip安装torch1.8
pip install torch==1.8.0+cu111 torchvision==0.9.0+cu111 torchaudio==0.8.0 -f https://download.pytorch.org/whl/torch_stable.html
3 如果遇到问题retrying
创建一个~/.config/pip/pip.conf 文件,然后里面编辑下面的内容
[global]
timeout=40
index-url=https://pypi.tuna.tsinghua.edu.cn/simple/
extra-index-url=
http://mirrors.aliyun.com/pypi/simple/
http://pypi.douban.com/simple
http://pypi.mirrors.ustc.edu.cn/simple/
[install]
trusted-host=
pypi.tuna.tsinghua.edu.cn
mirrors.aliyun.com
pypi.douban.com
pypi.mirrors.ustc.edu.cn
具体操作如下
cd ~/.config
mkdir pip && cd pip
vim pip.config
然后再安装torch即可
(查看torch版本: python; import torch; print(torch.__version__)