在E-Shell中执行
1. salloc -p 队列名 -N 1 -n 32 --gres=dcu:4
salloc -p wzhdtest -N 1 -n 32 --gres=dcu:4
2. ssh 节点名
ssh g01r3n07
3. conda deactivate
4. 查看当前所有模块
module ava compiler
从上图中加载某个dtk模块
module load compiler/dtk/21.10
注:乌镇没有rocm,需要加载dtk
5. 执行ifconfig获取当前节点ip地址
ifconfig
6. 开启tensorboard 服务
#进入虚拟环境
source pytorch_env.sh
# 进入events所在目录
cd project/rng-kbqa/GrailQA/runs/
# 开启tensorboard 服务
tensorboard --logdir .
7. 打开VNC界面(创建图形界面)
8. 右击选择Konsole窗口
9. 在命令行输入 firefox
10. 在打开的firefox 浏览器中输入http://10.7.1.48:6006/ 或者 http://g01r3n07:6006/
注:申请的地方不同,对应的使用教程也会有差异,一定要仔细看!!此篇仅适用于乌镇中心!!