北京超算中心使用教程
超算机器使用心得
查看已加载的模块
1 | module list |
查询已安装的模块
1 | module avail | grep anaconda |
加载anaconda模块
1 | module load anaconda/2020.11 |
利用加载的anaconda 创建环境
1 | conda create -n py37 python=3.7 |
加载cuda 模块
1 | module load cuda/9.2 |
进入新建的环境
1 | conda activate py37 |
安装 python 库依赖
1 | conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=9.2 -c pytorch -y |
调试python 脚本
1 | python xxx.py |
编写运行脚本
1 | !/bin/bash |
提交到计算节点
1 | rm -rf slurm-*.out && \ |
查看任务运行情况
1 | parajobs |
查看运行日志
1 | tail -100f slurm-xxx.out |
取消任务
1 | scancel [jobid] |