1.使用 SBATCH 提交作業(yè)
在定義好我們的作業(yè)腳本之后, 就可以使用sbatch進(jìn)行提交了。
$ sbatch test.sh
Submitted batch job 70
這樣作業(yè)就被提交到任務(wù)隊(duì)列了, 其中 70 為作業(yè)的 ID .
2.查看作業(yè)狀態(tài)
當(dāng)作業(yè)進(jìn)入隊(duì)列之中, 我們可以通過 squeue 來查詢作業(yè)的狀態(tài), 例如是否處于運(yùn)行狀態(tài)還是處于排隊(duì)狀態(tài).
$ squeue # 查看所有任務(wù)
$ squeue -u $USER # 查看屬于自己的任務(wù)
$ squeue -j <JOBID> # 查看特定的任務(wù)
我們還可以通過 sstat 來查詢運(yùn)行中任務(wù)的一些信息, 例如消耗的 CPU 時(shí)間, 占用的內(nèi)存等.
$ sstat <JOBID>
作業(yè)完成后, 我們可以通過 sacct 查看作業(yè)使用資源的信息.
$ sacct
$ sacct -o jobname,alloccpus,reqmem,averss,elapsed -j <JOBID>
3.取消作業(yè)
如果我們想要將作業(yè)從隊(duì)列中移除
$ scancel <JOBID>
我們還可以將我們當(dāng)前用戶下所有作業(yè)移除
$ scancel -u $USER