Slurm 使用

1.使用 SBATCH 提交作業(yè)

在定義好我們的作業(yè)腳本之后, 就可以使用sbatch進(jìn)行提交了。

$ sbatch test.sh
Submitted batch job 70

這樣作業(yè)就被提交到任務(wù)隊(duì)列了, 其中 70 為作業(yè)的 ID .

2.查看作業(yè)狀態(tài)

當(dāng)作業(yè)進(jìn)入隊(duì)列之中, 我們可以通過 squeue 來查詢作業(yè)的狀態(tài), 例如是否處于運(yùn)行狀態(tài)還是處于排隊(duì)狀態(tài).

$ squeue # 查看所有任務(wù)
$ squeue -u $USER # 查看屬于自己的任務(wù) 
$ squeue -j <JOBID> # 查看特定的任務(wù)

我們還可以通過 sstat 來查詢運(yùn)行中任務(wù)的一些信息, 例如消耗的 CPU 時(shí)間, 占用的內(nèi)存等.

$ sstat <JOBID>

作業(yè)完成后, 我們可以通過 sacct 查看作業(yè)使用資源的信息.

$ sacct 
$ sacct -o jobname,alloccpus,reqmem,averss,elapsed -j <JOBID>

3.取消作業(yè)

如果我們想要將作業(yè)從隊(duì)列中移除

$ scancel <JOBID>

我們還可以將我們當(dāng)前用戶下所有作業(yè)移除

$ scancel -u $USER
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容