このbashスクリプトの場合、「sbatch:エラー:バッチジョブの送信失敗:指定されたノード名が無効です」というエラーが発生します。
#!/bin/bash -l
#SBATCH --gpus=1
#SBATCH -p overcap
#SBATCH -A overcap
#SBATCH --signal=USR1@120
#SBATCH --time=10:00
#SBATCH --requeue
#SBATCH --nodelist=brainiac,omgwth,cyborg,sonny,robby,spd-13,qt-1,dave,nestor,crushinator,deebot,xaea-12,baymax,megabot,randotron,chappie,heistotron,roberto,herbie,shakey,chitti,samantha,clippy,kitt,tachikoma
#SBATCH -o err_test.out
srun python src/train.py
リストからどのノードが有効でないかを調べる方法はありますか?
答え1
slurm で構成された有効なノード名のリストを使用またはsinfo
インポートできます。sinfo -N
次に、スクリプトの内容と比較してください。