依存関係のあるさまざまなSLURMジョブを送信するbashパイプラインを作成しています(説明のとおり)。ここまたは下)。ジョブが競合している場合、失敗したジョブを正常に完了するには、前のジョブをすべて再実行する必要があります。失敗したタスクに直接戻る「回復」オプションを作成するにはどうすればよいですか?
job1=$(sbatch ...) # no dependency
job2=$(sbatch --dependency=afterany:$job1 ...) # dependent on job1 success - PD meanwhile
job3=$(sbatch --dependency=afterany:$job2 ...) # dependent on job2 success - PD meanwhile
それ以外の場合は、scontrolまたは同様のものが失敗したタスクを返すのに十分でしょうか?