私は小規模なクラスタでタスクを実行しています。を通じて提出しましたqsub
。私の研究室の同僚は私よりも緊急にリソースを必要とするので、可能であれば私の努力を中断または中止する必要があります。
ジョブを一時停止してCPU、RAMなどを確保する方法はありますか?
私は(root権限を持たない)一般ユーザーです。
答え1
ジョブがまだ開始されていない場合は、一時停止できます。qhold
。使用qrls
再起動。
qhold <job ID>
qrls <job ID>
すでに実行している場合は、次のものを使用できます。qsig
タスクの一時停止と再開(追加の権限が必要な場合があります。この場合は管理者に連絡してください):
qsig -s suspend <job ID>
qsig -s resume <job ID>
職場に戻ると、強制的に実行する必要があります。qrun
qrun <job ID>
PBSPro 13.0.2.153173を使用してSLES 11 SP4システムでテストされていますが、他のPOSIX準拠のバッチジョブ送信システムで使用する必要があると思います。