切断されたSlurmコンピューティングノードに再接続するには?

切断されたSlurmコンピューティングノードに再接続するには?

SLURMクラスタでsrunを使用してコンピューティングノードを起動しました。 SSH接続が失われましたが、ノードはまだアクティブであり、GPUリソ​​ースを消費しています。このノードにどのように再接続しますか?

答え1

srunSlurmでノードを起動しないでください。既存のノードのシェルセッションを介して対話型タスクを開始します。ノードがアクティブで、他のジョブがノードのリソースを消費しています。ユーザーがノードから切断した場合、またはtmux同じユーティリティを使用しない限り、ジョブは終了します。screen

関連情報