pdshセッション検出
クラスタでは、LMODを使用して、プリインストールされた特定のモジュール(PyTorchや他の科学パッケージなど)を動的にロードします。最も重要なのは、いくつかのコードを実行したいということです。深い速度ノード全体に分散コードを最適化して実行できるフレームワークです。pdsh私が経験している問題はもちろん、sshセッションがマスターノードにすでにロードしているモジュールをロードしないことです。ただし、これにより一部の必須ライブラリが見つからないため、問題が発生します。 Pythonで。 例: 複数のノードを含む対話型 SLURM ジョブを要求するとします。マ...