私が直面している問題は、slurmctldとslurmdが同じslurm.confファイルを使用しているという点で同期しないことです。したがって、次のような結果が得られます。
error: Node node1 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
error: Node node2 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
error: Node node3 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
error: Node node4 appears to have a different slurm.conf than the slurmctld. This could cause issues with communication and functionality. Please review both files and make sure they are the same. If this is expected ignore, and set DebugFlags=NO_CONF_HASH in your slurm.conf.
slurmctld / slurmdを照会する方法(ログエラーの解析以外)はありますか?個別に再起動または再構成する必要があるかどうかを理解するために、実行中の構成についてご存知ですか?私の考えでは、ハッシュを得るだけでもお互いに比較できるようです。
slurm.conf
更新:ファイルを読む時間を知ることも役に立ちます。
答え1
使用することをお勧めします構成なしスラリーセッションで。デーモンが起動しても、slurmログにエラーメッセージが表示されますが、無視してもかまいません。すべてのslurmdシステムは、slurmコントローラから正しい設定を取得します。