mpirunを実行すると、MIT-MAGIC-COOKIE-1は機能しません。

mpirunを実行すると、MIT-MAGIC-COOKIE-1は機能しません。

突然実行するたびにmpirunエラーが発生しますInvalid MIT-MAGIC-COOKIE-1 keympirunPythonコンソールで起動されたコマンドを使用して終了した後、これが開始されたようです。

確認して$XAUTHORITYみると.Xauthorityファイルがありません。端末でも試してみましたが、xhost +local:問題は解決しません。

私はmpirun自分のコンピュータでローカルで実行するのに慣れています。

(ほとんどの場合、mpirunは期待されたタスクを実行しているように見えますが、今は以前に正常に動作していたタスクでもエラーが発生すると思います。)

たとえば、次のコマンドを実行すると警告が表示されます(意味のない最小例)。

/usr/bin/mpirun -n 1 echo "bla"

私は走った

export XAUTHORITY="$XDG_RUNTIME_DIR"/Xauthority

他の人にとっては問題は解決しましたが、問題がさらに悪化するように見えたからです。今は言う

No protocol specified 

mpirunを実行するたびに。

次の手順を実行してhttps://superuser.com/a/941244/728074これは話すことに戻りますInvalid MIT-MAGIC-COOKIE-1 key

私のものも$DISPLAY何も設定されていないようです。":1"または に設定してみまし":0"たが、問題は解決しませんでした。また、以前に値があったかどうかはわかりませんが、一部の投稿ではその値がこのエラーに関連していることを示唆しています。


システム:Ubuntu 20.04 LTS

答え1

libhwlocこの質問は図書館に関連しています。並列プロセスを開始するOpenMPIコンポーネントであるOpenRTEは、このライブラリを使用してノードのハードウェアトポロジを調べます。hwloc_topology_load()呼び出しの間、libhwlocループはプラグインとして設計されたすべてのコンポーネントを通過します。コンポーネントgl(と同じ場所にあります/usr/lib/x86_64-linux-gnu/hwloc/hwloc_gl.o)が別のX11呼び出しを使用しようとすると、XOpenDisplay()これらのメッセージが表示されます。このlibhwlocコンポーネントは、環境変数を設定することで無効にできます。

export HWLOC_COMPONENTS="-gl"

HPCクラスタの場合、このコンポーネントは(一般的に)役に立たないため、これは一般的な解決策のようです。

答え2

私の状況は少し異なりますが、誰かが役に立つと思うこの答えを捨てます。

これは私のために問題を解決しました。https://askubuntu.com/a/1365242/1048079

ただ

sudo apt remove openmpi-bin
sudo apt-get autoremove mpich

それから

sudo apt install mpich

関連情報