私はmpiプログラムを実行しましたmpirun -n 2 ./a.x
。しかし、両方のプロセスが中断されました。そしていつも停滞していて、ほぼ(実際には一度だけ)通過しました。
strace
後続の情報が見つかりましたが、lsof
どちらのプロセスも同じファイルを読み書きするのを待っていますが、まだ準備ができていません。それでは、このファイルが何であるか、なぜ常にアクセスできないのかを調べる方法は何ですか?
もしアイデアがあったり、必要なものがあれば教えてください。ありがとうございます!
//use `strace -p 31352`
epoll_wait(18, [], 100, 0) = 0
epoll_wait(18, [], 100, 0) = 0
epoll_wait(18, [], 100, 0) = 0
<...endless>
//use `strace -p 31351`
epoll_wait(19, [], 100, 0) = 0
epoll_wait(19, [], 100, 0) = 0
epoll_wait(19, [], 100, 0) = 0
<...endless>
//use `lsof -p 31352`
pfci.x 31352 jslo 18u a_inode 0,13 0 11815 [eventpoll]
//use `lsof -p 31351`
pfci.x 31351 jslo 19u a_inode 0,13 0 11815 [eventpoll]