mpirun -np x taskを介してタスクがx倍に増加すると、PBS出力「mem」と「vmem」が同じままになることを理解する方法

Question

わかりませんが、私が覚えている限り、MPIはノードごとに1つのインスタンスのみを起動し、いくつかの初期化後にプロセスを要求されたレプリカxにフォークします。つまりsim.exe、フォーク後に追加のメモリを割り当てないと、すべてのメモリがレプリカ間で共有され、xその量はプロセスを追跡するためのオペレーティングシステムの小さなオーバーヘッド以外にメモリ使用量に影響を与えません。x

分岐後にいくつかのデータをロードするか、いくつかのメモリを割り当てると、メモリ使用量とx。

スレッドサブプロセスシナリオでは、すべてのxプロセスが独自の初期化を実行するため、MPIシナリオほど多くのメモリは共有されません。（彼らはまだライブラリメモリに似たメモリマッピングI / Oを共有しています。）

この動作を完全に理解するには、それを置き換える小さなMPIプログラムを作成し、いくつかのMBのsim.exe静的データ（たとえば、いくつかの種類の静的配列）と動的に割り当てられたメモリを使用してインスタンスサイズと数量を試すことを提案します。。私の考えでは、静的データは同じノードの並列MPIインスタンス間で共有されますが、動的データ（MPIがインスタンスをフォークした後に割り当てられる）は共有されていないようです。

追加資料： fork（）の書き込み中のコピーは複数のブランチをどのように処理しますか？

Answer 1

わかりませんが、私が覚えている限り、MPIはノードごとに1つのインスタンスのみを起動し、いくつかの初期化後にプロセスを要求されたレプリカxにフォークします。つまりsim.exe、フォーク後に追加のメモリを割り当てないと、すべてのメモリがレプリカ間で共有され、xその量はプロセスを追跡するためのオペレーティングシステムの小さなオーバーヘッド以外にメモリ使用量に影響を与えません。x

分岐後にいくつかのデータをロードするか、いくつかのメモリを割り当てると、メモリ使用量とx。

スレッドサブプロセスシナリオでは、すべてのxプロセスが独自の初期化を実行するため、MPIシナリオほど多くのメモリは共有されません。（彼らはまだライブラリメモリに似たメモリマッピングI / Oを共有しています。）

この動作を完全に理解するには、それを置き換える小さなMPIプログラムを作成し、いくつかのMBのsim.exe静的データ（たとえば、いくつかの種類の静的配列）と動的に割り当てられたメモリを使用してインスタンスサイズと数量を試すことを提案します。。私の考えでは、静的データは同じノードの並列MPIインスタンス間で共有されますが、動的データ（MPIがインスタンスをフォークした後に割り当てられる）は共有されていないようです。

追加資料： fork（）の書き込み中のコピーは複数のブランチをどのように処理しますか？

mpirun -np x taskを介してタスクがx倍に増加すると、PBS出力「mem」と「vmem」が同じままになることを理解する方法

答え1

関連情報