マルチスレッドでbashスクリプトを実行する方法

マルチスレッドでbashスクリプトを実行する方法

高エネルギー衝突イベントを生成するbashスクリプトがありますが、1つのイベントに約2分かかると、100000個のイベントに対して200000分かかります。これはあまりにも多くの時間です。したがって、ノードに50個のコアがある場合、各コアに1つのイベントがあり、2分で50個のイベントが生成され、時間が節約されます。マルチスレッドや他の方法でこれを行うことができると思います。誰でも私を助けることができますか?

答え1

GNU Parallel はこれらの作業のために設計されています。

seq 100000 | parallel do_experiment

実験でさまざまな種類の値(モデルなど)を使用している場合は、次のすべてのモデルに対してすべての実験を実行できます。

seq 100000 | parallel do_experiment --iteration {1} --model {2} :::: - ::: model1 model2

デフォルトでは、CPUコアごとに1つのプロセスがあり、2つの並列ジョブの出力が混在しないようにします。ラボで使用していないコンピュータが複数ある場合は、それらを計算に含めることもできます。

GNU Parallelは、同じコンピュータまたはSSHを介してアクセスできる複数のコンピュータでタスクを並列に簡単に実行できる汎用の並列ハンドラです。多くの場合for、ループを置き換えることができます。

4つのCPUで32の異なるジョブを実行する場合は、並列化する簡単な方法は、各CPUで8つのジョブを実行することです。

簡単なスケジューリング

代わりに、GNU Parallel はタスクが完了すると新しいプロセスを作成し、CPU をアクティブに保つことで時間を節約します。

GNU並列スケジューリング

インストールする

ディストリビューションにGNU Parallelがパッケージされていない場合は、rootアクセスなしでプライベートインストールを実行できます。これは10秒で完了できます。

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

その他のインストールオプションについては、以下を参照してください。http://git.savannah.gnu.org/cgit/parallel.git/tree/README

詳細

より多くの例を見る:http://www.gnu.org/software/parallel/man.html

紹介ビデオを見る:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

このチュートリアルを見てください。http://www.gnu.org/software/parallel/parallel_tutorial.html

サポートを受けるには、メールリストに参加してください。https://lists.gnu.org/mailman/listinfo/parallel

答え2

バックグラウンドジョブ数制限の50に達するまでバックグラウンドプロセスでジョブを開始し、あるジョブが完了するのを待って別のジョブを開始できます。

LIMIT=50
while collision_event_to_run
do 
    run_new_collision_event&

    while (( $(jobs | wc -l) >= LIMIT ))
    do
                sleep 1
    done

done

または、負荷平均が低い場合は新しいイベントを実行する方が良いです。

LIMIT=49
while collision_event_to_run
do 
    run_new_collision_event&
    sleep 2   # let time for the load average calculation

    while (( $(cut -d " " -f1 < /proc/loadavg) >= LIMIT ))
    do
                sleep 1
    done

done

別のオプションは、このコマンドを使用してジョブをバッチキューbatchにスタックすることです。atd

batch collision _event_1
batch collision _event_2
batch collision _event_3
...

atdサービスは、サーバーの負荷が制限に達するまでジョブを並列に開始します。たとえば、制限は atdサービス起動スクリプトで設定する必要があるパラメータです。atdatd -l 50

編集する:

  • オペレーティングシステムのために少しの空きCPUを確保してくださいatd -l 49

  • これは1分ごとに新しいタスクを開始しますが、サーバーが最後の作業負荷である200万に達するのは遅すぎます。このパラメータを使用すると、待ち時間を短縮できます-batd -b 2 -l 492秒ごとにジョブを開始すると、最初のジョブが完了する前に制限に達する可能性があります。

関連情報