シェルスクリプトを使用してプロセスプールを作成できますか?

シェルスクリプトを使用してプロセスプールを作成できますか?

実行する必要があるタスクは数十または数百ですが、CPUを大量に使用し、同時にいくつかのタスクしか実行できないとします。Xジョブをすぐに実行し、完了したら新しいジョブを開始する簡単な方法はありますか?私が考えることができる唯一のものは次のとおりです(医師コード)。

jobs=(...);
MAX_JOBS=4;
cur_jobs=0;
pids=(); # hash/associative array
while (jobs); do
    while (cur_jobs < MAX_JOBS); do
        pop and spawn job and store PID and anything else needed;
        cur_jobs++;
    done
    sleep 5;
    for each PID:
        if no longer active; then
            remove PID;
            cur_jobs--;
done

私はしばしばそうしたように、私の解決策は複雑すぎると感じました。すべての困難なタスクを実行するポートがある可能性がある場合、ターゲットシステムはFreeBSDですが、一般的なソリューションまたは一般的なイディオムがより優れています。

答え1

GNU Parallelがある場合は、次のことができます。

parallel do_it {} --option foo < argumentlist

GNU Parallelは、同じコンピュータまたはSSHを介してアクセスできる複数のコンピュータでタスクを並列に簡単に実行できる汎用の並列ハンドラです。

4つのCPUで32の異なるジョブを実行する場合は、並列化する簡単な方法は、各CPUで8つのジョブを実行することです。

簡単なスケジューリング

代わりに、GNU Parallel はタスクが完了すると新しいプロセスを作成し、CPU をアクティブに保つことで時間を節約します。

GNU並列スケジューリング

インストールする

ディストリビューションにGNU Parallelがパッケージされていない場合は、rootアクセスなしでプライベートインストールを実行できます。これは10秒で完了できます。

(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash

その他のインストールオプションについては、以下を参照してください。http://git.savannah.gnu.org/cgit/parallel.git/tree/README

詳細

より多くの例を見る:http://www.gnu.org/software/parallel/man.html

紹介ビデオを見る:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1

このチュートリアルを見てください。http://www.gnu.org/software/parallel/parallel_tutorial.html

サポートを受けるには、メールリストに参加してください。https://lists.gnu.org/mailman/listinfo/parallel

答え2

できますが、トリッキーで脆弱です。いくつかのオプションがありますが、そのうちの1つですxargs

この興味深い記事は、仕事の制御と信号に依存するときに発生する問題について説明し、実際に読む価値があります。

http://prll.sourceforge.net/shell_parallel.html

この人は、prllすべての入力と出力を同期させる制御プロセスを使用して、任意のシェル機能を並列に実行するための新しいツール(自動検出またはカスタムプールサイズを使用)を作成したようです。

ここで確認してください: https://gitorious.org/prll/pages/Home

答え3

私もあなたと同じ状況ですが、並行して実行する必要があるのはRubyスクリプトを実行するコマンドです。まず、それが完璧ではなくむしろ壊れやすいことを認めなければなりません。

私がルビコードでしたことは、

counting_process = IO.popen "ps -e | grep 'YourCMDPattern' -c"
count_of_processes = counting_process.readlines[0].to_i

次に、whileループで定期的にプロセス数を確認し、その数が保持したい並列実行数を下回ると、RubyのIO.popenを使用して特定の数の新しいプロセスを実行するシェルコマンドをトリガーします。

私が実行する必要があるシェルコマンドは動的であり、Rubyコードで生成された変数を含むため、Rubyスクリプトでこれを行う必要があります。

Rubyが関係しない場合、GNU Parallelはより良い選択肢のようです。

関連情報