業務用クラスタ(30~60ノード)を購入し、ここにLinuxをインストールしたいと思います。たとえば、クラスタにはPBSなどのキューシステムが必要です。また、並列コンピューティングも可能でなければなりません。私自身はクラスタ構成とクラスタメンテナンスについてはよくわかりませんが、ITスタッフははるかに少ないことを知っているので、これらのシステムを担当する人になりたいと思います。
私の質問は:タスクが実行されていないときにノードをシャットダウンしたり、スリープモードに切り替えてこれらのシステムの電力を節約する簡単な(ソフトウェア)方法はありますか?キュー・マネージャーに接続できますか?
はっきりと説明できず申し訳ありません。プロセッサが2つ以上のシステムに対してシステム管理者になったのは今回が初めてです。
答え1
これは、いくつかのコード開発とあなたがクラスターを構築する人々の考えを必要とするかもしれない難しい質問です。
- ノードはいつ終了する必要がありますか?
- いつ育てるべきですか?
- ノードが起動したら、他のノードと同期していることを確認してください(ソフトウェアアップデートが必要ですか?)
専門家を雇うことに加えて、少しの電力を節約する最善の方法は、Linuxで利用可能ないくつかの省エネユーティリティをチェックして使用を開始することです。 PowerTOPはどこでお金を節約できるかを知るのに最適な場所です。具体的には、hdparmのようなものがディスクの速度を遅くする可能性があります(おそらく)。最後に、CPU速度を設定し、他のプログラムが実行されていないときにCPU速度を下げて、電力を節約するためにcpufreqを確認できます。すべてのCPUがこの機能をサポートしているわけではないため、それほど拡張できない可能性があります。
クラスターは非常に使用量が多いため、通常は24時間年中無休でクラスターを実行します。ほとんどの場合、利用率が100%に達しないことが心配な場合は、オンデマンドクラウドクラスターを検討してください。群れこれにより、必要な期間にわたってすべてのサイズの事前作成されたクラスターを取得できます。
答え2
電源を切るには、シャットダウンと一緒にSSHを使用して電源を切ることができます。ほとんどのマザーボードでサポートされているWake on LAN機能を使用して、必要に応じてノードをオンにすることができます。
もう一つの考慮事項はストレージスペースです。ノードをシャットダウンすると、そのストレージはクラスター内のストレージプールに貢献できなくなります。