ノードAからノードBに、またはその逆に移動できる共有ストレージを使用してクラスターを構成する必要があります。
ノードAに障害が発生した場合、ノードBはNFSサービスに関連付けられているIPアドレスを取得し、共有ディスクの所有権を取得し、それをマウントしてNFSサーバーを起動する必要があります。
私はSUSE Linux 11.4を使用しています。
これまで、HAクラスタパッケージとNFSを使用しています。 NFS はノード A のドライブを共有していますが、ノード A に障害が発生するとノード B の動作が停止します。
答え1
一度見てみたいかもしれませんドリューバード、RAID-1と同様のディスク冗長性とネットワーク共有を提供します。
Drbdは、TCP / IPを使用してノードのディスクを同期する仮想共有デバイスを提供することで、高可用性クラスタを構築するように設計されたブロックデバイスです。これはRAID 1をエミュレートしますが、異常なハードウェア(共有SCSIバスまたはファイバチャネル)の使用を防ぎます。現在はフェイルオーバー HA クラスタに限定されます。
BeowulfスタイルのHPCクラスタではなく、実際に多くの仮想化サーバーを実行している場合は、Googleのガネティ、LVM、およびDRBDを使用して高可用性仮想マシンを提供し、必要に応じて自動的に他のノードに移行できます。
Ganetiは、XenおよびKVM仮想化技術やその他のフリーソフトウェアに基づいて構築された仮想サーバークラスタ管理ツールです。高可用性仮想マシンインスタンスを管理するための自動化された環境を提供します。
商用ハードウェアを使用して仮想サーバーのクラスタ管理を容易にし、物理障害が発生した後に迅速かつ簡単な回復を提供するように設計されています。冗長ディスクの作成と管理、オペレーティングシステムのインストール(オペレーティングシステム固有のインストールスクリプトとともに)、起動、シャットダウン、物理システム間のインスタンスフェイルオーバーなどのタスクを担当できます。
まだプロダクションでganetiを使ったことはありませんが、OpenStackクラスターに入社する前に数年前に多くの実験を行ってきました(OpenStackインフラストラクチャを使用して、全国の大学の研究者のための仮想HPCクラスターの構築と実行(オーストラリア))。 。 Ganetiは私のテストで非常に良いパフォーマンスを発揮し、それが構築され動作する方法に本当に感心しました。
周りを見回すと、VMディスク用にLVM + DRBDの代わりにZFS iscsiエクスポートを使用できるアドインモジュールが見つかります。