high-availability

Hot Standby アーキテクチャのためのデータ複製方法
high-availability

Hot Standby アーキテクチャのためのデータ複製方法

私はストレージとファイルシステムの世界に比較的慣れていません(正しい言語を使用していない場合はご了承ください)、現在の常時スタンバイ構成(ファイル使用可能な設定など)を実装する方法を研究しています。 2つの異なるマシンを同時に使用して、フェイルオーバー時にスタンバイホストが引き継がれるようにします(この質問はデータ複製に関するものです)。いいえフェイルオーバーオーケストレーション)。しかし、さまざまなアプローチの長所と短所については少し混乱しています。 これまで私が行った研究によると、2つの異なるアプローチを取ることができるようです。 DRBD +一部の共...

Admin

マルチスイッチトポロジでは、Balance-albが無効な高可用性モードと見なされるのはなぜですか?
high-availability

マルチスイッチトポロジでは、Balance-albが無効な高可用性モードと見なされるのはなぜですか?

内部にLinux イーサネットボンディングドライバ HOWTOセクション11.2では、スイッチ間リンク(ISL)を持つ2つのスイッチを含む設定の素晴らしいASCIIアートダイアグラムを含む、高可用性のためのマルチスイッチトポロジについて説明します。 | | |port3 port3| +-----+----+ +-----+--...

Admin

3ノードのPacemaker設定では、同じ名前のノード1つが2回表示され、1つはオンライン、1つはオフラインです。
high-availability

3ノードのPacemaker設定では、同じ名前のノード1つが2回表示され、1つはオンライン、1つはオフラインです。

だから私はmachine001、machine002、machine003を持っています。 machine001には2つのリソースがあり、machine002には1つのリソースがあります。通常、 machine002 がスタンバイモードに移行しない限り、同じホストにはありません。 最近、machine002が2回現れるのを見ました。オンライン1回、オフライン1回。 検査の結果、sudo crm_mon -RノードIDが異なることがわかりました。 ノードIDを削除しようとしましたが拒否されました。ノード名を削除しようとしましたが、その名前のアクティブなノードが...

Admin

最高司令部
high-availability

最高司令部

RHEL 7で実行されているRedhat Pacemakerを使用して2ノードクラスタを実行しています。最後の木曜日(2022年3月2日)カーネルを最新バージョンに更新しました。最初のノードは金曜日の午後3時49分に(未知の理由で)再起動後に再結合されましたが、その時点でリソースはNode2で実行されていました。 今日のCPU使用率が高く、topコマンドが表示されることを確認しました。 %Cpu(s): 2.9 us, 89.8 sy, 0.2 ni, 7.1 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st どのプロセス...

Admin

ローカルシェルスクリプトからエラーが返された場合は、Pacemakerノードを停止しますか?
high-availability

ローカルシェルスクリプトからエラーが返された場合は、Pacemakerノードを停止しますか?

ローカルテストスクリプトが失敗した場合、Facemakerはノードを停止し、ローカルテストスクリプトが再びtrueを返すとノードを起動させることができますか? これは非常に簡単な質問のように見えますが、Pacemakerでこれを行う方法を見つけることができないので、すべてのノードで次のシェルスクリプトを実行します。 while true; do pcs status 2>/dev/null >/dev/null && node_running=true /is_node_healthy.sh && n...

Admin

Fence_virtualbox 再起動に失敗しました
high-availability

Fence_virtualbox 再起動に失敗しました

Fence_virtualboxを使用して心拍数を分離する方法を学んでいます。[ClusterLabs] VirtualBox用Fenceエージェント、しかし、動作させることはできません。実行しようとするとstonith_admin –-reboot <node id>失敗します。 現在私の設定は次のとおりです。 Node ID: VM name: orcllinux1 OL7 orcllinux2 OL7_2 以下を使って設定しました。 pcs stonith create fence_vbox fence_...

Admin

最終注意事項:
high-availability

最終注意事項:

利用可能な帯域幅も使用する必要があるLinuxで高可用性(HA)結合を設定しようとしているときにオプションが何であるかを知りたいです。 ソリューションは、次の単純化されたシナリオで高可用性と最適なスループット(すべてのリンクが稼働しているとき)を保証する必要があります。 たとえば、ホストH12つのインターフェースがあります1そして2また、次のように表現されます。H1.1そしてH1.2。active-backupリンク監視などの標準設定から始めると、miimon次の問題があります。 一度に1つのインターフェイスのみを使用 もしS1.3すべて失敗H1.1そし...

Admin

Pacemaker ApacheリソースがHTTPSに変更された後、httpdステータスページにアクセスできません。
high-availability

Pacemaker ApacheリソースがHTTPSに変更された後、httpdステータスページにアクセスできません。

Apacheをhttpからhttpsに変更すると、Pacemakerでこのエラーが発生します。今私のocf :: heartbeat:apacheリソースはステータスページを見つけることができません。 3つのサーバーのそれぞれに対してSSL証明書を生成しました。 httpで実行すると、すべてがうまく機能しますが(自己署名)SSL証明書ペースメーカーを追加するとすぐApache (ocf::heartbeat:apache): Stopped そしてエラーが表示されます Failed Actions: * Apache_start_0 on se...

Admin

ディスクに書き込むプロセスがある場合でも、/var/logディレクトリにディスクをマウントするにはどうすればよいですか?
high-availability

ディスクに書き込むプロセスがある場合でも、/var/logディレクトリにディスクをマウントするにはどうすればよいですか?

/var/logにディスクをマウントしたいです。問題は、openvpnやsyslogなどの一部のプロセス/サービスがディスクに書き込まれていることです。コンピュータを再起動したり、サービスを停止せずにファイルシステムをマウントする方法はありますか? 非常にありがとう ...

Admin

Keepalivedは動作しませんか?
high-availability

Keepalivedは動作しませんか?

CentOS 8でkeepalivedを使用してHAProxy用のHAを作成しようとしていますが、これが私が持っているものです: Virtual IP: 10.10.10.14 HAProxy Server 1: 10.10.10.15 HAProxy Server 2: 10.10.10.18 そして私の接続を維持する設定所有者: vrrp_script chk_haproxy { script "killall -0 haproxy" # check the haproxy process interval 2 # every 2 second...

Admin

単一のカウンターを維持する最良の方法は何ですか?
high-availability

単一のカウンターを維持する最良の方法は何ですか?

毎秒100回未満で保証される毎秒数回カウンタを増やす簡単なbashスクリプトがあります。スクリプトはうまく機能しますが、コンピュータがクラッシュしてもカウンタが持続したいと思います。 SSD専用システムでカウンタを保存する最良の方法は何ですか?/var/<app>/更新するたびにどこかにエコーする必要があります(たとえば、ファイルに保存する必要がありますか?)もしそうなら、/var/<app>/それは正しいですか?この単一値を追跡するには、データベース全体をインストールする必要がありますか?これを効率的に実行できるかわいい、小さなL...

Admin

Linux Pacemaker:「実行できない起動(ブロック)」と表示されるリソースが作成されました。
high-availability

Linux Pacemaker:「実行できない起動(ブロック)」と表示されるリソースが作成されました。

私たちはSLES 12 SP4を使用しています。 今日のテストでは、いくつかの事実を観察しました。ステップは次のとおりです。 ステップ1: "Node01 で) コマンドを使用してカーネルパニックを生成する場合エコ 'b' > /proc/sysrq-trigger「または」エコ 'c' > /proc/sysrq-triggerリソースが実行されているノードでは、クラスタは変更を検出しますが、他のアクティブノードでリソース(SBDを除く)を開始することはできません。 ステップ2:ログによると、次のエラーが見つかります。 pengine:...

Admin

Linux上のファイルの高可用性
high-availability

Linux上のファイルの高可用性

非常に具体的なシナリオがあります。同じファイルのコピーに過ぎない2つの異なるパスで維持したい設定ファイルのセットがあります。何らかの理由で場所の1つが利用できない場合、私のプロセスは2番目の場所でファイルにアクセスし続ける必要があります。 可用性に応じて、このファイルポインタを処理するシンボリックリンクなどの方法でこれを達成できますか? どんな考えやアイデアでも高く評価されます。 とても感謝しています - ...

Admin