長い話を短く残りのクラスターに影響を与えない(つまり凍結)方法でGlusterノード(複製されたブリックを含む)を再起動するための最良かつ簡単な方法は何ですか?
より長い話:
私はglusterfs 3.8.8パッケージバージョンを実行している最新のDebian 9.4システムで、各ノードにすべての共有データを含むミラーブロックを含むN-wayレプリケーション設定でglusterを構成しています。
ノードが再起動すると、何が起こるかをテストするときに、クラスタ全体が42秒間読み取り/書き込みアクセスをブロックし、その間に共有に到達するすべてのエントリが効果的に停止することを確認しました。低い値を設定すると、この時間を数秒に簡単に短縮できますが、network.ping-timeout
まだ目立つ静止状態は維持されます。
再起動する前に、関連するブリックを実行しているglusterfsdを終了すると、停止を防ぐことができます。ログファイルは、リブート中に実際にglusterfsdをシャットダウンしますが、ネットワークがダウンした後にのみシャットダウンされるため、他のブリックに通知することはできず、pingタイムアウトを使用して消えることがわかります。
実行するサービスファイルを直接作成するkillall
(提案どおり)https://bugzilla.redhat.com/show_bug.cgi?id=1022542#c4)本当にここに行きたいですか?私が何かを見逃していることを願っています。