ルートインストールを冗長化し、稼働時間を最大化する最も確実な方法は何ですか? RAID、ZFS、または他のもの?

ルートインストールを冗長化し、稼働時間を最大化する最も確実な方法は何ですか? RAID、ZFS、または他のもの?

冗長ルートインストール用にデスクトップコンピュータ(実際に動作するKVMゲストサーバー)を設定したいと思います。ドライブがクラッシュした場合は、バックアップから完全な復元を実行したり、システムを再インストールしたり、すべての設定とデフォルト設定をリセットしたりすることなく、すばやく作業に戻したいと思います。

私はこれを行う方法がRAID1だと思いましたが、詳しく見ると、RAID1が「設定して忘れてしまう」ソリューションではないことに気づきました。ああ、UEFIブートだと思います。

最後に、ソフトウェアRAID1をインストールしようとしたとき(Ubuntu Serverインストーラを使用して設定しました)、何かが破損してGRUB回復画面が表示され、生涯ミラーリングする方法がわかりませんでした。運転。私が知っている限り、ドライブ間のコピーの破損により、両方のブートセクタが破損しています。明らかに、これはRAID1ブートを介してダウンタイムを減らすことを目的としません。迅速かつ簡単に交換できるように、EFIパーティションをUSBドライブに挿入してバックアップする必要があると考えていますが(ルートパーティションをRAID1に配置している間)、いつもわかるかどうか心配です。 EFIパーティションが変更されたので、いつバックアップするのかわかりません。

また、上記のシナリオを防ぐために、ビットロート保護とスナップショットがより役に立つと考えているので、ZFS-on-rootの使用を検討しています。しかし、Ubuntuでは、ルートでZFSを使用することはお勧めできないようですが、Linuxカーネルプログラマによって主張されている許容誤差がないため、LinuxでZFSの状態が疑わしいようです。私は疑う。これは良い方法かもしれません。しかし、私はMAAS全体について、またはそれが私のユースケースに関連しているかどうかわかりません。

私が最後に考えたのは、定期的なシングルドライブインストールを実行し、毎週スペアドライブに追加して、災害が発生した場合は少なくとも1週間以内に設定を復元してインストールできるようにすることでした。しかし、SSDを毎週追加するのは難しいでしょうか?

私はRAIDとZFSについて数え切れないほど多くのチュートリアルを見つけましたが、これまで上記の目標に関して私が選んだことの長所と短所を明確に説明するものが見つかりませんでした。説明の提案やリンクをいただきありがとうございます!

答え1

必要に応じて異なりますが、いくつかのオプションがあります。私の個人的な選択は、ルートボリュームと私の健康にとって重要な他のボリューム(ノートブックとワークステーションの/ home)でlvmミラーを使用することです。

バックアップの場合は、リモートホストにエントリをパッケージ化または再同期することができ、より簡単な場合はgit(/ etcでうまく機能)を使用することもできます。

私はミラーリングとストライピングにのみmdadmを使用しましたが、移行(ドライブの交換、ドライブの追加、新しいホストへの移動)がmdadmよりはるかに簡単なので、あきらめてlvmを使用しました。

答え2

稼働時間を最大化する最も強力な方法...

私はこの質問が全体的に良い質問だと思いますが、Linuxとハードウェアを構成するすべてのコンポーネントの現在の状態を考えると答えるのに問題があります。 1つ以上の正解があるかもしれませんが、まだ合理的な主張をすることができます。この質問に答えるより良い方法は、「しないでください」ことです。

  • ハードウェアを知って良い機器を使用してください
  • ハードウェアRAIDはソフトウェアRAID(mdadm)より優れています。
  • 私は停電のためにJBODストレージデバイスへのソフトウェア攻撃(mdadm)によってデータが破損することを経験したので、可能であれば常に検証済みのハードウェアRAIDデバイスを選択し、そうでなければ機会をつかみます。 本気ならソフトウェアレイドを使わないでください
  • 停電や電圧低下を処理できる一種の無停電電源装置(UPS)を用意してください。データを節約するために正常に終了するのに十分な長さの動作状態を維持してください。
  • RAIDについて:独立ディスクの冗長アレイ=ハードウェアレベルで正しく実行されると、「設定して忘れてしまう」ソリューションになる可能性があります。ストレージ容量に2つ以上のディスクが必要ない限り、単純なRAID-1を使用してください。 1 つのドライブでエラーが発生しても何も起こらなかったかのように実行できます。そうでない場合、編集証がある場合は、2つのディスクフォールトトレランスを備えたRAID-6として3つのディスクを使用できます。
  • RAIDはバックアップではないことを理解してください。したがって、2つまたは3つのディスクをルートパーティションとしてRAID-1またはRAID-6にし、BIOSまたはefiブートローダがそのディスクを起動します。ディスク(レイドボリューム)。他の場所に別々のディスクがあります。これは、アクティブな2つまたは3つのディスクRAIDボリュームにあるコンテンツのミラー化コピーです。 (レイドに関係なく)破損した場合は、バックアップから復元できます。
  • ある程度理解して災害復旧これは、発生したすべての問題を回復して回復するのに時間がかかることを知っています。
  • おそらくいいえ使用ファイルシステムの管理方法を根本的に変える革新的な新しいファイルシステムZFSの説明です。私のアドバイスは、EXT3、EXT4、XFS、おそらくBTRFSのような試みられ、本当のものに固執することです。ただし、Linuxディストリビューションがこれをうまくサポートしている場合にのみ可能です。問題は通常ファイルシステムエラーに関連しており、そのファイルシステムで利用可能なツールがわかっている場合は修正できます。
  • EXT3 と XFS はほぼすべての Linux ディストリビューションでサポートされていますが、EXT4 と BTRFS は最新バージョンを使用しない限り、すべてのディストリビューションでサポートされない場合があります。いいねLinuxディストリビューション。 ~のため最も確実な私のアドバイスは、エンタープライズLinuxのRHEL、SLES、CentOSのいずれかを選択することです。彼らは素晴らしいサポートを提供します。

関連情報