フォローアップです。私のクレイジーmdadm
質問。sda
まず、非同期化の原因が何であるかを把握しようとしています。私が考えることができる唯一のことは、複数のアップデートを実行してカーネルアップグレードを再ロードするために再起動したことです。両方のドライブが同期しない可能性はありますか? mdadm同期が進行中の場合、システムは再起動を防ぎますか?できますか?何が起こっているのかの他の提案はありますか?そしてこれをさらに防ぐ方法は何ですか?ドライブに問題はないようです。
答え1
完全に終了すると確かに動作します。
これDebian mdadm FAQカーネルが正しいことをしたという意味です。
8. 私のRAIDアレイの1つが使用中で、停止できません。何を提供しますか?
終了時にmdadmがルートファイルシステムの配列が使用中であると報告するのは完全に正常な現象です。その理由は、アレイを停止するにはルートファイルシステムをマウントする必要があります(それ以外の場合は/ sbin / mdadmが存在しません)、アレイを停止するにはルートファイルシステムをマウントできないためです。 Catch 22. カーネルは実際にアレイを停止する前に停止するので、すべてが正常です。これmdドライバは、シャットダウン時にすべてのデバイスを読み取り専用に設定します。(物理デバイスを解決するのに約1秒かかります)
書き込み中にシステムがクラッシュしても、ドライバは書き込み中にブロックをダーティで注意深く表示し、クリーンでない配列から起動するとダーティブロックを再同期します。よりアレイの状態の説明。これカーネル文書警告汚れた(きれいに閉じていない)および劣化した(部品がない)アレイは安全ではないため、自動的に組み立てられません。ダーティアレイを組み立てるとき(おそらく非常に簡単に)resync
要約する/sys/block/md99/md/rd0/state
と、mdドライバはハードウェアコンポーネント(CPUまたはディスク)の完全なエラーからデータを保護する役割を果たし、これが私たちが期待するものです。 。
mdは、RAM、CPU、マザーボード、またはディスクのビザンチン障害(たとえば、1つ以上のビット自動切り替え)によるデータ破損からユーザーを保護しません。ディスクハードウェアにはチェックサムがありますが、完璧ではありません(例:ZFSプロモーション資料)。 ジブスそしてBTRFSストレージ装置の損傷を防ぐことができます。Btrfsのチェックサムツリーハードドライブに変更があると通知されます。 Zfsはチェックサム選択機能を提供します(以下に基づいています)。ジェフ・ボンウィックのブログ)(最大SHA-256)はランダムな損傷だけでなく、意図的な攻撃からも保護しますが、CPUサイクルを消費します。
答え2
raid1に入れる前にファイルシステムを作成しましたか?それ以外の場合は、RAIDデバイスに設定する前にファイルシステムを縮小しましたか?
これを怠ると、Raidデバイスのスーパーブロックが正しくない可能性があります。