2週間前、私のBSDサーバーは中断され、私のUPSは今失敗するのに良い時期だと判断しました。今夜は始まりましたが、再構築のプロセスだと思っていましたが、次のエラーが表示されました。
ECC エラーのポートは、次のエラーで 2 または 1 と表示され、画像に表示される残りのデータは再構築が開始されてから表示されませんでしたが、ドライブ ECC エラーは 1 ~ 2 回表示されました。コマンドが表示されました。
重要なデータをバックアップする別のシステムもありますが、これが実際に何を意味するのか、そしてハードウェアを購入する必要があるのかという質問があります。ドライブは、3Ware 9650SE-4LPML 4ポート3Gb / s RAIDカードを含むWD 250GB、ハードウェアRAID5です。オペレーティングシステムはFreeBSD 6.2です。
編集:今は何か違います。再試行の枯渇エラーが発生し、次の行が生成されます。
g_vfs_dome():da0s1d[READ(offset=1155956736, length=16384)]error = 5
その後、コントローラをリセットし、デバイスの再設定を開始します。
答え1
ここでやるべきことは、不良ドライブに対してSMARTセルフテストを実行することです。これにより、ここから多くのコントローラ/マザーボード部品を取り出し、問題のプライマリディスクをよりよく読み取ることができます。ドライブ以外のエラーによって誤った結果が生じる可能性があります(電源装置のエラーが最も一般的な原因です)、それは良いスタートです。拡張テストを実行するには数時間かかりますが、短いテストで役に立つ情報を十分に得ることができます。故障したドライブは、そのドライブでも迅速に苦情を表示する傾向があります。
ユーザーのご案内SMARTは3ware RAIDのドライブを監視します。これにより、セルフテストを実行し、記録された結果を表示するのに十分な情報が提供されます。新しいテストを実行する前に、ここでコントローラカードのログを確認して詳細を確認することをお勧めします。停電前にエラーが増加したかどうかを確認するのも面白いでしょう。時には、RAIDアレイがユーザーが認識しない不整合を隠すことがあります。停電は、一貫性のない書き込みによってセクタを損傷する可能性があり、不明な問題がひどい再構築プロセスを引き起こす可能性があります。以前のセクタ回復が発生した場合、コントローラはLinuxドライバに通知せずに静かに回復しても、コントローラログにそれを見つけることができます。