
サブシステムがmd
劣化した状態で実行中であることを示すメッセージ(または次のドライブエラーに正常に対応したことを示す可能性がある他のメッセージ)をsyslog / systemd-journalに出力しますか?ここにヒントをください)?
sd
たとえば、次のガイドラインには多くのエラーが表示されますが、Unrecovered read error
「代替場所での再試行の成功」などの内容は表示されません。たぶん何もないことが良いニュースでしょうか?
過去には、イメージングソフトウェア/ハードウェアは、デバイスのパフォーマンスが低下したり、注意が必要な時期を示すシステムログエントリを生成しました。md
これをしないでください。
背景:問題のシステムがデプロイされており、リモートで監視されています(syslog / logメッセージではmdadm
現在、どのような対話型コマンド/アクセスも使用できません)。
答え1
2つのラウンドロビンデバイスで構築されたRAID 1アレイのクイックテストを実施しました。
dd bs=1M count=100 if=/dev/zero >/tmp/0.img
cp /tmp/0.img /tmp/1.img
i0=$(losetup --show --find /tmp/0.img); echo $i0
i1=$(losetup --show --find /tmp/1.img); echo $i1
mdadm --create /dev/md99 --metadata default --level 1 --raid-devices 2 $i0 $i1
半分を誤って設定する
mdadm --manage /dev/md99 --set-faulty $i1 # For me, $i1=/dev/loop1
カーネル(およびその他の関連RAID1メッセージ)でこれを提供します。
Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Disk failure on loop1, disabling device
Oct 6 17:36:10 pi kernel: [4087450.030438] md/raid1:md99: Operation continuing on 1 devices.