RHELサーバー(RHELバージョン - 7.2)には、次のdmesg行がたくさんあります。
sdbディスク(ハードディスク)の例
[Thu Dec 30 13:07:48 2021] EXT4-fs (sdb): error count since last fsck: 1329
[Thu Dec 30 13:07:48 2021] EXT4-fs (sdb): initial error at time 1614482941: ext4_find_entry:1312: inode 67240512
[Thu Dec 30 13:07:48 2021] EXT4-fs (sdb): last error at time 1640670898: ext4_find_entry:1312: inode 67240512
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 Sense Key : Medium Error [current]
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 Add. Sense: Unrecovered read error
[Thu Dec 30 13:12:19 2021] sd 0:0:1:0: [sdb] tag#0 CDB: Read(10) 28 00 80 41 13 38 00 00 08 00
[Thu Dec 30 13:12:19 2021] blk_update_request: critical medium error, dev sdb, sector 2151748408
[Thu Dec 30 13:14:38 2021] EXT4-fs warning (device sdb): __ext4_read_dirblock:902: error reading directory block (ino 67240512, block 0)
[Thu Dec 30 13:17:05 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:21:26 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 Sense Key : Medium Error [current]
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 Add. Sense: Unrecovered read error
[Thu Dec 30 13:21:59 2021] sd 0:0:1:0: [sdb] tag#0 CDB: Read(10) 28 00 80 41 13 38 00 00 08 00
[Thu Dec 30 13:21:59 2021] blk_update_request: critical medium error, dev sdb, sector 2151748408
[Thu Dec 30 13:21:59 2021] EXT4-fs warning (device sdb): __ext4_read_dirblock:902: error reading directory block (ino 67240512, block 0)
[Thu Dec 30 13:25:32 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:27:19 2021] NOHZ: local_softirq_pending 08
[Thu Dec 30 13:29:14 2021] NOHZ: local_softirq_pending 08
質問は上記のメッセージに基づいています。
うん?最も可能性の高い原因は、老朽化によってハードドライブが死んでしまうことですか?
では、どうすればよいですか?ディスクを交換しますか?
答え1
「老化」とは、ドライブが廃止され、ログ情報から確認できないことを意味します。
しかし、これが専門的な環境にあると仮定します。その場合は、ディスクメディアエラーが発生した場合は、ディスクの交換が必要になると思います。 「重要なメディアエラー」メッセージはこれを示します。はいディスクとシステム間の障害に関連しないディスクエラー(例えばケーブルの故障)。質問のログには失敗したセクタが1つしか表示されないため、ローカルエラーである可能性が高くなりますが、データストアに依存している場合はリスクを負う価値はありません。
失敗したセクタが1つ(または数個)しかない場合は、再マッピングしてドライブを引き続き使用できます(一時的に)。smartctlは不良セクタを再テストします。例えば。