再構築失敗後の奇妙な状態のmdraid

再構築失敗後の奇妙な状態のmdraid

だから私のNAS(mdraid level5)マザーボードが死亡し、新しいシステムをセットアップしました。そこでRAIDを再組み立て、再構築を始めました。

md0 : active raid5 sde4[3] sdc4[0] sdd4[2] sdb4[4]
  8634123072 blocks level 5, 64k chunk, algorithm 2 [4/3] [U_UU]
  [>....................]  recovery =  4.2% (121889248/2878041024) finish=394.4min speed=116448K/sec

数時間後に戻ってきましたが、いくつかのIOエラーが原因で再構築が失敗しました。システムを再起動して再組み立てを試みましたが、すべてのドライブが空き容量になりました。

root@el-kisto:~# mdadm --assemble  /dev/md0 /dev/sd[b-e]4 --verbose
mdadm: looking for devices for /dev/md0
mdadm: /dev/sdb4 is identified as a member of /dev/md0, slot 5.
mdadm: /dev/sdc4 is identified as a member of /dev/md0, slot 0.
mdadm: /dev/sdd4 is identified as a member of /dev/md0, slot 2.
mdadm: /dev/sde4 is identified as a member of /dev/md0, slot 3.
mdadm: added /dev/sdc4 to /dev/md0 as 0 (possibly out of date)
mdadm: no uptodate device for slot 1 of /dev/md0
mdadm: added /dev/sde4 to /dev/md0 as 3
mdadm: added /dev/sdb4 to /dev/md0 as 5
mdadm: added /dev/sdd4 to /dev/md0 as 2
mdadm: /dev/md0 assembled from 2 drives and 1 spare - not enough to start the array.

root@el-kisto:~# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : inactive sdb4[5](S) sdc4[0](S) sdd4[2](S) sde4[3](S)
      11512164096 blocks

mdadmで確認すると、次の結果が表示されます。

mdadm --examine /dev/sd[bcde]4 | egrep 'dev|Update|Role|State|Chunk Size|Events'
/dev/sdb4:
    Update Time : Mon Aug 28 02:05:59 2023
          State : clean
         Events : 2045534
     Chunk Size : 64K
      Number   Major   Minor   RaidDevice State
this     5       8       20        5      spare   /dev/sdb4
   2     2       8       52        2      active sync   /dev/sdd4
   3     3       8       68        3      active sync   /dev/sde4
   4     4       8       36        4      faulty   /dev/sdc4
/dev/sdc4:
    Update Time : Mon Aug 28 01:54:48 2023
          State : clean
         Events : 2045530
     Chunk Size : 64K
      Number   Major   Minor   RaidDevice State
this     0       8       36        0      active sync   /dev/sdc4
   0     0       8       36        0      active sync   /dev/sdc4
   2     2       8       52        2      active sync   /dev/sdd4
   3     3       8       68        3      active sync   /dev/sde4
   4     4       8       20        4      spare   /dev/sdb4
/dev/sdd4:
    Update Time : Mon Aug 28 02:05:59 2023
          State : clean
         Events : 2045534
     Chunk Size : 64K
      Number   Major   Minor   RaidDevice State
this     2       8       52        2      active sync   /dev/sdd4
   2     2       8       52        2      active sync   /dev/sdd4
   3     3       8       68        3      active sync   /dev/sde4
   4     4       8       36        4      faulty   /dev/sdc4
/dev/sde4:
    Update Time : Mon Aug 28 02:05:59 2023
          State : clean
         Events : 2045534
     Chunk Size : 64K
      Number   Major   Minor   RaidDevice State
this     3       8       68        3      active sync   /dev/sde4
   2     2       8       52        2      active sync   /dev/sdd4
   3     3       8       68        3      active sync   /dev/sde4
   4     4       8       36        4      faulty   /dev/sdc4

大丈夫に見えます。ディスクの3/4のイベントカウンタは同じで、後者はとにかく再構築されました。ところで、MDは今5つのデバイスがあるべきだと思いますか?犯人はsdb4のようです。これは、スタンバイ状態として自己識別し、アクティブでなければならないときに#5であり、#4は何ですか? --組み立て中に強制的に力を加えることは役に立ちません。 mdがsd [bde] 4をダウングレードされた4ディスクアレイとして受け入れるようにどのように説得しますか?

関連情報