私のRAIDを損傷する要因が何であるかをどうやって知ることができますか?

私のRAIDを損傷する要因が何であるかをどうやって知ることができますか?

SSDと3つの1TB WD HDDを含むx86_64 Ubuntu 17.10(バニラ4.13カーネル)をインストールしました。各HDDには、1.45TB RAID5アレイ用の750GBパーティションがあります。 SSD/にデータがあり、RAIDアレイにLVM定義があります/home

Personalities : [raid6] [raid5] [raid4] [linear] [multipath] [raid0] [raid1] [raid10] 
md0 : active raid5 sdc1[3] sdd1[1] sdb1[0]
      1572601856 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
      [====>................]  resync = 21.3% (168261416/786300928) finish=64.7min speed=159157K/sec
      bitmap: 6/6 pages [24KB], 65536KB chunk

クリスマスの頃にコンピュータを繰り返しオンにして、次の事実が見つかるまでは素晴らしい仕事をしました。

[    2.334153] md/raid:md0: not clean -- starting background reconstruction
[    2.334164] md/raid:md0: device sdc1 operational as raid disk 2
[    2.334165] md/raid:md0: device sdd1 operational as raid disk 1
[    2.334165] md/raid:md0: device sdb1 operational as raid disk 0
[    2.334333] md/raid:md0: raid level 5 active with 3 out of 3 devices, algorithm 2
[    2.334479] md0: bitmap file is out of date (39126 < 39127) -- forcing full recovery
[    2.334493] md0: bitmap file is out of date, doing full recovery
[    2.422418] md0: detected capacity change from 0 to 1610344300544
[    2.422606] md: resync of RAID array md0
...
[    9.537010] EXT4-fs (dm-0): mounted filesystem with ordered data mode. Opts: (null)

明らかに、これはビットマップ自体が最新ではないため、完全な(遅い)再同期が発生することです。ファイルシステム自体がきれいになります。私考えるこれは終了時のタイミングの問題ですか? LVMはマウント解除されていますが、シャットダウン前にRAIDが停止しませんか?コンピュータをシャットダウンすると、奇妙な動作は見えません。システムログには何かが終了していると表示されますが、それはすべてです。

電源を切らずに停止をした場合、このようなことが起こる可能性は大幅に減るでしょうが、今朝もそのようなことが起きて3ヶ月間何も考えずにいよいよ書きました。

RAIDアレイの詳細:

/dev/md0:
        Version : 1.2
  Creation Time : Fri Sep 11 17:49:27 2015
     Raid Level : raid5
     Array Size : 1572601856 (1499.75 GiB 1610.34 GB)
  Used Dev Size : 786300928 (749.88 GiB 805.17 GB)
   Raid Devices : 3
  Total Devices : 3
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Mon Apr  2 08:38:28 2018
          State : active, resyncing 
 Active Devices : 3
Working Devices : 3
 Failed Devices : 0
  Spare Devices : 0

         Layout : left-symmetric
     Chunk Size : 512K

  Resync Status : 52% complete

           Name : underlay:0  (local to host underlay)
           UUID : 520c8995:8d934562:0e2f5b8e:d460bfed
         Events : 40381

    Number   Major   Minor   RaidDevice State
       0       8       17        0      active sync   /dev/sdb1
       1       8       49        1      active sync   /dev/sdd1
       3       8       33        2      active sync   /dev/sdc1

私はこれをさらに調べる方法さえ知りません。スタート画面を無効にするようにGRUBを設定することで、画面にdmesgを表示できますが、興味深い内容は表示されません。時々、サービスは終了せず、systemdがサービスを終了する前に90秒を待つ状況に直面します。私はそれが何であり、安全なマウント解除になりますが、安全でないRAID(オフ?無効?マウント解除?)を発生させるかどうかはわかりません。私は通常、カーネルがここで何が間違っているかを確認するためにRAIDをオフにする方法さえよく理解していません。

第二に、デスクトップの相互作用を完全に破壊しないRAIDの再同期に関するアドバイスをいただきありがとうございます。 IOコントロールは/proc/sys/dev/raid/speed_limit_max実際に私が望む方法で動作しません。コンピュータは10秒間最大速度で同期し、3秒間待機するため、同期が遅くなります。そして2時間くらい使っても依然として迷惑です。

答え1

fstab問題は、私のネットワークインストールが時々シャットダウン時に中断されることがわかりました。ネットワークマウントがRAIDファイルシステム内のマウントポイントにない理由がわからない。すべて/SSDにマウントされています。

18.04に移しても問題は解決されず、netmountに関連することが判明したブート遅延があったので、実際に発見しました。

関連情報