LinuxのZFS - デバイスエラー後の予期しない動作

LinuxのZFS - デバイスエラー後の予期しない動作

私はZFSストレージプール(RAID Z3)を備えたDebianサーバーを管理しています。最近、ZFSは2つのディスクエラーを同時に報告しました。

ZFS has detected that a device was removed.

 impact: Fault tolerance of the pool may be compromised.
    eid: 138
  class: statechange
  state: REMOVED
   host: serres-west-wing
   time: 2021-04-30 01:30:15+0300
  vpath: /dev/disk/by-vdev/d0-part1
  vguid: 0x6622AF6B1929E199
   pool: 0x0964CF6A3748D7A9
ZFS has detected that a device was removed.

 impact: Fault tolerance of the pool may be compromised.
    eid: 140
  class: statechange
  state: REMOVED
   host: serres-west-wing
   time: 2021-04-30 01:30:15+0300
  vpath: /dev/disk/by-vdev/d1-part1
  vguid: 0xD48BA6B066788199
   pool: 0x0964CF6A3748D7A9

これらのメッセージが生成された後、常時待機が有効になり、再同期がすぐに開始されます。再同期後のプール状態は次のとおりです。

ZFS has finished a resilver:

   eid: 167
 class: resilver_finish
  host: serres-west-wing
  time: 2021-04-30 02:15:03+0300
  pool: datapool
 state: ONLINE
  scan: resilvered 132G in 00:44:41 with 0 errors on Fri Apr 30 02:15:03 2021
config:

        NAME               STATE     READ WRITE CKSUM
        datapool           ONLINE       0     0     0
          raidz2-0         ONLINE       0     0     0
            spare-0        ONLINE       0     0     0
              d0-part1     ONLINE       0     0     0
              hs-d0-part1  ONLINE       0     0     0
            d1-part1       ONLINE       0     0     0
            d2-part1       ONLINE       0     0     0
            d3-part1       ONLINE       0     0     0
            d4-part1       ONLINE       0     0     0
        logs
          mirror-1         ONLINE       0     0     0
            zil-d0-part1   ONLINE       0     0     0
            zil-d1-part1   ONLINE       0     0     0
        cache
          l2arc-d0-part2   ONLINE       0     0     0
          l2arc-d1-part2   ONLINE       0     0     0
        spares
          hs-d0-part1      INUSE     currently in use

errors: No known data errors

ディスクが接続されていて正常に動作しているd0-part1ようです。d1-part1

ディスクのパフォーマンスの低下とは無関係なエラーですか?両方の作業ディスクに同時にエラーが発生する可能性はほとんどありません。ホットスペアを無効にしても安全ですか?

答え1

ディスクの切断は、電源の問題によって発生したようです。私のコンピュータからUPSをアップグレードした後、問題はありませんでした。ホットスペアを無効にしました。

zpool detach datapool hs-d0-part1

その後、プールを再び銀処理した。

zpool scrud datapool

プールを元の状態に復元します。

関連情報