私はZFSストレージプール(RAID Z3)を備えたDebianサーバーを管理しています。最近、ZFSは2つのディスクエラーを同時に報告しました。
ZFS has detected that a device was removed.
impact: Fault tolerance of the pool may be compromised.
eid: 138
class: statechange
state: REMOVED
host: serres-west-wing
time: 2021-04-30 01:30:15+0300
vpath: /dev/disk/by-vdev/d0-part1
vguid: 0x6622AF6B1929E199
pool: 0x0964CF6A3748D7A9
ZFS has detected that a device was removed.
impact: Fault tolerance of the pool may be compromised.
eid: 140
class: statechange
state: REMOVED
host: serres-west-wing
time: 2021-04-30 01:30:15+0300
vpath: /dev/disk/by-vdev/d1-part1
vguid: 0xD48BA6B066788199
pool: 0x0964CF6A3748D7A9
これらのメッセージが生成された後、常時待機が有効になり、再同期がすぐに開始されます。再同期後のプール状態は次のとおりです。
ZFS has finished a resilver:
eid: 167
class: resilver_finish
host: serres-west-wing
time: 2021-04-30 02:15:03+0300
pool: datapool
state: ONLINE
scan: resilvered 132G in 00:44:41 with 0 errors on Fri Apr 30 02:15:03 2021
config:
NAME STATE READ WRITE CKSUM
datapool ONLINE 0 0 0
raidz2-0 ONLINE 0 0 0
spare-0 ONLINE 0 0 0
d0-part1 ONLINE 0 0 0
hs-d0-part1 ONLINE 0 0 0
d1-part1 ONLINE 0 0 0
d2-part1 ONLINE 0 0 0
d3-part1 ONLINE 0 0 0
d4-part1 ONLINE 0 0 0
logs
mirror-1 ONLINE 0 0 0
zil-d0-part1 ONLINE 0 0 0
zil-d1-part1 ONLINE 0 0 0
cache
l2arc-d0-part2 ONLINE 0 0 0
l2arc-d1-part2 ONLINE 0 0 0
spares
hs-d0-part1 INUSE currently in use
errors: No known data errors
ディスクが接続されていて正常に動作しているd0-part1
ようです。d1-part1
ディスクのパフォーマンスの低下とは無関係なエラーですか?両方の作業ディスクに同時にエラーが発生する可能性はほとんどありません。ホットスペアを無効にしても安全ですか?
答え1
ディスクの切断は、電源の問題によって発生したようです。私のコンピュータからUPSをアップグレードした後、問題はありませんでした。ホットスペアを無効にしました。
zpool detach datapool hs-d0-part1
その後、プールを再び銀処理した。
zpool scrud datapool
プールを元の状態に復元します。