xfs_repairが停止しているのか、まだ実行しているのか、どうすればわかりますか?

xfs_repairが停止しているのか、まだ実行しているのか、どうすればわかりますか?

約72TBのスペースを持つバックアップサーバーがあります。半分程度しか使われません。今週初めにxfsファイルシステムをアンマウントした直後に、次のメッセージが表示されました。

Mar 15 15:15:47 kernel: Filesystem dm-0: XFS internal error xfs_trans_cancel at line 1164 of file fs/xfs/xfs_trans.c.  Caller 0xffffffff883e54fe
Mar 15 15:15:47 kernel: 
Mar 15 15:15:47 kernel: 
Mar 15 15:15:47 kernel: Call Trace:
Mar 15 15:15:47 kernel:  [<ffffffff883dfd95>] :xfs:xfs_trans_cancel+0x55/0xfa
Mar 15 15:15:47 kernel:  [<ffffffff883e54fe>] :xfs:xfs_mkdir+0x429/0x465
Mar 15 15:15:47 kernel:  [<ffffffff883ee399>] :xfs:xfs_vn_mknod+0x161/0x215
Mar 15 15:15:47 kernel:  [<ffffffff800ed95a>] vfs_mkdir+0xe3/0x152
Mar 15 15:15:47 kernel:  [<ffffffff800edf30>] sys_mkdirat+0xa3/0xe4
Mar 15 15:15:47 kernel:  [<ffffffff800a7f3f>] sys_futex+0x129/0x14a
Mar 15 15:15:47 kernel:  [<ffffffff8005ddf9>] error_exit+0x0/0x84
Mar 15 15:15:47 kernel:  [<ffffffff8005d116>] system_call+0x7e/0x83
Mar 15 15:15:47 kernel: 
Mar 15 15:15:47 kernel: xfs_force_shutdown(dm-0,0x8) called from line 1165 of file fs/xfs/xfs_trans.c.  Return address = 0xffffffff883dfdae
Mar 15 15:15:47 kernel: Filesystem dm-0: Corruption of in-memory data detected.  Shutting down filesystem: dm-0
Mar 15 15:15:47 kernel: Please umount the filesystem, and rectify the problem(s)
Mar 15 15:15:57 kernel: Filesystem dm-0: xfs_log_force: error 5 returned.

だから4日前から次のコマンドを実行しました。

xfs_repair -vv -o bhash=16384 -o ihash=16384 -o ag_stride=16 /dev/mapper/cdp1raid-cdp1raid

追加-oオプションを使用すると、速度が大幅に向上し、進行状況を示すログファイルに出力されますが、過去2日間は次のメッセージのみが表示されました。

rebuild AG headers and trees - 73 of 73 allocation groups done

strace、、、、、同じことが続いているのか、止まっているのかを調べることができたかどうかiostatを調べましたが、プロセスが何をしているのかを知らせる内容は何も見ませんでした。実行すると、および値に対する、およびリストのカウントダウンが表示されますが、これが実際に意味があるかどうかはわかりません。htopatopiostat -xdsdcsdc1dm-0r/sw/srsec/s

これについての助けや指示をいただきありがとうございます。

答え1

インターネットの一部の人々は、この-Pフラグがxfs_repairそのような中断を防ぐのに役立つと言います(straceのみが表示され、他は表示さFUTEX_WAIT_PRIVATEれません)。男性:

       -P     Disable prefetching of inode and directory blocks. Use this option if you find xfs_repair gets stuck and stops proceeding. Interrupting a stuck xfs_repair is safe.

関連情報