私は、VMデータがNFSサーバーに格納されている複数のlibvirtハイパーバイザーを管理しています。
私はハイパーバイザーのCPUで高いI / O待機を経験しており、より詳細に検討することにしました。出力は、iotop
プロセスのioが非常に遅いことを示しています。
私は以下を見ることにしましたnfsiostat
。
192.168.20.6:/vms/vmsfs mounted on /mnt/vms:
ops/s rpc bklog
185.786 0.000
read: ops/s kB/s kB/op retrans avg RTT (ms) avg exe (ms)
13.158 2806.170 213.268 0 (0.0%) 7.583 23.431
write: ops/s kB/s kB/op retrans avg RTT (ms) avg exe (ms)
150.745 2750.688 18.247 31 (0.0%) 35.196 828.924
ご覧のとおり、システムは非常に高いavg RTT
金額を報告しますavg exe
。
nfsiostat -a
レポートは次のとおりです。
192.168.20.6:/vms/vmsfs mounted on /mnt/vms:
ops/s rpc bklog
185.786 0.000
getattr: ops/s kB/s kB/op retrans avg RTT (ms) avg exe (ms)
5.631 2.326 0.413 0 (0.0%) 4.644 10.792
access: ops/s kB/s kB/op retrans avg RTT (ms) avg exe (ms)
0.001 0.000 0.344 0 (0.0%) 7.873 9.911
186771 VFS opens
15897283 inoderevalidates (forced GETATTRs)
9734677 page cache invalidations
159935979 attribute cache invalidations
インストールオプションは次のとおりです。
192.168.20.6:/vms/vmsfs on /mnt/vms type nfs4 (rw,relatime,vers=4.2,rsize=1048576,wsize=1048576,namlen=255,hard,proto=tcp,timeo=600,retrans=2,sec=sys,clientaddr=192.168.20.4,local_lock=none,addr=192.168.20.6)
ハイパーバイザーとNFSサーバーの両方は、別々のVLANからSFP +を介して単一のスイッチに直接接続されます。接続されているシステムのうち CPU や RAM 使用量が高いシステムはありません。
現在ここでどこに行くのかわかりません。この問題をデバッグするには、正しい次の手順を実行するのに役立ちます。私はあなたの意見を聞きたいです。