NVMeディスクは80%ioの使用率を示し、パーティションは0%のio使用率を示します。

NVMeディスクは80%ioの使用率を示し、パーティションは0%のio使用率を示します。

3.10.0-957.12.1.el7.x86_64次の2つのNVMeディスクが設定されたCentOS 7サーバー(カーネル)があります。

# lsblk
NAME          MAJ:MIN RM   SIZE RO TYPE  MOUNTPOINT
nvme0n1       259:0    0   477G  0 disk
├─nvme0n1p1   259:2    0   511M  0 part  /boot/efi
├─nvme0n1p2   259:4    0  19.5G  0 part
│ └─md2         9:2    0  19.5G  0 raid1 /
├─nvme0n1p3   259:7    0   511M  0 part  [SWAP]
└─nvme0n1p4   259:9    0 456.4G  0 part
  └─data-data 253:0    0 912.8G  0 lvm   /data
nvme1n1       259:1    0   477G  0 disk
├─nvme1n1p1   259:3    0   511M  0 part
├─nvme1n1p2   259:5    0  19.5G  0 part
│ └─md2         9:2    0  19.5G  0 raid1 /
├─nvme1n1p3   259:6    0   511M  0 part  [SWAP]
└─nvme1n1p4   259:8    0 456.4G  0 part
  └─data-data 253:0    0 912.8G  0 lvm   /data

モニタリング結果によるiostatと、継続的に80%以上のio利用率が見られますが、個々のパーティションのio利用率は0%で、完全に利用可能です(250,000 iops、毎秒1 GBの読み取り/書き込み)。nvme0n1nvme1n1

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           7.14    0.00    3.51    0.00    0.00   89.36

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
nvme1n1           0.00     0.00    0.00   50.50     0.00   222.00     8.79     0.73    0.02    0.00    0.02  14.48  73.10
nvme1n1p1         0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
nvme1n1p2         0.00     0.00    0.00   49.50     0.00   218.00     8.81     0.00    0.02    0.00    0.02   0.01   0.05
nvme1n1p3         0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
nvme1n1p4         0.00     0.00    0.00    1.00     0.00     4.00     8.00     0.00    0.00    0.00    0.00   0.00   0.00
nvme0n1           0.00     0.00    0.00   49.50     0.00   218.00     8.81     0.73    0.02    0.00    0.02  14.77  73.10
nvme0n1p1         0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
nvme0n1p2         0.00     0.00    0.00   49.50     0.00   218.00     8.81     0.00    0.02    0.00    0.02   0.01   0.05
nvme0n1p3         0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
nvme0n1p4         0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
md2               0.00     0.00    0.00   48.50     0.00   214.00     8.82     0.00    0.00    0.00    0.00   0.00   0.00
dm-0              0.00     0.00    0.00    1.00     0.00     4.00     8.00     0.00    0.00    0.00    0.00   0.00   0.00

この動作の根本原因が何であるかというアイデアはありますか?
高いIOアラートをトリガーするモニターを除いて、すべてが正常に機能しているようです。

答え1

誤った出力の原因は、iostatRHEL / CentOSバージョン7.7で修正されるカーネルのバグに関連しているようです。スケジューラが設定されているデバイスは影響を受けます。これはNVMEドライブのデフォルトです。 %utilsvctmkernel-3.10.0-1036.el7none

参考までにRed Hat ソリューション(ログインが必要)エラーについて説明します。
内部にCentOSのバグレポート誰かが上記のカーネル/ディストリビューションのバージョンで上記の問題を解決すると思いました。

スケジューラを変更すると、新しいカーネルが利用可能になるまで問題は解決されます。これは実際のパフォーマンスではなく指標にのみ影響するように見えるため、新しいカーネルが出るまでこれらの指標を無視することも可能です。
NVMEドライバがないため、これを確認できません。おそらく@michal kralikがこれを確認できるでしょう。

答え2

Linuxカーネルは、各論理区画に渡されたIOを、IOが実際に実行される物理装置に再マップします。

関連情報