I/O 非効率性の原因は何ですか？

Question 1

いくつかのブロックレベルのデバイス統計を取得するための2つのツールセットがあります。最初は遅延ブレンデン・グレグからパフォーマンスツール。これにより、ディスクの作業待ち時間の単純なヒストグラムが生成されます。たとえば、次のようになります。

>=(ms) .. <(ms)   : I/O      |Distribution                          |
     0 -> 1       : 1913     |######################################|
     1 -> 2       : 438      |#########                             |
     2 -> 4       : 100      |##                                    |
     4 -> 8       : 145      |###                                   |
     8 -> 16      : 43       |#                                     |
    16 -> 32      : 43       |#                                     |
    32 -> 64      : 1        |#                                     |

ツールセットの別のスクリプトは、コマンドiosnoopとそのアクションを表示します。たとえば、次のようになります。

COMM         PID    TYPE DEV      BLOCK        BYTES     LATms
/usr/bin/mon 31456  R    8,0      9741888      4096       2.14
/usr/bin/mon 31456  R    8,0      9751408      4096       0.16
/usr/bin/mon 31456  R    8,0      20022728     4096       1.44
/usr/bin/mon 31456  R    8,0      19851752     4096       0.26
jbd2/sda3-41 416    WS   8,0      130618232    65536      1.89
jbd2/sda3-41 416    WS   8,0      209996928    65536      1.92
jbd2/sda3-41 416    WS   8,0      210006528    8192       1.94

以来ブロック追跡パッケージは低レベルのブロック操作を記録し、次の簡単な要約を含むさまざまな情報やその他blktraceのblkparse多くのコマンドを表示します。bttpdfユーザーガイド):

$ sudo blktrace /dev/sda  # ^C to stop
=== sda ===
  CPU  0:                  180 events,        9 KiB data
  CPU  1:                 1958 events,       92 KiB data
  Total:                  2138 events (dropped 0),      101 KiB data
$ ls -ltra # one file per cpu
-rw-r--r--    1 root   root       8640 Nov  5 10:16 sda.blktrace.0
-rw-r--r--    1 root   root      93992 Nov  5 10:16 sda.blktrace.1
$ blkparse -O -d combined.output  sda.blktrace.*  # combine cpus
$ btt -i combined.output 
    ALL           MIN           AVG           MAX           N
Q2Q               0.000001053   0.106888548   6.376503027         253
Q2G               0.000000795   0.000002266   0.000011060         184
G2I               0.000000874   0.000979485   0.002588781         328
Q2M               0.000000331   0.000000599   0.000002716          70
I2D               0.000000393   0.000480112   0.002435491         328
M2D               0.000002044   0.000028418   0.000126845          70
D2C               0.000080986   0.001925224   0.010111418         254
Q2C               0.000087025   0.002603157   0.010120629         254
...

たとえば、D2C はハードウェアデバイスがタスクを実行するのにかかる時間です。

sudo smartctl -a /dev/sda各ディスクで実行して、欠陥があるかどうかを確認することもできます。

Answer

いくつかのブロックレベルのデバイス統計を取得するための2つのツールセットがあります。最初は遅延ブレンデン・グレグからパフォーマンスツール。これにより、ディスクの作業待ち時間の単純なヒストグラムが生成されます。たとえば、次のようになります。

>=(ms) .. <(ms)   : I/O      |Distribution                          |
     0 -> 1       : 1913     |######################################|
     1 -> 2       : 438      |#########                             |
     2 -> 4       : 100      |##                                    |
     4 -> 8       : 145      |###                                   |
     8 -> 16      : 43       |#                                     |
    16 -> 32      : 43       |#                                     |
    32 -> 64      : 1        |#                                     |

ツールセットの別のスクリプトは、コマンドiosnoopとそのアクションを表示します。たとえば、次のようになります。

COMM         PID    TYPE DEV      BLOCK        BYTES     LATms
/usr/bin/mon 31456  R    8,0      9741888      4096       2.14
/usr/bin/mon 31456  R    8,0      9751408      4096       0.16
/usr/bin/mon 31456  R    8,0      20022728     4096       1.44
/usr/bin/mon 31456  R    8,0      19851752     4096       0.26
jbd2/sda3-41 416    WS   8,0      130618232    65536      1.89
jbd2/sda3-41 416    WS   8,0      209996928    65536      1.92
jbd2/sda3-41 416    WS   8,0      210006528    8192       1.94

以来ブロック追跡パッケージは低レベルのブロック操作を記録し、次の簡単な要約を含むさまざまな情報やその他blktraceのblkparse多くのコマンドを表示します。bttpdfユーザーガイド):

$ sudo blktrace /dev/sda  # ^C to stop
=== sda ===
  CPU  0:                  180 events,        9 KiB data
  CPU  1:                 1958 events,       92 KiB data
  Total:                  2138 events (dropped 0),      101 KiB data
$ ls -ltra # one file per cpu
-rw-r--r--    1 root   root       8640 Nov  5 10:16 sda.blktrace.0
-rw-r--r--    1 root   root      93992 Nov  5 10:16 sda.blktrace.1
$ blkparse -O -d combined.output  sda.blktrace.*  # combine cpus
$ btt -i combined.output 
    ALL           MIN           AVG           MAX           N
Q2Q               0.000001053   0.106888548   6.376503027         253
Q2G               0.000000795   0.000002266   0.000011060         184
G2I               0.000000874   0.000979485   0.002588781         328
Q2M               0.000000331   0.000000599   0.000002716          70
I2D               0.000000393   0.000480112   0.002435491         328
M2D               0.000002044   0.000028418   0.000126845          70
D2C               0.000080986   0.001925224   0.010111418         254
Q2C               0.000087025   0.002603157   0.010120629         254
...

たとえば、D2C はハードウェアデバイスがタスクを実行するのにかかる時間です。

sudo smartctl -a /dev/sda各ディスクで実行して、欠陥があるかどうかを確認することもできます。

Question 2

私はこれがdstatアプリケーション呼び出しのファイル記述子レベルのI / O統計を使用し、write()システムdstat呼び出しが返されるとデータが増加することを見ると思います。

しかし、それはデータが実際に記録されたという意味ではありません。一時停止しているように見えるこれらのステップは、バッファがブロックデバイスに書き込まれるステップであると推測されます。これは、この間にI / O待機値dstatがデータ転送が測定されるステップよりもはるかに高いことを意味します。

iotopディスクとキャッシュへの書き込みと読み取りを区別します。たぶんこのツールは興味深い追加情報を提供するかもしれません。

Answer

私はこれがdstatアプリケーション呼び出しのファイル記述子レベルのI / O統計を使用し、write()システムdstat呼び出しが返されるとデータが増加することを見ると思います。

しかし、それはデータが実際に記録されたという意味ではありません。一時停止しているように見えるこれらのステップは、バッファがブロックデバイスに書き込まれるステップであると推測されます。これは、この間にI / O待機値dstatがデータ転送が測定されるステップよりもはるかに高いことを意味します。

iotopディスクとキャッシュへの書き込みと読み取りを区別します。たぶんこのツールは興味深い追加情報を提供するかもしれません。

I/O 非効率性の原因は何ですか？

答え1

答え2

関連情報