1,000,000個の小さなファイルコピー速度を向上

Question 1

私たちが言うと

返された項目はreaddirinode 番号でソートされません。
inode順にファイルを読み取ると、検索操作の数が減ります。
ファイルの内容のほとんどは初期の8k割り当て（ext4最適化）内にあるため、ナビゲーション操作も削減されます。

inode の順番でファイルをコピーしてコピー速度を上げることができます。

これは、次のようなものを使用することを意味します。

$ cd /mnt/src
$ ls -U -i | sort -k1,1 -n | cut -d' ' -f2- > ~/clist
$ xargs cp -t /mnt2/dst < ~/clist

Answer

私たちが言うと

返された項目はreaddirinode 番号でソートされません。
inode順にファイルを読み取ると、検索操作の数が減ります。
ファイルの内容のほとんどは初期の8k割り当て（ext4最適化）内にあるため、ナビゲーション操作も削減されます。

inode の順番でファイルをコピーしてコピー速度を上げることができます。

これは、次のようなものを使用することを意味します。

$ cd /mnt/src
$ ls -U -i | sort -k1,1 -n | cut -d' ' -f2- > ~/clist
$ xargs cp -t /mnt2/dst < ~/clist

Question 2

tar伝統的に、GNUはpaxハードリンク自体を処理します。

cd "$srcdir" ; tar --hard-dereference -cf - ./* |
    tar -C"${tgtdir}" -vxf -

これにより、2つのプロセスがあり、繰り返し呼び出すtar必要がなくなります。cp

Answer

tar伝統的に、GNUはpaxハードリンク自体を処理します。

cd "$srcdir" ; tar --hard-dereference -cf - ./* |
    tar -C"${tgtdir}" -vxf -

これにより、2つのプロセスがあり、繰り返し呼び出すtar必要がなくなります。cp

Question 3

同様に寄稿者: @maxschlepzig答えは、出力を解析して、filefrag最初のフラグメントがディスクに表示される順序でファイルをソートできることです。

find . -maxdepth 1 -type f |
  xargs -d'\n' filefrag -v |
  sed -n '
    /^   0:        0../ {
      s/^.\{28\}\([0-9][0-9]*\).*/\1/
      h
      }
    / found$/ {
      s/:[^:]*$//
      H
      g
      s/\n/ /p
      }' |
    sort -nk 1,1 |
    cut -d' ' -f 2- |
    cpio -p dest_dir

MMVには上記のスクリプトが含まれていますので、sed徹底的にテストしてください。

そうでなければ、何をしても（の一部）は、複数のファイル引数を使用できるよりもはるかに速くfilefrag使用されます。 1,000,000回実行するオーバーヘッドだけでも多くのオーバーヘッドが追加されます。e2fsprogshdparmhdparm

perlまたFIEMAP ioctl、各ファイルに対してコピーするチャンクとそのチャンクが属するファイルの整列配列を作成し、すべてを順番にコピーして各チャンクを読み取るスクリプト（またはCプログラム）を作成することはそれほど難しくありません。そのファイルサイズ（ただし、ファイル記述子が不足しないように注意してください）

Answer

同様に寄稿者: @maxschlepzig答えは、出力を解析して、filefrag最初のフラグメントがディスクに表示される順序でファイルをソートできることです。

find . -maxdepth 1 -type f |
  xargs -d'\n' filefrag -v |
  sed -n '
    /^   0:        0../ {
      s/^.\{28\}\([0-9][0-9]*\).*/\1/
      h
      }
    / found$/ {
      s/:[^:]*$//
      H
      g
      s/\n/ /p
      }' |
    sort -nk 1,1 |
    cut -d' ' -f 2- |
    cpio -p dest_dir

MMVには上記のスクリプトが含まれていますので、sed徹底的にテストしてください。

そうでなければ、何をしても（の一部）は、複数のファイル引数を使用できるよりもはるかに速くfilefrag使用されます。 1,000,000回実行するオーバーヘッドだけでも多くのオーバーヘッドが追加されます。e2fsprogshdparmhdparm

perlまたFIEMAP ioctl、各ファイルに対してコピーするチャンクとそのチャンクが属するファイルの整列配列を作成し、すべてを順番にコピーして各チャンクを読み取るスクリプト（またはCプログラム）を作成することはそれほど難しくありません。そのファイルサイズ（ただし、ファイル記述子が不足しないように注意してください）

1,000,000個の小さなファイルコピー速度を向上

答え1

答え2

答え3

関連情報