結果を収集するために多数のファイル（300,000以上）を処理するより効率的な方法は何ですか？

Question 1

私が正しく理解したら、行がたくさんあるfields.txtファイルがあります。ファイルが複数ありますres-0-n-0。そして、各行ごとにファイルの内容fields.txtにコピーします（存在する場合）。results.txtres-0-<line_number>

私は単にfields.txtファイルを1行ずつ読み、results.txt必要に応じてファイルの内容の行をエコーできると思います。res-0-<line_number>

私は次のようなものを選択します。

#! /bin/sh

LINE_NUMBER=0
while read line;
do
  if [ -f "res-0-$LINE_NUMBER-0" ]
  then
    echo "$line $(cat res-0-$LINE_NUMBER-0)" >> result.txt
  else
    echo "$line" >> result.txt
  fi
  ((LINE_NUMBER++))
done < fields.txt

Answer

私が正しく理解したら、行がたくさんあるfields.txtファイルがあります。ファイルが複数ありますres-0-n-0。そして、各行ごとにファイルの内容fields.txtにコピーします（存在する場合）。results.txtres-0-<line_number>

私は単にfields.txtファイルを1行ずつ読み、results.txt必要に応じてファイルの内容の行をエコーできると思います。res-0-<line_number>

私は次のようなものを選択します。

#! /bin/sh

LINE_NUMBER=0
while read line;
do
  if [ -f "res-0-$LINE_NUMBER-0" ]
  then
    echo "$line $(cat res-0-$LINE_NUMBER-0)" >> result.txt
  else
    echo "$line" >> result.txt
  fi
  ((LINE_NUMBER++))
done < fields.txt

Question 2

sedスクリプトを作成したら、ファイルに一度だけ適用してみてくださいfield.txt。

while IFS='' read -r line; do
    res=$(<res-0-"$line"-0)
    real_line=$(( line + 1 ))
    prinft "%s" "${real_line}s/.$/ ${res}/" >> myscript.sed
done < res_numbers_sorted.tmp

次に、次のようにします。

sed -i -f myscript.sed field.txt

これにより、大容量ファイルに対して一度だけ繰り返すことができます。これが役立つ場合は教えてください。

Answer

sedスクリプトを作成したら、ファイルに一度だけ適用してみてくださいfield.txt。

while IFS='' read -r line; do
    res=$(<res-0-"$line"-0)
    real_line=$(( line + 1 ))
    prinft "%s" "${real_line}s/.$/ ${res}/" >> myscript.sed
done < res_numbers_sorted.tmp

次に、次のようにします。

sed -i -f myscript.sed field.txt

これにより、大容量ファイルに対して一度だけ繰り返すことができます。これが役立つ場合は教えてください。

結果を収集するために多数のファイル（300,000以上）を処理するより効率的な方法は何ですか？

答え1

答え2

関連情報