次の形式の出力が必要です。
たとえば、入力ファイルの1から50までの数値シーケンスを考えてみましょう。各数字はデータ行を表します。
$ cat input.txt
1
2
3
.
.
.
49
50
私はそれらがそれぞれ10行の5つのファイルにあることを望みます。
$ cat output1.txt
1
2
.
.
.
9
10
$ cat output2.txt
11
12
.
.
.
19
20
など。コマンドを使用せずにBashスクリプトを介してこれを実行したいと思いますsplit
。
答え1
離れてawk
いる:
awk -va=1 '{ print > a; if(NR % 10 ==0){a++} }' input
1
これで2
ファイルが作成され3
ます4
。 55
で印刷するには、output1
次の代わりに使用します。
awk -va=1 '{ print > "output"a; if(NR % 10 ==0){a++} }' input
説明する
-va=1
:変数a
をに設定します1
。print > "output"a;
:現在の行をファイル名output
と変数の現在の値として印刷しますa
。if(NR % 10 ==0){a++}
:NR
現在行番号です。したがってNR
、が倍数の場合10
(NR
モジュロ10が0の場合)、a
変数値に1を追加します。これにより、出力ファイルの番号付けが必要に応じて変更されます。
答え2
明らかにあなたはsplit
(https://stackoverflow.com/questions/2016894/how-to-split-a-large-text-file-into-smaller-files-with-equal-number-of-lines) ただし、ループを代わりに使用するには:
numLines=$(cat input.txt | wc -l)
size=50
n=$(( numLines / size ))
for (( i=0; i<n; i++ )); do
j=$(( i*size + 1 ))
tail -n +$j input.txt | head -n $size > output_$i.txt
done
1行形式:
numLines=$(cat input.txt | wc -l); for (( i=0; i<$(( numLines / 50 )); i++ )); \
do tail -n +$(( i*50 + 1)) input.txt | head -n 50 > output_$i.txt; done