awk比較のための配列の使用

Question 1

awk私はあなたがコマンドでそれをしたい理由を理解していません。あなたが持っているものはかなりよさそうです。とにかく1つの方法は次のとおりです。

$ awk -F, '(max[$18]<$21 || max[$18]==""){max[$18]=$21;line[$18]=$0}
            END{for(key in line){print line[key]}}' file
6598,6598,0,1,,1,0,1,1,0,0,0,1,0,0,0,0,1390,1390,,0.730000,
1297,1297,0,0,,0,0,1,0,0,0,0,0,1,0,1,0,1707,1707,,7.000000,
6553,6553,0,1,,1,0,1,1,0,0,0,0,1,0,1,0,4326,4326,,9.000000,

アイデアは簡単です。キーと値のmax2つの配列があります。各行に保存された値が小さい場合、または保存された値がない場合は、現在の行（）を配列の値として保存します。最後に、ブロックから配列を印刷します。$18$21$18$21$18$0$18lineEND{}line

上記のスクリプトはそれを$18文字列として扱います。したがって001、とは1別の文字列として扱われます。

Answer

awk私はあなたがコマンドでそれをしたい理由を理解していません。あなたが持っているものはかなりよさそうです。とにかく1つの方法は次のとおりです。

$ awk -F, '(max[$18]<$21 || max[$18]==""){max[$18]=$21;line[$18]=$0}
            END{for(key in line){print line[key]}}' file
6598,6598,0,1,,1,0,1,1,0,0,0,1,0,0,0,0,1390,1390,,0.730000,
1297,1297,0,0,,0,0,1,0,0,0,0,0,1,0,1,0,1707,1707,,7.000000,
6553,6553,0,1,,1,0,1,1,0,0,0,0,1,0,1,0,4326,4326,,9.000000,

アイデアは簡単です。キーと値のmax2つの配列があります。各行に保存された値が小さい場合、または保存された値がない場合は、現在の行（）を配列の値として保存します。最後に、ブロックから配列を印刷します。$18$21$18$21$18$0$18lineEND{}line

上記のスクリプトはそれを$18文字列として扱います。したがって001、とは1別の文字列として扱われます。

Question 2

uniq代わりに使用するのが少し速いですawk。

sort -t, -k18,18nr -k21,21nr | uniq -s39 -w4

Answer

uniq代わりに使用するのが少し速いですawk。

sort -t, -k18,18nr -k21,21nr | uniq -s39 -w4

Question 3

次のことを試すことができますawk。

awk -F"," '{ if (max[$18] < $21) { max[$18] = $21; x[$18] = NR; } z[NR] = $0; } END { for (i in x) print z[x[i]]; }' file

列キーと行番号キーを持つmax3つの配列を使用します。最大値、最大値を含む行数、ファイルの各行を保存します。配列の各キーのブロック内に値を印刷します。このソリューションはファイル全体をメモリに読み込むため、大容量ファイルでは機能しません。 x$18zmaxxzENDxz[x[i]]

Answer

次のことを試すことができますawk。

awk -F"," '{ if (max[$18] < $21) { max[$18] = $21; x[$18] = NR; } z[NR] = $0; } END { for (i in x) print z[x[i]]; }' file

列キーと行番号キーを持つmax3つの配列を使用します。最大値、最大値を含む行数、ファイルの各行を保存します。配列の各キーのブロック内に値を印刷します。このソリューションはファイル全体をメモリに読み込むため、大容量ファイルでは機能しません。 x$18zmaxxzENDxz[x[i]]

awk比較のための配列の使用

答え1

答え2

答え3

関連情報