ファイルの一意の行数を取得するには？

Question 1

順序が重要な場合：

awk '!($1 in sum) {f[n++] = $1}
     {sum[$1] += $2}
     END {for (i = 0; i < n; i++) print f[i], sum[f[i]]}' < file

そうでない場合は、次のように単純化できます。

awk '{sum[$1] += $2}
     END {for (f in sum) print f, sum[f]}' < file

Answer

順序が重要な場合：

awk '!($1 in sum) {f[n++] = $1}
     {sum[$1] += $2}
     END {for (i = 0; i < n; i++) print f[i], sum[f[i]]}' < file

そうでない場合は、次のように単純化できます。

awk '{sum[$1] += $2}
     END {for (f in sum) print f, sum[f]}' < file

Question 2

使用datamash:

datamash groupby 1 sum 2 <infile.txt

Answer

使用datamash:

datamash groupby 1 sum 2 <infile.txt

Question 3

perl -lane '
   exists $h{$F[0]} or push @h, $F[0];
   $h{$F[0]} += $F[1];
   END { print "$_\t$h{$_}" for @h; }
' yourfile

上記のコードは、キーストロークが発生した順序で印刷します。配列はキーの順序を維持しますが、ハッシュは各キーに対応する合計を保持します。

Answer

perl -lane '
   exists $h{$F[0]} or push @h, $F[0];
   $h{$F[0]} += $F[1];
   END { print "$_\t$h{$_}" for @h; }
' yourfile

上記のコードは、キーストロークが発生した順序で印刷します。配列はキーの順序を維持しますが、ハッシュは各キーに対応する合計を保持します。

関連情報