awkで複数の列の累積合計を取得するには？

Question 1

このような作業には、次のようなより専門的なツールが好まれます。datamash

$ datamash -t '|' -g 1 sum 2 sum 3 sum 4 < file
KALPESH|1000|1400|1800

またはcsvsqlツールcsvkit:

$ csvsql -H -d'|' --query '
    select a,sum(b),sum(c),sum(d) from file group by a' file | csvformat -D'|'

a|sum(b)|sum(c)|sum(d)
KALPESH|1000|1400|1800

Answer

このような作業には、次のようなより専門的なツールが好まれます。datamash

$ datamash -t '|' -g 1 sum 2 sum 3 sum 4 < file
KALPESH|1000|1400|1800

またはcsvsqlツールcsvkit:

$ csvsql -H -d'|' --query '
    select a,sum(b),sum(c),sum(d) from file group by a' file | csvformat -D'|'

a|sum(b)|sum(c)|sum(d)
KALPESH|1000|1400|1800

Question 2

datamash私は原則として@plumoを使用しますが、OPリクエストに固執し、友達がいると仮定するawkので、入力ファイルは次のようになります.KALPESHRAJESH

KALPESH|100|200|300
KALPESH|200|300|400
RAJESH|300|400|500
RAJESH|400|500|599
KALPESH|300|400|500
KALPESH|400|500|600
RAJESH|100|200|300
RAJESH|200|300|400

それから

awk -F\| '{
    flds=(NF>flds)?NF:flds; 
    nm[$1]=$1;
    for (f=2; f<=NF; f++) sum[$1"|"f]+=$f
  }END{
    for (n in nm) {printf "%s", n;
      for (f=2; f<=flds; f++) printf "%s", FS sum[n"|"f]; print""
  }
}' file

KALPESH|1000|1400|1800
RAJESH|1000|1400|1799

KALPESH別個でフィールド数が一定の場合、これは次のように縮小されます。

awk -F\| '{
    for (f=2; f<=4; f++) sum[f]+=$f
  }END{
    printf "%s", "KALPESH";
      for (f=2; f<=4; f++) printf "%s", FS sum[f]; print""
  }' file

それとも

awk -F\| '{s2+=$2; s3+=$3; s4+=$4}END{print "KALPESH" FS s2 FS s3 FS s4}' file

Answer