awk を使用して、行の残りの部分に基づいて最初の列の値を合計します。

Question 1

これは機能しますが、行の順序を維持しません。

awk '{v=$1; $1=""; s[$0]=s[$0]+v} END {for (r in s) { printf "%s%s\n",s[r],r }}' file

最初のフィールドを変数に保存してから消去します。
（空白）行を含む配列を$1キーとして保存し、保存された合計を$1値として保存します。
最後に配列を印刷します。printf削除することはできず、空になっているので、余分なスペースを避けるために使用します$1。

| sort -k22番目の列を並べ替えるには、追加してください。

出力：

5 A 3 rr 44 5 t y uuu 8
0 B f 1
11 C 6 5 55 yy 7 4 3 4-5 tt efvho 44 3 5 gg 5 4 t rr 33
4 D tt v 44 f1 p

Answer

これは機能しますが、行の順序を維持しません。

awk '{v=$1; $1=""; s[$0]=s[$0]+v} END {for (r in s) { printf "%s%s\n",s[r],r }}' file

最初のフィールドを変数に保存してから消去します。
（空白）行を含む配列を$1キーとして保存し、保存された合計を$1値として保存します。
最後に配列を印刷します。printf削除することはできず、空になっているので、余分なスペースを避けるために使用します$1。

| sort -k22番目の列を並べ替えるには、追加してください。

出力：

5 A 3 rr 44 5 t y uuu 8
0 B f 1
11 C 6 5 55 yy 7 4 3 4-5 tt efvho 44 3 5 gg 5 4 t rr 33
4 D tt v 44 f1 p

Question 2

使用datamashとawk:

重複行は最初の列でのみ異なるため、このdatamashコマンドは機能します。

$ datamash -s -t' ' groupby 2 sum 1 --full <file | 
awk '{$1=$NF; NF -= 1}1'

Answer

使用datamashとawk:

重複行は最初の列でのみ異なるため、このdatamashコマンドは機能します。

$ datamash -s -t' ' groupby 2 sum 1 --full <file | 
awk '{$1=$NF; NF -= 1}1'

Question 3

一度に1行だけメモリに保存し、awkを使用して出力から入力シーケンスを再現します。

$ cat tst.awk
{
    currKey = $0
    sub(/[^[:space:]]+ /,"",currKey)
}
currKey != prevKey {
    if ( NR > 1 ) {
        print prev0
    }
    prevKey = currKey
    prev1 = 0
}
{
    $1 += prev1
    prev1 = $1
    prev0 = $0
}
END {
    print prev0
}

$ awk -f tst.awk file
5 A 3 rr 44 5 t y uuu 8
0 B f 1
11 C 6 5 55 yy 7 4 3 4-5 tt efvho 44 3 5 gg 5 4 t rr 33
4 D tt v 44 f1 p

上記は、重複行が一緒にグループ化されていると仮定しています。そうでない場合は、実行してくださいsort -k2 file | awk '...'。

Answer

一度に1行だけメモリに保存し、awkを使用して出力から入力シーケンスを再現します。

$ cat tst.awk
{
    currKey = $0
    sub(/[^[:space:]]+ /,"",currKey)
}
currKey != prevKey {
    if ( NR > 1 ) {
        print prev0
    }
    prevKey = currKey
    prev1 = 0
}
{
    $1 += prev1
    prev1 = $1
    prev0 = $0
}
END {
    print prev0
}

$ awk -f tst.awk file
5 A 3 rr 44 5 t y uuu 8
0 B f 1
11 C 6 5 55 yy 7 4 3 4-5 tt efvho 44 3 5 gg 5 4 t rr 33
4 D tt v 44 f1 p

上記は、重複行が一緒にグループ化されていると仮定しています。そうでない場合は、実行してくださいsort -k2 file | awk '...'。

awk を使用して、行の残りの部分に基づいて最初の列の値を合計します。

答え1

答え2

答え3

関連情報