他の列の変数に基づいて列の値の合計を取得するには？ [コピー]

Question 1

あなたはかなり近いです。何が間違っているのか知っていますか？ 3つを維持する必要がありましたが、各列1の値に対して1つの合計を維持しました。

これは次のようになります。イニアンの答えただし、必要な数の列を処理するように簡単に拡張できます。

awk -F"\t" '{for(n=2;n<=NF; ++n) a[$1][n]+=$n}
        END {for(i in a) {
                printf "%s", i
                for (n=2; n<=4; ++n) printf "\t%s", a[i][n]
                printf "\n"
             }
        }'

Inianの答えのような3つの配列ではなく、1つの2D配列を保持します。

Answer

あなたはかなり近いです。何が間違っているのか知っていますか？ 3つを維持する必要がありましたが、各列1の値に対して1つの合計を維持しました。

これは次のようになります。イニアンの答えただし、必要な数の列を処理するように簡単に拡張できます。

awk -F"\t" '{for(n=2;n<=NF; ++n) a[$1][n]+=$n}
        END {for(i in a) {
                printf "%s", i
                for (n=2; n<=4; ++n) printf "\t%s", a[i][n]
                printf "\n"
             }
        }'

Inianの答えのような3つの配列ではなく、1つの2D配列を保持します。

Question 2

ファイルがタブで区切られている限り、データ混合これにぴったりです。

$ datamash groupby 1 sum 2 sum 3 sum 4 < tablefilepath
abc     1       1       1
bcd     14      25      7
cde     20      11      35

Datamashは-t <delimiter>。ただし、タブはあなたが提供したサンプル入力に最も近いようです。

データ統合に慣れるこれは、入力が任意のスペースで区切られている場合に機能します（たとえば、タブのように見えるように意図された複数のスペースがある可能性があります）。それにもかかわらず、データが次のように見えても、datamashが期待する形式に簡単に統合できます。

sed -i 's/ \+/\t/g' tablefilepath

Answer

ファイルがタブで区切られている限り、データ混合これにぴったりです。

$ datamash groupby 1 sum 2 sum 3 sum 4 < tablefilepath
abc     1       1       1
bcd     14      25      7
cde     20      11      35

Datamashは-t <delimiter>。ただし、タブはあなたが提供したサンプル入力に最も近いようです。

データ統合に慣れるこれは、入力が任意のスペースで区切られている場合に機能します（たとえば、タブのように見えるように意図された複数のスペースがある可能性があります）。それにもかかわらず、データが次のように見えても、datamashが期待する形式に簡単に統合できます。

sed -i 's/ \+/\t/g' tablefilepath

Question 3

awk1を基準に2～4列の合計を出します。

awk -v FS="\t" -v OFS="\t" '{ col1[$1]+=$2; col2[$1]+=$3; col3[$1]+=$4; next } END { for ( i in col1) print i, col1[i], col2[i], col3[i]  }' file

Answer

awk1を基準に2～4列の合計を出します。

awk -v FS="\t" -v OFS="\t" '{ col1[$1]+=$2; col2[$1]+=$3; col3[$1]+=$4; next } END { for ( i in col1) print i, col1[i], col2[i], col3[i]  }' file

他の列の変数に基づいて列の値の合計を取得するには？ [コピー]

答え1

答え2

答え3

関連情報