awk は配列を前の行の配列と比較します。

Question

コメントにURLとして提供される入力データはタブで区切られます。これは、タブで区切られた最初のフィールドを一種の「キー」で解析して他の行と比較できることを意味します。実際、私たちはいいえ最初のフィールドのスペースで区切られた単語に注意する必要がありますが、最初のフィールド全体を単一のエンティティとして扱うことができます。

BEGIN { OFS = FS = "\t" }

{
    count = $(NF - 1)
    key = $1
}

key != previous {
    if (previous != "")
        print previous, sum

    sum = 0
}

{
    sum += count
    previous = key
}

END {
    if (previous != "")
        print previous, sum
}

プログラムawkは「count」フィールド（2番目のフィールド）を解析し、count後で前の行のキーと比較できるように最初のフィールドを「キー」として使用します。これは、このブロックBEGIN（入力と出力の区切り記号のみを設定）の後の最初のブロックです。

キーが前の行のキーと異なる場合、これは別の単語セットを見ていることを意味します。前の行のキーと合計を出力し、合計をリセットします。

すべての行について、その行の数に合計を追加して更新しますprevious（今行が完了したので、key次の行になりますprevious）。

最後に、データの最後の行情報を出力します。

を使用して実行できますawk -f script.awk inputfile。

「一行」で：

awk -F '\t' 'BEGIN{OFS=FS} {c=$(NF-1);k=$1} k!=p {if(p!="")print p,s;s=0} {s+=c;p=k} END {if(p!="") print p,s}' file

Answer 1