固有のチェックサムを持つ行

Question 1

あなたが指定したように（しかしあなたの質問に対するwurtelのコメントを考慮してください）：

generate_keys A > B   # adjust this call however that program is defined to work

awk '
  NR==FNR { a[NR]=$1 ; next }
  !b[$1]++ { print a[FNR] }
' A B

Answer

あなたが指定したように（しかしあなたの質問に対するwurtelのコメントを考慮してください）：

generate_keys A > B   # adjust this call however that program is defined to work

awk '
  NR==FNR { a[NR]=$1 ; next }
  !b[$1]++ { print a[FNR] }
' A B

Question 2

一部のサンプルデータがないとテストできませんが、次のようになります。

paste <(generate-keys "$filename") "$filename" |
awk '! seen[$1]++ {print $2}'

Answer

一部のサンプルデータがないとテストできませんが、次のようになります。

paste <(generate-keys "$filename") "$filename" |
awk '! seen[$1]++ {print $2}'

Question 3

$ getkeys A > B
$ sort B | uniq -c | awk '{if($1 == 1) print $2}' > C
$ paste B A | fgrep -f C | cut -f2-

説明する：

まず、各行のキーを生成します。

次に、各キーが表示される回数を数え、一度表示されるキーをファイルCに保存します。

次に、pasteこの行を一意のキーリストと一致させ、そのfgrep行のみを選択するために使用します（キーを省略）cut。

Cの文字列はaで始まり、^notgrepを使用してコアであるfgrep行の先頭にのみ一致するようにするのが良いでしょう。しかし、md5sumのようなものであれば、間違った一致の可能性は希薄です。 (そして私は怠惰です:-))

Answer

$ getkeys A > B
$ sort B | uniq -c | awk '{if($1 == 1) print $2}' > C
$ paste B A | fgrep -f C | cut -f2-