両方のファイルを比較し、一致、重複、および一致しない出力を表示します。

両方のファイルを比較し、一致、重複、および一致しない出力を表示します。

ファイルが2つありますが、

ファイル1->

abc=3
abc=3
dfg=6
ggg=7

ファイル2->

abc=3
dfg=4
sdf=9

file3の出力が次のようになります。

File2,File1,Result
abc=3,abc=3,Match
dfg=4,dfg=6,NoMatch
sdf=9,,NotPresent
,abc=3,Duplicate

私は現在、次のスクリプトを持っています。

grep -E 'abc|dfg|sdf' file1 >> file3
comm  <( sort -n file2 ) <( sort -n file3 ) |awk -F$'\t' 'BEGIN { OFS="," } $3 { print $3, $3, "MATCH"; next } { print $1, $2, "NO MATCH" }' > final_result.txt

出力は次のとおりです。

abc=3,abc=3,MATCH
,abc=3,NO MATCH
dfg=4,,NO MATCH
,dfg=6,NO MATCH
sdf=9,,NO MATCH

file2の値がfile1の値と一致しない場合、出力は空白になります。たとえば、dfg = 4、、NO MATCHとdfg = 6、NO MATCHの唯一の違いは、値が4から6に変更されたことです。出力が欲しいです。

dfg=4,dfg=6,NoMatch 

変える

dfg=4,,NO MATCH
,dfg=6,NO MATCH

そして、

abc=3

2回表示されますが、次のように表示されます。

,abc=3,NO MATCH

欲しいです。

abc=3,,Duplicate

どんな助けでも大変感謝します。

答え1

bash-4.1$ cat file1
abc=3
abc=3
dfg=6
ggg=7

bash-4.1$ cat file2
abc=3
dfg=4
sdf=9


bash-4.1$ awk 'NR==FNR{split($0,B,"=");Brr[B[1]]=$0;Arr[$0]++;next}($0 in Arr){print $0","$0",Match";next}split($0,C,"=")(C[1] in Brr){print Brr[C[1]]","$0",NoMatch"}END{for (i in Arr)if(Arr[i]>1){print i",,Duplicate"}}' file1 file2
abc=3,abc=3,Match
dfg=6,dfg=4,NoMatch
,sdf=9,NoMatch
abc=3,,Duplicate

関連情報