重複したエントリを持つ2つの異なるファイルでvlookupが必要です。
ファイル1
abc 10
xyz 20
bhy 30
hgf 40
ファイル2
a abc
b xyz
c bhy
d abc
e abc
f xyz
希望の出力:
abc 10 a,d,e
xyz 20 b,f
bhy 30 c
hgf 40 Not_Available
答え1
Awk
解決策:
awk 'NR == FNR { a[$1] = $2 OFS; next }
$2 in a { a[$2] = a[$2] (a[$2] ~ /\t$/? "" : ",") $1 }
END { for (i in a) print i, a[i] }' OFS='\t' file1 file2
出力:
bhy 30 c
abc 10 a,d,e
xyz 20 b,f
最後の条件については、次の修正を使用してください。
awk 'NR == FNR { a[$1] = $2 OFS; next }
$2 in a { a[$2] = a[$2] (a[$2] ~ /\t$/? "" : ",") $1 }
END {
for (i in a) print i, a[i] (a[i] ~ /\t$/? "Not_Available" : "")
}' OFS='\t' file1 file2
答え2
awkを使う
awk -v OFS='\t' '
NR == FNR {val[$1]=$2; next}
{items[$2] = items[$2] " " $1}
END {
for (a in val) {
sub(/^ /, "", items[a])
gsub(/ /, ",", items[a])
print a, val[a], items[a]
}
}
' file1 file2
bhy 30 c
abc 10 a,d,e
xyz 20 b,f
並べ替えたい場合は、次のように入力してください。| sort -k2,2n
ちょうど楽しみのために少しPerlトリックを使用しました。
perl -lae '
if ($. == ++$nr) { $val{$F[0]} = $F[1] }
else { push @{$items{$F[1]}}, $F[0] }
} continue {
close ARGV if eof
} END {
printf "%s\t%s\t%s\n", $_, $val{$_}, join(",", @{$items{$_}}) for keys %items
' file1 file2