CSVから列の重複行を削除するBashコマンド/スクリプト

Question 1

awk -F, '!seen[$1]++'

$1は最初の列です。適切に変更すると、[$1,$3]カンマ（）で区切られた複数の列を使用することも、$0行全体を使用することもできます。

Answer

awk -F, '!seen[$1]++'

$1は最初の列です。適切に変更すると、[$1,$3]カンマ（）で区切られた複数の列を使用することも、$0行全体を使用することもできます。

Question 2

Bashは難しいですが、BashでPerlを呼び出すことはできますか？フィールドがカンマで区切られ、キーフィールドが2番目のフィールドである場合

$ cat a.csv
11,22,33
214,22,354
6,6,6
4,5,7
1,22,1

2番目の列がまだ表示されていない場合は、次の行が印刷されます。

$ perl -ne '$value = (split /,/)[1]; print unless $x{$value}++;' a.csv 
11,22,33
6,6,6
4,5,7

[1]は列番号で、0から始まります。

Answer

Bashは難しいですが、BashでPerlを呼び出すことはできますか？フィールドがカンマで区切られ、キーフィールドが2番目のフィールドである場合

$ cat a.csv
11,22,33
214,22,354
6,6,6
4,5,7
1,22,1

2番目の列がまだ表示されていない場合は、次の行が印刷されます。

$ perl -ne '$value = (split /,/)[1]; print unless $x{$value}++;' a.csv 
11,22,33
6,6,6
4,5,7

[1]は列番号で、0から始まります。

Question 3

一部のフィールドに引用符に区切り文字が含まれている場合（Ruby 1.8では使用できません）：

$ ruby -rcsv -e 'puts CSV.parse($<).uniq{|l|l[1]}.map(&:to_csv)' <<< $'"1,9",3\n4,8\n7,3'
"1,9",3
4,8

Answer

一部のフィールドに引用符に区切り文字が含まれている場合（Ruby 1.8では使用できません）：

$ ruby -rcsv -e 'puts CSV.parse($<).uniq{|l|l[1]}.map(&:to_csv)' <<< $'"1,9",3\n4,8\n7,3'
"1,9",3
4,8

関連情報