CSVパーサーを使用して特定の列に基づいてCSV行を重複排除する
このタスクを検索したところ、次のような古い質問が見つかりました。 指定された列に基づいてCSVから重複エントリを削除する 特定の列に基づいてCSVで一意のレコードを識別する awkしかし、私のデータは複数のネストされた二重引用符を持つ複雑なCSVファイルなので、そうすることはできません。 次のような重複を排除したいとします(単純化された状況)。 Ref,xxx,zzz ref1,"foo, bar, base",qux ref1,"foo, bar, base",bar ref2,aaa,bbb 出力には次のように必要です。 Ref,xxx,zzz r...