特定の列のみを比較して、2つのCSVをマージします。

Question

awkを使うのはとても簡単です：

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

old.csvファイルの2番目のフィールドを「old」という配列に保存し、new.csvファイルの場合、2番目のフィールドは「old」配列にないレコードを印刷します。

実際、これは引用符の中のパイプ文字を尊重しません。そのために、私はRubyのcsvモジュールが好きです。

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

Answer 1

awkを使うのはとても簡単です：

$ awk -F'|' 'NR == FNR {old[$2]; next} !($2 in old)' old.csv new.csv
"glider"|"person"|"airport"
"glider"|"person2"|"airport"

old.csvファイルの2番目のフィールドを「old」という配列に保存し、new.csvファイルの場合、2番目のフィールドは「old」配列にないレコードを印刷します。

実際、これは引用符の中のパイプ文字を尊重しません。そのために、私はRubyのcsvモジュールが好きです。

ruby -rcsv  -e '
  old_col2 = []
  old_data = CSV.foreach("./old.csv", :col_sep => "|") do |row|
    old_col2 << row[1]
  end

  CSV.foreach("./new.csv", :col_sep => "|") do |row|
    if not old_col2.include?(row[1])
      puts CSV.generate_line(row, :col_sep => "|", :force_quotes => true)
    end
  end
'

特定の列のみを比較して、2つのCSVをマージします。

答え1

関連情報