2つの共通フィールドに2つのファイルを結合します。

Question 1

awk -F'|' 'NR==FNR{e[$2$1]=1;next};e[$4$8]' file2.txt file1.txt

最初の読書ファイル2e[field2+field1]次に配列を設定します。ファイル1e[field4+field8]設定されているかどうかを印刷します。

またはフィールドを反転します。

awk -F'|' 'NR==FNR{e[$1$2]=1;next};e[$8$4]' file2.txt file1.txt

Answer

awk -F'|' 'NR==FNR{e[$2$1]=1;next};e[$4$8]' file2.txt file1.txt

最初の読書ファイル2e[field2+field1]次に配列を設定します。ファイル1e[field4+field8]設定されているかどうかを印刷します。

またはフィールドを反転します。

awk -F'|' 'NR==FNR{e[$1$2]=1;next};e[$8$4]' file2.txt file1.txt

Question 2

質問にタグが付けられました。アッしかし、私の考えはあなたがそうではないことに注意する価値があると思います。持つこんなことをしたりしたawk。 coreutilsにはこの種の操作に便利なユーティリティがありますが、joinデータには少し面倒です。

あなたのシェルがbashとGNUのcoreutilsであると仮定します。これはさまざまなスタイルで実行できますが、データの事前/後処理がより必要になる可能性があります。

もう面倒はありません。

join -t"|" -14 -22 -o"$(echo 1.{1..8} 2.1)" \
  <(sort -t"|" -k4 file1.txt) \
  <(sort -t"|" -k2 file2.txt) \
  | grep -Po ".*([\d]+)(?=\|\1$)"

join-12つの入力ファイルを受け入れ、引数を介して渡されたフィールドにそれを連結します-2。 -t入力ファイルのユーザー定義フィールド区切り文字を表します。 join入力ファイルは関連するフィールドでソートする必要があるため、両方の入力ファイルに渡される前にプロセスオーバーライドでソートされますjoin。この-oパラメーターは、フィールドの出力方法を指定します。デフォルトではリンクされたフィールドで、その後にファイル 1 の未接続フィールド、最後にファイル 2 のリンクされていないフィールドがあります。したがって、ファイル1のすべてのフィールドを順番に指定し、その後にフィールド1が続くように指定する必要があります。ファイル2の

また、結合はfile1のフィールド8とfile1のフィールド1になければなりません。これは、結合出力フィールド 8 と 9 が等しい場合、行を検索することによって簡単に行われます。正規表現プレビューを使用すると、grep -Poこれを実行してフィールド9を効果的に削除して、目的の出力を提供できます。出力は次のとおりです

78Z|696931836|0000001|ANT09|2160203|A|1114450|2222222222
78Z|011512345|0000001|ANT09|2160218|D|0319230|4444444444
78Z|033333157|0000001|ANT10|2160208|A|1900460|3333333311
78Z|099999999|0000001|ANT32|2160219|A|0319000|6666666666
78Z|010041586|0000001|ANT33|2160119|A|1835100|3333333333
78Z|012344052|0000001|ANT50|2160203|A|1219570|5555555555

Answer

質問にタグが付けられました。アッしかし、私の考えはあなたがそうではないことに注意する価値があると思います。持つこんなことをしたりしたawk。 coreutilsにはこの種の操作に便利なユーティリティがありますが、joinデータには少し面倒です。

あなたのシェルがbashとGNUのcoreutilsであると仮定します。これはさまざまなスタイルで実行できますが、データの事前/後処理がより必要になる可能性があります。

もう面倒はありません。

join -t"|" -14 -22 -o"$(echo 1.{1..8} 2.1)" \
  <(sort -t"|" -k4 file1.txt) \
  <(sort -t"|" -k2 file2.txt) \
  | grep -Po ".*([\d]+)(?=\|\1$)"

join-12つの入力ファイルを受け入れ、引数を介して渡されたフィールドにそれを連結します-2。 -t入力ファイルのユーザー定義フィールド区切り文字を表します。 join入力ファイルは関連するフィールドでソートする必要があるため、両方の入力ファイルに渡される前にプロセスオーバーライドでソートされますjoin。この-oパラメーターは、フィールドの出力方法を指定します。デフォルトではリンクされたフィールドで、その後にファイル 1 の未接続フィールド、最後にファイル 2 のリンクされていないフィールドがあります。したがって、ファイル1のすべてのフィールドを順番に指定し、その後にフィールド1が続くように指定する必要があります。ファイル2の

また、結合はfile1のフィールド8とfile1のフィールド1になければなりません。これは、結合出力フィールド 8 と 9 が等しい場合、行を検索することによって簡単に行われます。正規表現プレビューを使用すると、grep -Poこれを実行してフィールド9を効果的に削除して、目的の出力を提供できます。出力は次のとおりです

78Z|696931836|0000001|ANT09|2160203|A|1114450|2222222222
78Z|011512345|0000001|ANT09|2160218|D|0319230|4444444444
78Z|033333157|0000001|ANT10|2160208|A|1900460|3333333311
78Z|099999999|0000001|ANT32|2160219|A|0319000|6666666666
78Z|010041586|0000001|ANT33|2160119|A|1835100|3333333333
78Z|012344052|0000001|ANT50|2160203|A|1219570|5555555555

Question 3

単純に、同じ最初のフィールドがfile2に2回提供されることは許可されていないとします。

awk -F'|' 'FNR == NR { key[$1] = $2; next } $8 in key && key[$8] == $4' file2.txt file1.txt

Answer

単純に、同じ最初のフィールドがfile2に2回提供されることは許可されていないとします。

awk -F'|' 'FNR == NR { key[$1] = $2; next } $8 in key && key[$8] == $4' file2.txt file1.txt

Question 4

努力する

awk 'BEGIN { FS="|"}
     FNR == NR { key[$2 $1]=NR }
     FNR > NR { k=$3 $8 ;if (k in key)  print ;} ' file2.txt file1.txt

どこ

BEGIN { FS="|"}区切り文字として使用するようにawに指示します（コマンドラインで使用可能|）。-F\|
FNR == NR { key[$2 $1]=NR }ファイルのキーを記憶する（file2.txtにある場合）
FNR > NR { k=$4 $8 ;if (k in key) print ;}キーがハッシュリストにある場合は印刷してください。

編集：3番目のフィールドに言及し、4番目のフィールドを追加しました。

Answer

努力する

awk 'BEGIN { FS="|"}
     FNR == NR { key[$2 $1]=NR }
     FNR > NR { k=$3 $8 ;if (k in key)  print ;} ' file2.txt file1.txt

どこ

BEGIN { FS="|"}区切り文字として使用するようにawに指示します（コマンドラインで使用可能|）。-F\|
FNR == NR { key[$2 $1]=NR }ファイルのキーを記憶する（file2.txtにある場合）
FNR > NR { k=$4 $8 ;if (k in key) print ;}キーがハッシュリストにある場合は印刷してください。

編集：3番目のフィールドに言及し、4番目のフィールドを追加しました。

2つの共通フィールドに2つのファイルを結合します。

答え1

答え2

答え3

答え4

関連情報