異なるファイルの2列の単語を比較してインポートします。

Question 1

awk 'NR==FNR {a[$1]; next} $2 in a' file1 file2
333 ttt
444 kkk

上記は欲しいものです。to compare column 1 of file1 to column 2 of file2. If there are any common entries, I want to print the match lines from file2

Answer

awk 'NR==FNR {a[$1]; next} $2 in a' file1 file2
333 ttt
444 kkk

上記は欲しいものです。to compare column 1 of file1 to column 2 of file2. If there are any common entries, I want to print the match lines from file2

Question 2

awk2つのフィールドをキーとして使用するため失敗しますが、フィールドはfile11つだけなので、2つのフィールドは配列cに表示されません。また、-Fフィールド区切り文字を提供しますが、実際にはフィールド区切り文字を提供しないオプションを使用しています。これは、フィールド区切り文字がawkスクリプト自体になることを意味します。

awk -F 'script' file

あなたが試している作業バージョンは次のとおりですawk。

$ awk  'NR==FNR{c[$1]++;next};c[$2] ' file1 file2
333 ttt
444 kkk

必要以上のメモリを使用しないより効率的なバージョンは次のとおりです。

$ awk  'NR==FNR{c[$1]}; $2 in c' file1 file2 
333 ttt                 
444 kkk

joinまた、このオプションを誤用しました-t。-F同様にawk、-t引数を受け取りますが、引数を提供しません。次に、join入力をソートするように求められます。あなたの方法の動作バージョンは次のとおりですjoin。

$ join  -1 1 -2 2 -o 2.1,2.2 <(sort file1) <(sort -k2 file2)
444 kkk
333 ttt

Answer

awk2つのフィールドをキーとして使用するため失敗しますが、フィールドはfile11つだけなので、2つのフィールドは配列cに表示されません。また、-Fフィールド区切り文字を提供しますが、実際にはフィールド区切り文字を提供しないオプションを使用しています。これは、フィールド区切り文字がawkスクリプト自体になることを意味します。

awk -F 'script' file

あなたが試している作業バージョンは次のとおりですawk。

$ awk  'NR==FNR{c[$1]++;next};c[$2] ' file1 file2
333 ttt
444 kkk

必要以上のメモリを使用しないより効率的なバージョンは次のとおりです。

$ awk  'NR==FNR{c[$1]}; $2 in c' file1 file2 
333 ttt                 
444 kkk

joinまた、このオプションを誤用しました-t。-F同様にawk、-t引数を受け取りますが、引数を提供しません。次に、join入力をソートするように求められます。あなたの方法の動作バージョンは次のとおりですjoin。

$ join  -1 1 -2 2 -o 2.1,2.2 <(sort file1) <(sort -k2 file2)
444 kkk
333 ttt

Question 3

使用csvjoin（ツールセットの一部csvkit）：

file1 が次のようになるとします。

x
abc
123
ttt
kkk

file2 は次のようになります。

y x
111 wed
222 kad
333 ttt
444 kkk

次のコマンドを使用できます。

csvjoin -d' ' -c x file{2,1} | tr ',' ' '

-d' '区切り文字としてスペースを使用します。
-c xcsvjoinは列を使用してファイルを結合しますx。

@terdonがヘッダーのないファイルの上記のコマンドを修正しました。コマンドは次のように変更できます。

csvjoin -H -d ' ' -c 2,1 fil{2,1} | tr ',' ' ' | tail -n +2

上記のコマンドは、-Hヘッダー（パラメータ）を持たないファイルに対して機能します。

コマンドはtail2番目のレコード（）から出力を開始します+2。これはcsvjoin、コマンドが出力の先頭に新しいヘッダー行を追加するためです。

Answer