繰り返しパターンがあるリストに基づいて、テキストファイルから複数行を抽出します。

Question 1

これを行う1つの方法は次のとおりですawk（source.txtメモリの問題が発生するほど大きくないと仮定します）。

$ awk 'NR==FNR{a[$1]=$0; next} $0 in a{print a[$0]}' source.txt list.txt
aaa text
ccc text
ccc text
ccc text
eee text
eee text

NR==FNR{a[$1]=$0; next}次に、最初のフィールドをキーにし、入力行全体を値として配列を作成します（source.txtこの場合は最初のファイルの場合）。
$0 in a{print a[$0]}list.txtファイルを処理するときは、各行が配列のキーとして存在することを確認し、その行をa印刷します。

以下は、メモリ側でより良いパフォーマンスを発揮する修正されたソリューションです（行にsource.txt単一のスペースで区切られた2つのフィールドがあると仮定）。

awk 'NR==FNR{a[$1]=$2; next} $0 in a{print $0, a[$0]}'

行全体ではなく、2番目のフィールドのみが配列に格納されます。印刷したら、キーの前に貼ります。

Answer

これを行う1つの方法は次のとおりですawk（source.txtメモリの問題が発生するほど大きくないと仮定します）。

$ awk 'NR==FNR{a[$1]=$0; next} $0 in a{print a[$0]}' source.txt list.txt
aaa text
ccc text
ccc text
ccc text
eee text
eee text

NR==FNR{a[$1]=$0; next}次に、最初のフィールドをキーにし、入力行全体を値として配列を作成します（source.txtこの場合は最初のファイルの場合）。
$0 in a{print a[$0]}list.txtファイルを処理するときは、各行が配列のキーとして存在することを確認し、その行をa印刷します。

以下は、メモリ側でより良いパフォーマンスを発揮する修正されたソリューションです（行にsource.txt単一のスペースで区切られた2つのフィールドがあると仮定）。

awk 'NR==FNR{a[$1]=$2; next} $0 in a{print $0, a[$0]}'

行全体ではなく、2番目のフィールドのみが配列に格納されます。印刷したら、キーの前に貼ります。

Question 2

xargs重い負荷を積むもう一つの方法。

$ grep -v "^$" list.txt | xargs -I{} grep "^{} " source.txt
aaa text
ccc text
ccc text
ccc text
eee text
eee text
$

Answer

xargs重い負荷を積むもう一つの方法。

$ grep -v "^$" list.txt | xargs -I{} grep "^{} " source.txt
aaa text
ccc text
ccc text
ccc text
eee text
eee text
$

関連情報