Bashスクリプトは1つのファイルを入力として使用し、別のファイルでawkコマンドを実行します。

Question 1

exec 4> "FILE_TO_SEARCH"

問題は、書き込み用にのみファイルを開くが（したがってコンテンツを削除する）、ファイル記述子を読み取り用に使用しようとしていることです。

exec 4< "$FILE_TO_SEARCH"

Answer

exec 4> "FILE_TO_SEARCH"

問題は、書き込み用にのみファイルを開くが（したがってコンテンツを削除する）、ファイル記述子を読み取り用に使用しようとしていることです。

exec 4< "$FILE_TO_SEARCH"

Question 2

私の意見で指摘したように、私たちに何も言わなかったら、ここではstdinとstdout以外のファイル記述子を使用する必要はなく、ファイル名をawkコマンドに渡さない理由もないようです。ライン。

while read同じ入力ファイルで複数回実行するようにシェルループを作成するawkことは、目的のタスクを実行するための非常に悪い方法です。おそらくテキストファイルを処理する最も悪い方法でしょう。 awk（またはsedやPerlなど）で同じことをするよりも数百または数千倍遅くなります。

次のようにしてみてください。

#!/bin/bash

FILE1="$1"
FILE_TO_SEARCH="$2"

awk 'NR==FNR { gsub(/([\\.^$(){}\[\]|*+?])/,"\\\\&",$0);
               if (search == "") {
                 search = $0;
               } else {
                 search = search "|" $0;
               };
               next;
             };

     match($0,search)' "$FILE1" RS='' ORS='\n\n' "$FILE_TO_SEARCH"

（読みやすくするために改行とインデントを追加しました。この操作のawk部分もすべて1行に圧縮しました。）

$FILE_TO_SEARCHこれにより、検索パターンに一致するすべてのレコードが印刷されます$FILE1。

$FILE1デフォルト＆を使用してRS最初のファイル（）を読み、ORSここで正規表現検索パターンを設定します。このgsub()関数呼び出しは、検索パターンに各行を追加する前に、すべての正規表現メタ文字をバックスラッシュにエスケープするために使用されます。つまり、すべての行は固定文字列として扱われます。各行を正規表現にするには、以下の2番目のバージョンを参照してください。

上記の例では、$FILE1検索パターンは次のようになります。

hostAbC|host123|host345|hostMos|hostDef

次に、RS=''とを使用してORS='\n\n'2番目のファイル（$FILE_TO_SEARCH）を読み取り、検索パターンに一致するすべてのレコードを印刷します。

$FILE1各行を固定文字列ではなく正規表現として解釈するには、次のバージョンを使用できます。

#!/bin/bash

FILE1="$1"
FILE_TO_SEARCH="$2"

awk 'NR==FNR { if (search == "") {
                 search = "(" $0 ")" ;
               } else {
                 search = search "|(" $0 ")";
               };
               next;
             };

     match($0,search)' "$FILE1" RS='' ORS='\n\n' "$FILE_TO_SEARCH"

このバージョンの検索パターンの例は次のとおりです。

(hostAbC)|(host123)|(host345)|(hostMos)|(hostDef)

このバージョンでは、何も一致しない、または一致しすぎる壊れた検索パターンを簡単に構築できます。 $ FILE1でリテラル文字列として解釈する正規表現メタ文字をエスケープするには、バックスラッシュを使用する必要があります。たとえば、テキストを一致させるには、その|テキストをファイルに含める必要があります。それ以外の場合は、正規表現代替演算子\|として解釈されます。OR

Answer