Linux は、指定されたファイルセットからのみ文字列を検索します。

Question 1

awkGNUを使用して、次のすべてのことを実行できる必要があります。

find . -type f -print0 |
  gawk '
    step == 1 {files[$0]; next} # record file names in "files" array
    step == 2 {
      # determine which files to look into (added to ARGV array for
      # processing in step 3)
      if ($NF in files) ARGV[ARGC++] = $0; next
    }
    NF {
      # record all matches (here in fields matched by FPAT)
      $1 = $1 # force a rebuild of $0 joining fields with OFS
      matches[FILENAME] = matches[FILENAME] \
                          (matches[FILENAME] == "" ? "" : OFS) \
                          $0
    }
    END {
      for (file in matches)
        print file ": " matches[file]
    }' step=1 searchFiles.txt \
       step=2 RS='\0' FS=/ - \
       step=3 RS='\n' FPAT='[^ ]*_XYZ' OFS=';'

上記では、ファイル名はに保存されますsearchFiles.txt。ファイルの行がサフィックスのリストである場合は、連想配列の代わりに正規表現を作成できます。

find . -type f -print0 |
  gawk '
    step == 1 {
      gsub(/[][^$*()+{}?\\.|]/, "\\\\&") # escape regexp operators
      regex = regex sep $0; sep = "|"
      next
    }
    step == 2 {
      # determine which files to look into (added to ARGV array for
      # processing in step 3)
      if ($NF ~ ("(" regex ")$")) ARGV[ARGC++] = $0; next
    }
    NF {
      # record all matches (here in fields matched by FPAT)
      $1 = $1 # force a rebuild of $0 joining fields with OFS
      matches[FILENAME] = matches[FILENAME] \
                          (matches[FILENAME] == "" ? "" : OFS) \
                          $0
    }
    END {
      for (file in matches)
        print file ": " matches[file]
    }' step=1 searchFiles.txt \
       step=2 RS='\0' FS=/ - \
       step=3 RS='\n' FPAT='[^ ]*_XYZ' OFS=';'

難読化が必要な場合は、1行に入力できます。

find . -type f -print0|gawk '!s{gsub(/[][^$*()+{}?\\.|]/,"\\\\&");r=r p $0;p="|";next};s==2{if($NF~("("r")$"))ARGV[ARGC++]=$0;next};NF{$1=$1;m[FILENAME]=m[FILENAME](m[FILENAME]==""?"":OFS)$0};END{for(f in m)print f":"m[f]}' searchFiles.txt s=2 RS=\\0 FS=/ - s=3 RS=\\n FPAT='[^ ]*_XYZ' OFS=\;

ファイル名と内容に含めることができる文字については想定しません。ただし、その文字はロケールで有効な文字でなければなりません。サフィックスには改行文字を使用できませんが、これはsearchFiles.txt。

Answer

awkGNUを使用して、次のすべてのことを実行できる必要があります。

find . -type f -print0 |
  gawk '
    step == 1 {files[$0]; next} # record file names in "files" array
    step == 2 {
      # determine which files to look into (added to ARGV array for
      # processing in step 3)
      if ($NF in files) ARGV[ARGC++] = $0; next
    }
    NF {
      # record all matches (here in fields matched by FPAT)
      $1 = $1 # force a rebuild of $0 joining fields with OFS
      matches[FILENAME] = matches[FILENAME] \
                          (matches[FILENAME] == "" ? "" : OFS) \
                          $0
    }
    END {
      for (file in matches)
        print file ": " matches[file]
    }' step=1 searchFiles.txt \
       step=2 RS='\0' FS=/ - \
       step=3 RS='\n' FPAT='[^ ]*_XYZ' OFS=';'

上記では、ファイル名はに保存されますsearchFiles.txt。ファイルの行がサフィックスのリストである場合は、連想配列の代わりに正規表現を作成できます。

find . -type f -print0 |
  gawk '
    step == 1 {
      gsub(/[][^$*()+{}?\\.|]/, "\\\\&") # escape regexp operators
      regex = regex sep $0; sep = "|"
      next
    }
    step == 2 {
      # determine which files to look into (added to ARGV array for
      # processing in step 3)
      if ($NF ~ ("(" regex ")$")) ARGV[ARGC++] = $0; next
    }
    NF {
      # record all matches (here in fields matched by FPAT)
      $1 = $1 # force a rebuild of $0 joining fields with OFS
      matches[FILENAME] = matches[FILENAME] \
                          (matches[FILENAME] == "" ? "" : OFS) \
                          $0
    }
    END {
      for (file in matches)
        print file ": " matches[file]
    }' step=1 searchFiles.txt \
       step=2 RS='\0' FS=/ - \
       step=3 RS='\n' FPAT='[^ ]*_XYZ' OFS=';'

難読化が必要な場合は、1行に入力できます。

find . -type f -print0|gawk '!s{gsub(/[][^$*()+{}?\\.|]/,"\\\\&");r=r p $0;p="|";next};s==2{if($NF~("("r")$"))ARGV[ARGC++]=$0;next};NF{$1=$1;m[FILENAME]=m[FILENAME](m[FILENAME]==""?"":OFS)$0};END{for(f in m)print f":"m[f]}' searchFiles.txt s=2 RS=\\0 FS=/ - s=3 RS=\\n FPAT='[^ ]*_XYZ' OFS=\;

ファイル名と内容に含めることができる文字については想定しません。ただし、その文字はロケールで有効な文字でなければなりません。サフィックスには改行文字を使用できませんが、これはsearchFiles.txt。

Question 2

私はコメントで議論されたDOSスタイルの行の終わりを修正しましたが、searchFiles.txt実際には空の行が含まれていないとします。

-nameテストでは、find1つのファイル名パターンのみを使用します。パターンにはシェルのglob文字を含めることができますが、シェルがファイル名を早期に生成しないように、これらの文字を保護する必要があります。論理ORを使用してこれらのテストを複数組み合わせることができますが、-o演算子の優先順位に注意する必要があります。

シェルが配列をサポートしている場合、これを行うには1つの方法があります（bashここではそれを使用していますが、同様のプロセスが他のシェルでも機能する必要があります）。

files=( -false )
while IFS= read -r f || [ -n "$f" ]; do files+=( -o -name "*$f"); done < searchFiles.txt

${files[@]}これは代替サービスに拡張する必要があります。

-false -o -name *file.a.txt -o -name *file.b.txt -o -name *file.c.txt -o -name *file.d.txt -o -name *file.e.txt

findその後、次のコマンドで使用できます。

find . \( "${files[@]}" \) -exec grep -Ho '[^ ]*_XYZ' {} +

（オプションを/dev/null追加するためにダミーファイルを省略しました）。-Hファイル数がsearchFiles.txt多すぎると、制限によりこの方法が失敗する可能性がありますARG_MAX。searchFiles.txt複数の小さなファイルに分割することで、この制限を解決できます。

Answer