pdfgrepを使用して、一致前のn行、一致後のm行を印刷します。

Question

-A、、GNU -B、pdfgrep 2.0を使用するのと同じようにうまく機能します。-Cgrep

いつでも次のものを使用できます（GNU仮定grep）。

pdftotext file.pdf - | grep -A/B/C...

（私の場合は両方を使用してもはるかに速いようですpoppler。）

または、複数のファイルを処理するには、次のようにしますzgrep。

for file in ./*.pdf; do
  pdftotext "$file" - | grep --label="$file" -H ...
done

（-layoutオプションを追加すると、より近い結果が得られます。複数の単語で構成される文字列を検索するのに役立つように、連続したpdftotext空白文字を単一の空白に圧縮してスルーの出力をパイプすることもできます。）pdfgreppdftotexttr -s '[[:space:]]' '[ *]'

Answer 1