シェルを使用してPDFファイルに含まれる特定のパターンをテキストファイルに抽出するには?
答え1
PDFはフォーマットされたデータなので、シェルはその内容にアクセスできません。ただし、PDFがインストールされている場合は、テキストを入力してパターンを検索するために使用できますpoppler-utils
。convert
grep
pdftotext my.pdf - | grep 'your_pattern' > example.txt
したがって、ファイルにパターンがありますexample.txt
。