多くのPDFファイルでキーワードをすばやく検索するためのツールはありますか?

多くのPDFファイルでキーワードをすばやく検索するためのツールはありますか?

技術書籍が多くてしばらく使ってきましたがpdfgrep、すべて検索するには時間がかかります。

PDFファイルをすばやく検索できるCLIツールをお勧めできる人はいますか?

キャッシュ目的のための下線データベースが必要です。locateコマンドに似ていますが、pdfキーワードに固有です。

みんなありがとうございます! :)

答え1

代わりにpdfgrepあなたはそれを使用することができますrga

rga再帰検索は、デフォルトでキャッシュが有効な状態で行われます。

SSDに保存されている15GBのPDFコレクションとすばやく比較しました。

$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache

$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s  # with cache

$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M    /Users/sschmidt/.cache/pdfgrep

$ gdu -sh --apparent-size ~/Library/Caches/rga
186M    /Users/sschmidt/Library/Caches/rga

したがって、rga初期実行より約4倍速く、キャッシュされた実行では約2倍高速です。pdfgrepさらに、rgaキャッシュpdfgrepサイズは約4分の1にすぎません。もちろん、これは私の特定の設定にすぎないため、構成によって結果が異なる場合があります。

関連情報