多くのPDFファイルでキーワードをすばやく検索するためのツールはありますか？

Question

代わりにpdfgrepあなたはそれを使用することができますrga。

rga再帰検索は、デフォルトでキャッシュが有効な状態で行われます。

SSDに保存されている15GBのPDFコレクションとすばやく比較しました。

$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache

$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s  # with cache

$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M    /Users/sschmidt/.cache/pdfgrep

$ gdu -sh --apparent-size ~/Library/Caches/rga
186M    /Users/sschmidt/Library/Caches/rga

したがって、rga初期実行より約4倍速く、キャッシュされた実行では約2倍高速です。pdfgrepさらに、rgaキャッシュpdfgrepサイズは約4分の1にすぎません。もちろん、これは私の特定の設定にすぎないため、構成によって結果が異なる場合があります。

Answer 1

代わりにpdfgrepあなたはそれを使用することができますrga。

rga再帰検索は、デフォルトでキャッシュが有効な状態で行われます。

SSDに保存されている15GBのPDFコレクションとすばやく比較しました。

$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache

$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s  # with cache

$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M    /Users/sschmidt/.cache/pdfgrep

$ gdu -sh --apparent-size ~/Library/Caches/rga
186M    /Users/sschmidt/Library/Caches/rga

したがって、rga初期実行より約4倍速く、キャッシュされた実行では約2倍高速です。pdfgrepさらに、rgaキャッシュpdfgrepサイズは約4分の1にすぎません。もちろん、これは私の特定の設定にすぎないため、構成によって結果が異なる場合があります。

多くのPDFファイルでキーワードをすばやく検索するためのツールはありますか？

答え1

関連情報