技術書籍が多くてしばらく使ってきましたがpdfgrep
、すべて検索するには時間がかかります。
PDFファイルをすばやく検索できるCLIツールをお勧めできる人はいますか?
キャッシュ目的のための下線データベースが必要です。locate
コマンドに似ていますが、pdfキーワードに固有です。
みんなありがとうございます! :)
答え1
代わりにpdfgrep
あなたはそれを使用することができますrga
。
rga
再帰検索は、デフォルトでキャッシュが有効な状態で行われます。
SSDに保存されている15GBのPDFコレクションとすばやく比較しました。
$ gtime --format "%Es" pdfgrep --recursive --cache --ignore-case conclusion
2:15:26s # initial run
3:05.30s # with cache
$ gtime --format "%Es" rga --type pdf conclusion
33:26.96s # initial run
1:18.70s # with cache
$ gdu -sh --apparent-size ~/.cache/pdfgrep
697M /Users/sschmidt/.cache/pdfgrep
$ gdu -sh --apparent-size ~/Library/Caches/rga
186M /Users/sschmidt/Library/Caches/rga
したがって、rga
初期実行より約4倍速く、キャッシュされた実行では約2倍高速です。pdfgrep
さらに、rga
キャッシュpdfgrep
サイズは約4分の1にすぎません。もちろん、これは私の特定の設定にすぎないため、構成によって結果が異なる場合があります。