pdfgrep

pdfgrep パスワードが異なる複数のファイル
pdfgrep

pdfgrep パスワードが異なる複数のファイル

パスワードで保護されたPDF(クレジットカード明細書)で文字列を見つけようとしています。パスワードの異なるファイルが複数あります。これマンページ(?) --password=Value を複数回指定でき、各パスワードは grep'd される各 PDF ファイルに対して試行されます。ところで、最後のパスワードだけが使用されたことを発見しました。 pdfgrep -P "[0123][0-9] [JFMASOND][aepuco][nbrylgptv] [012][0-9].+[0-9,]+\.[0-9][0-9] *([cC][rR])?" --passwo...

Admin

pdfgrepはアラビア文字列では機能しません
pdfgrep

pdfgrepはアラビア文字列では機能しません

pdf grepを使いたいのですが、アラビア語のテキストや文字列で検索しようとしたときに動作します。何も表示されません。ところで、英文文字列で検索してみるとよく出ますね。解決策や選択肢がある人はいますか?ありがとうございます。これが私が使用するコードです。 pdfgrep -in 'احمد' name.pdf ...

Admin

興味深い事実:
pdfgrep

興味深い事実:

私はしばしばPDF文書を探します。幸いなことに、pdfgrepがコンテンツごとにPDF文書を見つけるのに本当に効果的であることがわかりました。 次のコマンドを使用すると、ホームページで自分のクエリを含む文書を検索できます。 pdfgrep -irl --page-range=1 2>/dev/null 'mysearchword' このコマンドをNemoファイルマネージャ検索に統合できますか? ...

Admin

特定のパターンを使用する方法(構文?)
pdfgrep

特定のパターンを使用する方法(構文?)

pdfgrepを使用して特定のパターン(EまたはSで始まる必要があります)と5桁の数字(のみ)のすべての項目を検索し、コマンド(おそらくmvコマンド)を実行しようとしています。 これまで、次のコマンドがあります。 pdfgrep -e '[E-S]\d{5,}$' filename.pdf しかし、どんなにしてもそのPDFでは何も見つかりません。特定の用語(pdfgrep "term" filename.pdf)を検索すると関連用語が返されるため、pdfgrepがその用語を見つけることができることがわかります。 私の問題はコマンドや正規表現の構文にあるよう...

Admin

コマンドラインで「pdfgrep」の合字を認識する代替方法はありますか?
pdfgrep

コマンドラインで「pdfgrep」の合字を認識する代替方法はありますか?

私は常に "pdfgrep"を使用してコマンドラインから複数のPDFファイルの内部を検索します。ところで問題が生じました。これはこのハイフン文字「fi」です(参照:https://www.compart.com/en/unicode/U+FB01)。 「fi」は「fixed」という単語にあるため、「固定小数点演算子」という検索語は使用できませんpdfgrep -iR 'fixed point operator'。ところで、Foxit reader、EvinceなどのPDFリーダーを使ってファイルを開くと、「fi」が「f」と「i」に分割され、検索が可能です。 ...

Admin

PDFリーダーで正規表現を検索する
pdfgrep

PDFリーダーで正規表現を検索する

私は最小限のアプローチが好きなので、zathuraを使用していますが、問題が解決したらmupdfなどに切り替えます。 PDF 文書と epub 文書では、何らかの動作があればテキストに集中できるため、各単語を最初から最後まで (PDF 文書と epub 文書で) 1 つずつ強調表示する必要があります。私のアプローチは、すべての単語に一致する正規表現検索を実行することでしたが、zathuraやmupdfは検索で正規表現をサポートしていません。これを行う方法はありますか? 私はzathuraをフォークしようとしていますが、正直なところ、私が必要とするものを実...

Admin

特定の順序なしに複数の単語を含むページをPDFファイルから検索できますか?
pdfgrep

特定の順序なしに複数の単語を含むページをPDFファイルから検索できますか?

特定の順序なしに複数の単語を含むPDFファイルのすべてのページを検索したいと思います。たとえば、「hello」と「world」(特定の順序なし)の両方を含むすべてのページを探したいとします。 pdfgrep それが可能かどうかはわかりません。 私は、Googleブックスに表示される書籍で複数の単語を検索する方法と同様のことをしようとしています。 ありがとうございます。 ...

Admin

キーワードに基づいてPDFを分割
pdfgrep

キーワードに基づいてPDFを分割

キーワードに基づいてPDFファイルを分割するユーティリティはありますか?ページごとに分割されたコンテンツのみが見つかります(例:QPDF)。 pdfgrepも見ることができますが、これが他のユーティリティに統合されているかどうかはわかりません。 Bashスクリプトを書くことはできますが、pdfgrepで分割するページをどのように返しますか? ...

Admin

特定のドライブにある複数のPDFファイルから特定の単語を検索(grep / find)する方法はありますか?
pdfgrep

特定のドライブにある複数のPDFファイルから特定の単語を検索(grep / find)する方法はありますか?

8000を超えるPDFファイルと数百のフォルダを含む外部バックアップドライブに保存されている顧客PDFファイルを見つけようとしています。 たとえば、Xドライブから自分の顧客名「Sequoia Group」を含むすべてのPDFファイルを検索したい場合は、関連する出力を取得するのに役立つコマンドラインおよび/またはツールは何ですか? 私はzshでMacOS High Sierraを使用しており、homebrewを介してGNU grep、ack、pdfgrepもインストールしました。しかし、まだファイルが見つかりませんでした。 すべてのファイルがPDF-Ba...

Admin

多くのPDFファイルでキーワードをすばやく検索するためのツールはありますか?
pdfgrep

多くのPDFファイルでキーワードをすばやく検索するためのツールはありますか?

技術書籍が多くてしばらく使ってきましたがpdfgrep、すべて検索するには時間がかかります。 PDFファイルをすばやく検索できるCLIツールをお勧めできる人はいますか? キャッシュ目的のための下線データベースが必要です。locateコマンドに似ていますが、pdfキーワードに固有です。 みんなありがとうございます! :) ...

Admin

パターンが複数行かどうかに関係なく、PDFファイルからパターンのページ番号のみを取得する方法は?
pdfgrep

パターンが複数行かどうかに関係なく、PDFファイルからパターンのページ番号のみを取得する方法は?

PDFファイルで複数行パターンのページ番号が見つかりました。PDFファイルとテキストファイルで複数行のパターンを見つける方法は?そして PDFファイルから文字列を検索し、その文字列が表示される各ページの実際のページ番号を見つける方法は? $ pdfgrep -Pn '(?s)image\s+?not\s+?available' main_text.pdf 49: image not available 51: image not available 53: image not available 54: image not ...

Admin