PDFファイルの画像からテキストをコピーする方法は?

PDFファイルの画像からテキストをコピーする方法は?

evince Document Viewerを使用してテキストを含むPDF画像を表示できますが、コピーして貼り付ける画像のテキストを選択することはできません。 PDFファイルの画像からテキストをコピーする方法は?

答え1

あなたはする必要がありますOCR (Optical Character Recognition)画像からテキストを抽出する機能。もしあなたならGoogle OCRオンラインでたくさん見つけることができます。OCR software画像からテキストを抽出してみてください。私は個人的にどれくらい成功したのか言うのが難しい製品を使ったことがありません。そのうちのいくつかは画像ファイルを入力として使用し、その場合はPDF画像形式に変換する必要があります(そのためのツールはオンラインでも利用可能です)。

技術的にもう少し興味があれば、ここにPythonライブラリがあります。pytesserこれが役に立ちます。

Capture2TextOCRを実行しscreenshotて結果をクリップボードに出力するオープンソースツールなので、画像からテキストをコピーするのと同じ感覚を与えます。これが最善の選択かもしれません。

答え2

Harvinderが提案したように動作する一種のOCRを得ることができなければ幸運ではありません。 PDFの画像の場合、JPEG、PNG、または他の画像の画像と変わりません。

自分に合ったOCRパッケージを探しても、結果が非​​常に悪いことがあります。私はテキストを再入力するよりもOCR PDFを編集するのに時間がかかります。

関連情報