pdfimagesはすべての画像を抽出しません。

pdfimagesはすべての画像を抽出しません。

私はPDF画像を使用しています。PDFファイル。数えてみると10枚の写真が出ました。ただし、プログラムは4つしか抽出できません。

pdfimages -all file.pdf i

生成する

-rw-rw-r--    1 victor victor   61389 Jul 14 21:48 i-000.png
-rw-rw-r--    1 victor victor      88 Jul 14 21:48 i-001.png
-rw-rw-r--    1 victor victor    5226 Jul 14 21:48 i-002.png
-rw-rw-r--    1 victor victor   95657 Jul 14 21:48 i-003.png

一部の設定がありませんか?

すべての画像を抽出する方法は?

答え1

Pdfimagesはラスターイメージのみをサポートします。 PDFに表示される内容はベクターグラフィックである可能性が高いです。

自動的に抽出する方法はありませんが、次のツールを使用できます。モジングまたはLibreOffice図面そのようなグラフを手動で取得します。プロセスはどちらの場合も同じです。

  1. PDFを開く
  2. グラフィック領域を選択してください
  3. クリップボードにコピー(Ctrl + C)
  4. 新しい文書を読み込む(Ctrl + N)
  5. 貼り付け(Ctrl + V)
  6. 左上に移動してページのサイズを変更します(Inkscapeはこれら2つを自動的に実行できます:Ctrl + Shift + R)。
  7. 描画: エクスポート/Inkscape: 別の名前で保存 (Ctrl+Shift+S)

答え2

代議員の投票はありませんが、私の答えは、「ファイル」 - >「PNG画像のエクスポート...」オプションを使用して画像の解像度を指定することをお勧めします。紙マップ(ハードコピーの場合は3 'x 3')のEPSグラフィックスでは、品質係数30でInkscapeにインポートし、良い結果を得るために5000x5000にエクスポートしました。そして、Ctrl-Shift-Sは基本的に解像度がかなり低いようです。私の特別なケースでは、LibreOfficeは重大なクラッシュを引き起こしましたが、これは予期しないことでした。私の経験によると、現在LibreOfficeは非常に良いソフトウェアです。

答え3

別の提案があります。 Semadoxにはオンラインツールがあります。https://www.semadox.com/pdf-image-extraction。そこから元の解像度画像を抽出できます。

免責事項:私はSemadoxの創設者ですが、ツールは無料で常に無料です。

関連情報