多数のPDFファイルから画像を抽出し、ウェブサイトに表示する必要がある状況に直面しました。私のPDFには「一般」画像と多くの図があります。
使ったpdf2xmljpeg、pm、pbm、およびvec形式の画像を抽出します。 「一般」画像は(主に)jpeg / ppm / pbmとして抽出されますが、そこにはグラフは表示されません。したがって、pdf2xmlはそのイメージを.vecファイルとして保存すると推測します。
だから質問は私のグラフを取得する方法です。私はconvert
imagemagickに付属のツールを使用して.vecをjpeg / pngなどに変換しましたが、役に立ちませんでした。
答え1
私はpdf2xmlを試したことがありませんが、SourceForgeでその文書を検索している間に見つけました。vec2svg-2.py.vecファイルを.svgに変換するPythonスクリプトのようです。変換するのは難しくありません。静的変数ジェネレータあなたが必要とするすべてのフォーマットについて。
python vec2svg-2.py -i file.vec -o file.svg