PDFファイルからOCRテキストを削除するときにファイルサイズの拡大を防ぎますか？

Question

pdfimages元の画像がJPEGファイルの場合は、オプションを使用できます-j。からman pdfimages：

-j     Normally, all images are written as PBM (for monochrome  images)
       or  PPM  (for  non-monochrome  images) files.  With this option,
       images in DCT format are  saved  as  JPEG  files.   All  non-DCT
       images are saved in PBM/PPM format as usual.

ConvertがPDFファイルに画像を保存する方法を制御する方法はわかりませんが、圧縮品質を使用し-qualityて変更できます。-resize

convert次のいずれかの方法で呼び出されます。

TMPDIR=/home/tim/tmp  convert ...
MAGICK_TMPDIR=/home/tim/tmp convert ...

変換を/home/tim/tmp一時ディレクトリとして使用して、スペースの問題を回避できます。（これは結果のファイルサイズに影響しない可能性があります）。

Answer 1

pdfimages元の画像がJPEGファイルの場合は、オプションを使用できます-j。からman pdfimages：

-j     Normally, all images are written as PBM (for monochrome  images)
       or  PPM  (for  non-monochrome  images) files.  With this option,
       images in DCT format are  saved  as  JPEG  files.   All  non-DCT
       images are saved in PBM/PPM format as usual.

ConvertがPDFファイルに画像を保存する方法を制御する方法はわかりませんが、圧縮品質を使用し-qualityて変更できます。-resize

convert次のいずれかの方法で呼び出されます。

TMPDIR=/home/tim/tmp  convert ...
MAGICK_TMPDIR=/home/tim/tmp convert ...

変換を/home/tim/tmp一時ディレクトリとして使用して、スペースの問題を回避できます。（これは結果のファイルサイズに影響しない可能性があります）。

PDFファイルからOCRテキストを削除するときにファイルサイズの拡大を防ぎますか？

答え1

関連情報