100個のjpg画像を含むフォルダがあります。この画像をすべての画像を含む複数ページのPDFファイル(A4サイズに切り捨て)に変換したいと思います。彼らはすでに正しい循環にあります。
どのツールを使用する必要がありますか?
答え1
必要
イメージマジシャン
ImageMagickをインストールするには、コマンドプロンプトで次の行を入力します。
sudo apt-get install imagemagick
JPEGからPDFへの変換:
作業ディレクトリ(jpegsディレクトリ)を入力してください。
cd work/directory/path
JPGファイルをPDFに変換:
convert *.jpg foo.pdf
答え2
残念ながらconvert
jpg
最小限の品質損失、つまり元の品質を使用する必要があるように前の画像を変更し、img2pdf
次のコマンドを使用しました。
以下を使用する短いシングルライナーソリューションimg2pdf
PDFの作成
img2pdf *.jp* --output combined.pdf
オプションでPDF出力にOCRを追加する
ocrmypdf combined.pdf combined_ocr.pdf
元のコマンドは次のとおりです。より多くのコマンドとツールが必要です。
これは、解像度や品質を失うことなく、画像ごとに
pdf
1つのファイルを生成することです。jpg
ls -1 ./*jpg | xargs -L1 -I {} img2pdf {} -o {}.pdf
これにより、ページが
pdf
1つにまとめられます。pdftk *.pdf cat output combined.pdf
最後に、PDFのスキャン品質を変更しないOCRedテキストレイヤーを追加して検索を可能にしました。
pypdfocr combined.pdf
答え3
img2pdf
ロスレス変換にはPython CLIプログラムを使用することをお勧めします。
https://gitlab.mister-muffin.de/josch/img2pdf
使用例:
img2pdf img1.png img2.jpg -o out.pdf