
私は持っていますこのPDFファイルスキャンして作成されました。 PDFビューアで見ると、ページの幅が高さより広いです。
しかし、私が試したすべてのPDFアプリケーションでは、幅を高くして、高さをこのPDFファイルの幅で間違えたようです(下記参照)。
なぜ?
PDFファイルが破損していますか?
PDFアプリケーションが幅と高さを混在させないようにPDFファイルを「修正」する方法は?
次のコマンドは、幅が高さ(ポイント)より小さいことを示しています。
$ pdfinfo test.pdf Creator: Xerox WorkCentre 7830 Producer: Xerox WorkCentre 7830 CreationDate: Tue Dec 23 00:22:47 2014 Tagged: no Form: none Pages: 1 Encrypted: no Page size: 612 x 1008 pts Page rot: 90 File size: 81820 bytes Optimized: no PDF version: 1.4
次のコマンドは、幅が高さ(ピクセル単位)より小さいことを示しています。
$ pdfimages -list test.pdf page num type width height color comp bpc enc interp object ID --------------------------------------------------------------------- 1 0 image 864 1400 rgb 3 8 jpeg no 6 0 1 1 mask 1236 895 - 1 1 jbig2 no 8 0 1 2 mask 737 891 - 1 1 jbig2 no 10 0 1 3 mask 247 381 - 1 1 jbig2 no 11 0 1 4 mask 44 298 - 1 1 jbig2 no 12 0 1 5 mask 429 9 - 1 1 jbig2 no 13 0 1 6 mask 22 258 - 1 1 jbig2 no 14 0 1 7 mask 130 142 - 1 1 jbig2 no 15 0
PDFファイルの左右の余白を切り取るスクリプトを使用しようとしています。
pdfcrop.sh
ここgs
これはとに基づいているようですpdftk
。左右のマージンをそれぞれ116ポイントと20ポイントで測定した。スクリプトの使い方は次のとおりです。
echo " -t \"<left> [<top> [<right> <bottom>]]\"" echo " trims outer page edges by the given amounts. Unit is bp. A single number" echo " is used for all trims, two numbers \"<left> <top>\" are applied to the" echo " right and bottom trims alike."
しかし、
pdfcrop.sh -t "116 0 20 0" test.pdf Trim.pdf
これにより、上が116ポイント、下が20ポイントカットされます。一方、以下の正しいアプローチは、左を116ポイント、右を20ポイントカットすることです。
pdfcrop.sh -t "0 116 0 20" test.pdf Trim.pdf
答え1
0.
以下は、1ページのサンプルPDFファイルに基づくPNGです。
1.
PDFビューアで見ると、ページの幅が高さより広いです。
これがまさにその方法です。
2.
[...]私が試したすべてのPDFアプリケーションでは、幅を高くして、高さをこのPDFファイルの幅で間違えたようです。
あなたが言ったようにそれだけです。〜らしいそうですね。
三。
PDFファイルが破損していますか?
いいえ、そうではありません。
4.
pdfinfo
最初のコマンド()が提供したメッセージを無視しました。
Page rot: 90
これは、PDFファイル内のPDFソースコードがビューアにこれを知らせるという意味です。「広さより身長が本当に大きいです」- ページをめくってディスプレイを90度回転させます。
したがって、「すべてのPDFビューアで見ると、ページは高さより広いです」。そうする必要があります。私を見て番号1以上。そして私2回以上。
5.
pdfimages
すべての画像を抽出し、ImageMagickを使用してconvert
PNMまたはPBM形式の画像をJPEGに変換できます。
pdfimages -j test.pdf test-
for i in *.pbm ; do \
convert $i ${i/.pbm/.jpg} ; \
done
これにより、pdfimages -list
質問のコマンドに0〜7回の画像を含む8つの異なる画像が作成されます(「2.」)。
ここにこれらの画像があります。どちらも元のサイズの25%に拡張されているため、スペースが浪費されません。これらはすべてから抽出されたように「自然な」方向に表示されますpdfimages
。これは0
リストの最初の項目で、番号は次のとおりです。
画像は「自然な」方向に抽出された。幅に比べて確かに背が高いです。
次の画像ペアのサイズは25%に変更されました。上記のmask
出力リストの種類の画像を表しますpdfimages
。
あなたのスキャナー(および内蔵ソフトウェア)は「よりスマートな」スキャナーです。単にページから単一のTIFFを作成してからPDFシェルに挿入するのではなく、画像を使用してさまざまな部分を最適化したいと思います。「マスク」(アルファチャンネルを使用 - 作成したJPEGでは黒で表示されます)テキストを含むセクション。
幸いなことに、スキャナソフトウェアはそうではありません。「もっと」テキストに圧縮を適用するとスマートで、JBIG2の代わりにJPEG2000を使用します。だからあなたは悪名高い場所に上がることができませんでした。」ゼロックススキャンエラー」。