PDFからメタデータを削除する

PDFからメタデータを削除する

すべてのメタデータを削除するには、どのような元に戻せないコマンドを実行する必要がありますかfoo.pdf?挿入された画像はすでにきれいであると仮定します。

私の印象は以下から来ています

https://gist.github.com/hubgit/6078384

それ

exiftool -all:all= foo.pdf
qpdf --linearize foo.pdf bar.pdf

十分かもしれませんが、完全に完全なアプローチかどうかはわかりません。pdftk私が理解していない「情報辞書」についての話があります。

答え1

というツールがあります。MAT(メタデータ匿名化ツールキット)メタデータはさまざまな形式から削除できます。 Ubuntuでは、次のように使用します。

sudo apt install mat2

mat2 filename.pdf  # you will now end up with a file called filename.cleaned.pdf

mat2 --inplace filename.pdf  # this will overwrite original file with the new one, effectively removing the original file

mat2 --show filename.pdf  # this will show the metadata that will be removed, if any (similar to dry run) 

クリーンアップされたファイルは、元のファイルよりもファイルサイズが小さいか大きくなります。

一つあるモデル(追加するだけです--lightweight。)上記のコマンドを使用して、クリーンアップされた画像がpdfファイルなどの非常に大きなファイルを生成することを確認できます。ただし、これにより一部のメタデータが残る可能性があります。このexiftoolコマンドを使用して、クリーンアップされた画像からまだメタデータが漏洩していることを確認してください。

答え2

cpdf -remove-metadata input.pdf -o output.pdf

直接検証はしませんでしたが、cpdf非常に信頼性が高く便利なツールです。ここ、非商用目的は無料で、Linuxコマンドライン用にプリコンパイルされたバイナリとして使用できます。

最後にファイルサイズが小さくなりました。)

答え3

努力するメタデータクリーナー平らな車輪に。

関連情報