悪意のあるPDFからメタデータを抽出するコード/ツール

Question

破損したPDFファイルを確認する最も簡単な方法は、大容量ファイルを処理できるエディタでそのファイルを開くことです（私はemacsを使用しています）。まず、良いPDFファイルをお試しください。 PDFファイルのオブジェクト構造が表示されますが、コンテンツストリームの一部または全部が圧縮されます。これにより、「悪意のある」PDFがパーサーを混乱させるために何をしているかを確認し、それに応じてパーサーを修正することができます。（「悪意のある」PDFが何をしているのかわからない場合、私たちは明らかにこれを行うことはできません。）

mutool clean -d解凍されたストリームを使用することもできますが、mutool破損したPDFの機能により混乱する可能性があります。もう一度有効なPDFで最初に試してみてください。

Answer 1

破損したPDFファイルを確認する最も簡単な方法は、大容量ファイルを処理できるエディタでそのファイルを開くことです（私はemacsを使用しています）。まず、良いPDFファイルをお試しください。 PDFファイルのオブジェクト構造が表示されますが、コンテンツストリームの一部または全部が圧縮されます。これにより、「悪意のある」PDFがパーサーを混乱させるために何をしているかを確認し、それに応じてパーサーを修正することができます。（「悪意のある」PDFが何をしているのかわからない場合、私たちは明らかにこれを行うことはできません。）

mutool clean -d解凍されたストリームを使用することもできますが、mutool破損したPDFの機能により混乱する可能性があります。もう一度有効なPDFで最初に試してみてください。

悪意のあるPDFからメタデータを抽出するコード/ツール

答え1

関連情報