Qpdfテキストエディタでテキストを表示する

Qpdfテキストエディタでテキストを表示する

私はqpdfを使用しました

qpdf --qdf --object-streams=disable orig.pdf expanded.pdf

参考https://unix.stackexchange.com/a/109177/306249

テキストエディタですべてのオブジェクトを表示できます。しかし、PDFのテキストを見ることはできません。

PDFの「Hello world」テキストを使用してテストしました。ただし、解凍した後はこのテキストを表示できません。

オブジェクトでテキストを表示するには?

答え1

すべてのオブジェクトを展開した後でも、テキスト(文字列と単一文字)はASCIIで表示する必要はなく、16進数でエンコードできます。

テキストを検索するには、次の手順に従ってください。

  1. 拡張PDFで名前のあるすべてのキーを見つけます/Contents。次のように見えます。

    /Contents 8 0 R
    

    これは、そのページの内容がオブジェクト番号8にあることを知らせる。

  2. オブジェクト番号8に進みます。これは文字列を検索することで見つけることができます。'8 0 obj'

  3. stream ... endstream下の行の行の末尾に次のいずれかが表示された場合は、その行で囲みます。

    ...TJTj'または"

    あなたはオペレーターのテキストを表示します。職場で。

  4. 前の行にはテキストが含まれていますが、次のようになります。

    [(H)0.0976563(e)0.0976563(l)-599.902(l)0.0976563(o)0.0976563(W)0.0976563(o)-599.902(r)0.0976563(l)0.0976563(d)0.0976563(!)]TJ
    

    ねえ、あなたは幸運を願っています! 「Hello World!」を解読できますか?ここに文字列がありますか?真ん中の数字はただ各キャラクターの位置を調節するだけなのに…

  5. ....もうPDFトレーニングを中止します。詳細は公式PDF形式の仕様で読むことができます:-)

    もう一つのヒント:検索してみると
    StackOverflowに対するその他のPDF関連の回答

    PDFコードの読み方を詳しく説明する多くの例があります。

関連情報