私はqpdfを使用しました
qpdf --qdf --object-streams=disable orig.pdf expanded.pdf
参考https://unix.stackexchange.com/a/109177/306249
テキストエディタですべてのオブジェクトを表示できます。しかし、PDFのテキストを見ることはできません。
PDFの「Hello world」テキストを使用してテストしました。ただし、解凍した後はこのテキストを表示できません。
オブジェクトでテキストを表示するには?
答え1
すべてのオブジェクトを展開した後でも、テキスト(文字列と単一文字)はASCIIで表示する必要はなく、16進数でエンコードできます。
テキストを検索するには、次の手順に従ってください。
拡張PDFで名前のあるすべてのキーを見つけます
/Contents
。次のように見えます。/Contents 8 0 R
これは、そのページの内容がオブジェクト番号8にあることを知らせる。
オブジェクト番号8に進みます。これは文字列を検索することで見つけることができます。
'8 0 obj'
stream ... endstream
下の行の行の末尾に次のいずれかが表示された場合は、その行で囲みます。...
TJ
、Tj
、'
または"
あなたはオペレーターのテキストを表示します。職場で。
前の行にはテキストが含まれていますが、次のようになります。
[(H)0.0976563(e)0.0976563(l)-599.902(l)0.0976563(o)0.0976563(W)0.0976563(o)-599.902(r)0.0976563(l)0.0976563(d)0.0976563(!)]TJ
ねえ、あなたは幸運を願っています! 「Hello World!」を解読できますか?ここに文字列がありますか?真ん中の数字はただ各キャラクターの位置を調節するだけなのに…
....もうPDFトレーニングを中止します。詳細は公式PDF形式の仕様で読むことができます:-)
もう一つのヒント:検索してみると
StackOverflowに対するその他のPDF関連の回答、PDFコードの読み方を詳しく説明する多くの例があります。