私はこれより深いことを想像しています。PDFをテキストとして(部分ポプラツール)、仮想ページのレイアウトのほとんどを保存することが可能だと思います。たとえば、ポケットベルを介してパイプされます。最大、単純なグラフなどのシンボルベースの置換を取得することも可能です。
一般的に使用されるコマンドチェーンやスクリプトは非常に興味深いでしょう。
あまりにも多くのコメントが必要な質問を避けるために、質問に「共通」という言葉を追加しました。
ここで重要な優先順位は、ソリューションが完全に移植可能であり、たとえば、Macのシングルユーザーモードでも使用できるかどうかです。
答え1
pdftotext
実際にオプションがあります-layout
。
-layout
Maintain (as best as possible) the original physical
layout of the text. The default is to ´undo' physical
layout (columns, hyphenation, etc.) and output the text
in reading order.
しかしグラフィックはしません。