OCRテキストを含む大容量文書スキャンがあります。インターネットアーカイブ勉強したい。残念ながら、PDFページは私のドキュメントリーダー(Okular、Evince、Zathura)で非常に遅くレンダリングされています。このため、以前はDJVUファイルを使用していましたが、やめて仕方なく。pdf2djvu
、、いくつかのオンラインツールを使用してDJVUに直接変換しようとし、djvudigital
さらにJPEGへの変換も最初に試しましたが、プログラムは前景と背景を分離できないようで、毎回非常に大きなファイルを取得します。いくつかの質問があります。
- インターネットアーカイブチームは以前にどのようにDJVUを作成しましたか?プロセスを複製または近似できますか?
- 2番目のリンクは、遅いPDFレンダリングがしばらく(少なくともLinuxでは)問題であったことを示しています。より高速なバックエンドなどの回避策はありますか?ファイルを線形化しようとしましたが、状況は改善されませんでした。
問題をテストするには、次の点を考慮してください。これポアンカレ全集