ファイルサイズを最小限に抑えながら、OCRを使用して雑誌や書籍をデジタル化する標準的なワークフローは何ですか？

2024-5-18 • tag-icon

テキスト、白黒画像、シャープな枠線のみを含む本をスキャンするために私が使用したワークフローは次のとおりです。

これは素晴らしい作品です。ただし、雑誌や書籍の画像、構造要素、背景、またはページの端と重なる画像に色がたくさん含まれている場合は、スキャンテーラー（ブレンドモード）を使用するのが非常に困難になり、各ページを手動で処理する必要があります。

それでは、これらのリソースをデジタル化し、Linuxから小さなファイルをインポートするための良いワークフローは何ですか？DJVUまたはPDFocrの背景を持つファイルですか？

関連情報