고해상도 이미지를 OCR하고 나중에 이미지 압축 후 OCR 데이터를 병합하시겠습니까?

2024-6-11 • tag-icon

ScanTailor의 .tif 파일이 많이 있습니다. tesseract를 사용하여 해당 .tif를 OCR하여 이미지에서 OCR 데이터를 분리할 수 있는 방법이 있습니까? 그런 다음 이미지를 압축하고 마지막으로 OCR 데이터를 압축된 이미지와 결합하시겠습니까?

요점은 OCR 이전에 압축하고 싶지 않으며 나중에 PDF를 압축하고 OCR을 보존할 수 있는 좋은 도구가 없다는 것입니다.

関連情報