次の画像からテキストを抽出する必要があります。
ご覧のとおり、テキストは手書きのものではなく、入力したものです。しかも背景も華やかだ。
Tesseract OCRを試してみましたが、時々動作しましたが、特定の入力ではひどく失敗しました。上記の例では、「Due CoN aicomrBi em Cela RTL」を生成します。
どのコマンドラインOCRソフトウェアをお勧めしますか? Tesseractが最良の選択であれば、Tesseractのキャラクターをより簡単に識別できるようにこれらの画像を変換できますか?
編集するconvert -threshold 55%
:@MarcusMüllerの提案に従って、前景テキストと背景テキストをよりよく分離する作業を行いました。結果画像がずっと良くなりました!
ああ、Tesseractはまだ動作していません。この新しい画像では、「Bim KM ioes Bm Meme e Cera」が作成されます。
したがって、問題は引き続き開かれています。
答え1
不均一な背景でOCR性能が悪い場合は、画像を前処理して前景を抽出するのに役立ちます。
利用可能な技術はさまざまです画像分割/フォアグラウンド抽出。しきい値でうまくやったと思います!おそらくこれを試したり、より高度な抽出器(openCVなど)を使用したり、ニューラルネットワークをトレーニングして自動的に分割を実行したりできます。
さらに、OCRは明るい背景に暗いテキストを使用するとよりうまく機能するため、反転が必要になる場合があります。