テキストを含むすべての画像を見つける方法は？

Question 1

私も同じ問題が発生しました。解決策を共有します。

find . -type f \( -name "*.jpg" -or -name "*.png" \) -exec sh -c 'for x; do printf "%s :" "$x"; tesseract $x temp; if (grep -f blacklist temp.txt) then rm $x; rm temp.txt; fi; done' _ {} +

すべてのサブディレクトリを調べ、「blacklist」というファイルに基づいて一致するOCRパターンを削除します。唯一の問題は、ファイルにスペースが含まれている場合は正しく解析せずに、代わりにファイルの最初の単語を操作しようとすることです。

編集：ブラックリストファイルに空白行を置かないように注意してください。

Answer

私も同じ問題が発生しました。解決策を共有します。

find . -type f \( -name "*.jpg" -or -name "*.png" \) -exec sh -c 'for x; do printf "%s :" "$x"; tesseract $x temp; if (grep -f blacklist temp.txt) then rm $x; rm temp.txt; fi; done' _ {} +

すべてのサブディレクトリを調べ、「blacklist」というファイルに基づいて一致するOCRパターンを削除します。唯一の問題は、ファイルにスペースが含まれている場合は正しく解析せずに、代わりにファイルの最初の単語を操作しようとすることです。

編集：ブラックリストファイルに空白行を置かないように注意してください。

Question 2

たとえば、オープンソースOCRエンジンを使用できます。宇宙キューブ英語のテキストがあることを確認してください。

Answer

たとえば、オープンソースOCRエンジンを使用できます。宇宙キューブ英語のテキストがあることを確認してください。

テキストを含むすべての画像を見つける方法は？

答え1

答え2

関連情報