まず、ここがこの質問をするのに適した場所でなければお詫び申し上げますが、他のところは思い出せません(多分スタックオーバーフロー?)。
とにかく、私は私のメモを処理するために光学文字認識ソフトウェア(OCR)を探しています。問題は、時には真ん中に方程式があるということです。だから私はテキストと方程式の両方を扱うことができ、Linuxシステムで実行できるソフトウェアを探していました。
最終的に私の目標はLaTeXファイルを生成することですので、出力がすでにLaTeXにあるかどうかは重要ではありませんが、あまりにも多くを要求するようです。
オンラインではこれを行う項目が見つかりませんが、これは主に正しいクエリを使用しないためだと思います(英語は私のデフォルト言語ではありません)。私が見つけたこの問題しかし、それは4年前のことで、それ以来状況が変わったと思います。
ノートのテキスト部分を処理するのに最適なソフトウェアと、ノートの方程式部分を処理する他のソフトウェアが見つかった場合は、それらを統合できます。
誰もがこれを行う方法を知っていますか?
答え1
これはLinuxに限定されていませんが、http://myscript.com/悪くない数学手書き認識アプリがあります。しかし、OCRについては不明です。
答え2
私の意見は忘れてください。私の経験によれば、LinuxのOCRプログラム(gocr、tesseract、cuneiform、ocrad)はすべて不便であり、スキャンしたserifフォントにも当てはまります。手書きを認識するには、完全に忘れることができます。
誰かが私が間違っていることを証明することは本当にうれしいです。
Finereader(大規模スキャンでより良い結果を得て、より多くの[バイナリ]形式にエクスポートするために認識しにくい部分のトレーニングを許可するので良い)またはAcrobat(良いですが機能的ではありませんが、単に愚かですがわかります)。な結果が得られません。
さらに、スキャンした本でも数学式を識別する機会はありません。
(一部のタブレットには手書き認識機能があることがわかっていますが、個人的に製品名はよくわかりません...)
答え3
この質問は古く、まだ解決策を探している人のために、次のWebアプリを見つけました。数学ピクセル。使用するにはログインが必要で、ブラウザで実行されるため、Linuxだけでなくすべてのプラットフォームで実行されます。画像を数学形式に変換するので、写真を撮るには少なくともカメラ(または携帯電話)が必要です。
私の記事を(ほぼ)認識しているようだったので、それがどれだけうまくいくのか本当に驚きました。人間でさえ認識に同意しません。