文字認識にtesseractを使用すると、結果が予想とは異なります(より悪い)。良い方法は何ですか?

文字認識にtesseractを使用すると、結果が予想とは異なります(より悪い)。良い方法は何ですか?

私の質問にLinuxブートの出力を追加し、光学文字認識を試みることにしました。 2022年には間違いなくまともなオープンソースオプションが必要だと思いました(長い間OCRを試みませんでした)。 「良いレビュー」のウェブ検索で見つけたリンクですtesseracthttps://www.linuxlinks.com/ocrtools/チャートで2番目に良いです。https://askubuntu.com/questions/16268/whats-the-best-simplest-ocr-solution

Tesseractはおそらく最も正確なオープンソースOCRエンジンです。

apt-getを介してディストリビューションからインストールして実行しました。私の考えでは、基本的に結果はひどかった。なぜ?おそらくすぐに解決されるかもしれませんか?または、そのタスクを実行できる他のパッケージを提案してください。私が識別したいページにはかなり簡単な作業だと思ったので、画像がありませんでした。結果は次のとおりです。

編集:実際には小さな部分を処理すると結果がはるかに優れていますが、全体を処理するときはそうではありません。線を水平にし、傾斜を小さくすることが多くの役に立つことがわかりますが、ソフトウェアが完全に整列していないテキストをよく認識できたらと思います。

ここに画像の説明を入力してください。

oon usb 1-@: |
“3792661 usb 1-8: New USB device found, idVendor=1343, idProduct:

7.983163] usb 1-8: New USB dev bs P luct=5662, bedDevice=16.6?

re eh peeled haibbetaia a

: new high-speed USB device number 5 PhS |
i

Per Samm SCR Can)
t pela ee rcpt PP cay
: 2.998668) usb 1-8: er
t
Ct

小さな部品のみを処理する場合:

2.837811) usb 1-8: new high-speed USB device number 5 using xhei_hed

2.979266] usb 1-8: New USB device ECU CREME Cnt ttc cain Tt teen Td
7.983163] usb 1-8: New USB device strings: Mfr=1, Product=2, SerialNumbers@

?.9869291 usb 1-8: Product: Integrated Camera

1を追加:

小さくて傾斜の少ない画像で再試行すると、ソフトウェアはタイムスタンプを別々の列として処理し、マニュアルページオプションにそれを調整するオプションが表示されないようです。

ここに画像の説明を入力してください。

f a eg
| 7.849264]
Device= 6.44
f 7 .6492961
| 7.849355]
f 7.849415]
[ 7.849492]
| Van eos
fl 7.861846]
if Va ACB
| 7.864776]
if eel Be
Ha Bs) bs 4
if be A be ge
C ie BD LB
ce B)
te] Bs]
rage
lb eae
8.962076)
ie Ke Lb
9.600567)
9.696957)
9 .6970371

YS SF SS Se

usb 1-8: new high-speed USB device number 4 using xhci_hcd
usb 1-8: New USB device found, idVendor=04f2, idProduct=b449, bed

usb 1-8: New USB device strings: Mfr=3, Product=1, SerialNumber=2
usb 1-8: Product: Integrated Camera

usb 1-8: Manufacturer: Chicony Electronics Co.,Ltd.
usb 1-8: SerialNumber: 6x0001

usb-storage 1-1:1.6: USB Mass Storage device detected

scsi host3:

usb-storage 1-1:1.6

usbcore: registered new interface driver usb-storage
usbcore: registered new interface driver uas

scsi 3:0:6:@: Direct-fAccess General UDisk eg
sd 3:0:0:0: Attached scsi generic sgi type @

eM Pee PM eA PA ed) te) ae
Py Me ee dd

Py ee ee eee dm

sd 3:0:0:0: [sdb] Assuming drive cache: write through

sdb: sdbi sdb2 sdb3

sd 3:0:0:0: [sdb] Attached SCSI removable disk

squashfs: version 4.6 (2609/01/31) Phillip Lougher

Copying live image to RAM...
Ca ewe te Mae

関連情報