私の質問にLinuxブートの出力を追加し、光学文字認識を試みることにしました。 2022年には間違いなくまともなオープンソースオプションが必要だと思いました(長い間OCRを試みませんでした)。 「良いレビュー」のウェブ検索で見つけたリンクですtesseract
。https://www.linuxlinks.com/ocrtools/チャートで2番目に良いです。https://askubuntu.com/questions/16268/whats-the-best-simplest-ocr-solution
Tesseractはおそらく最も正確なオープンソースOCRエンジンです。
apt-getを介してディストリビューションからインストールして実行しました。私の考えでは、基本的に結果はひどかった。なぜ?おそらくすぐに解決されるかもしれませんか?または、そのタスクを実行できる他のパッケージを提案してください。私が識別したいページにはかなり簡単な作業だと思ったので、画像がありませんでした。結果は次のとおりです。
編集:実際には小さな部分を処理すると結果がはるかに優れていますが、全体を処理するときはそうではありません。線を水平にし、傾斜を小さくすることが多くの役に立つことがわかりますが、ソフトウェアが完全に整列していないテキストをよく認識できたらと思います。
oon usb 1-@: |
“3792661 usb 1-8: New USB device found, idVendor=1343, idProduct:
7.983163] usb 1-8: New USB dev bs P luct=5662, bedDevice=16.6?
re eh peeled haibbetaia a
: new high-speed USB device number 5 PhS |
i
Per Samm SCR Can)
t pela ee rcpt PP cay
: 2.998668) usb 1-8: er
t
Ct
小さな部品のみを処理する場合:
2.837811) usb 1-8: new high-speed USB device number 5 using xhei_hed
2.979266] usb 1-8: New USB device ECU CREME Cnt ttc cain Tt teen Td
7.983163] usb 1-8: New USB device strings: Mfr=1, Product=2, SerialNumbers@
?.9869291 usb 1-8: Product: Integrated Camera
1を追加:
小さくて傾斜の少ない画像で再試行すると、ソフトウェアはタイムスタンプを別々の列として処理し、マニュアルページオプションにそれを調整するオプションが表示されないようです。
f a eg
| 7.849264]
Device= 6.44
f 7 .6492961
| 7.849355]
f 7.849415]
[ 7.849492]
| Van eos
fl 7.861846]
if Va ACB
| 7.864776]
if eel Be
Ha Bs) bs 4
if be A be ge
C ie BD LB
ce B)
te] Bs]
rage
lb eae
8.962076)
ie Ke Lb
9.600567)
9.696957)
9 .6970371
YS SF SS Se
usb 1-8: new high-speed USB device number 4 using xhci_hcd
usb 1-8: New USB device found, idVendor=04f2, idProduct=b449, bed
usb 1-8: New USB device strings: Mfr=3, Product=1, SerialNumber=2
usb 1-8: Product: Integrated Camera
usb 1-8: Manufacturer: Chicony Electronics Co.,Ltd.
usb 1-8: SerialNumber: 6x0001
usb-storage 1-1:1.6: USB Mass Storage device detected
scsi host3:
usb-storage 1-1:1.6
usbcore: registered new interface driver usb-storage
usbcore: registered new interface driver uas
scsi 3:0:6:@: Direct-fAccess General UDisk eg
sd 3:0:0:0: Attached scsi generic sgi type @
eM Pee PM eA PA ed) te) ae
Py Me ee dd
Py ee ee eee dm
sd 3:0:0:0: [sdb] Assuming drive cache: write through
sdb: sdbi sdb2 sdb3
sd 3:0:0:0: [sdb] Attached SCSI removable disk
squashfs: version 4.6 (2609/01/31) Phillip Lougher
Copying live image to RAM...
Ca ewe te Mae