OCR

Hinweis: In dem Thema OCR gibt es 31 Antworten auf 4 Seiten. Der letzte Beitrag () befindet sich auf der letzten Seite.
  • Es geht um optische Texterkennung von gescannten Seiten. Ich habe nach diesem Verweis: OCR

    xsane und gocr installiert.

    Ich komme damit nicht recht klar. Hat jemand Erfahrung damit?

    Für den Inhalt des Beitrages 295297 haftet ausdrücklich der jeweilige Autor: Freitag

  • Klar kommst Du damit nicht klar, denn Texterkennung unter Linux kannst Du vergessen. Wenn Du ein Dokument hast, scannst Du das ein, musst das in einem gocr verträglichen Format abspeichern. Dann öffnest Du gocr, verlinkst zu dem eingescannten Dokument und startest die Texterkennung. Die Benutzeroberfläche von gocr entspricht optisch in etwa dem, was unter Windows 3.1 üblich war - und seine Fähigkeiten entsprechen dem. In der Regel ist das Ergebnis lausig! Es gibt bestimmte Bereiche, in denen Linux nicht brauchbar ist. Neben der Texterkennung gehört dazu die Spracherkennung.

    Für den Inhalt des Beitrages 295299 haftet ausdrücklich der jeweilige Autor: matbhm

  • PNM-Files oder Image-Files. Welche Formate gocr verarbeitet, findest Du raus, indem Du gocr startest und auf "Browse" klickst. Dort werden die Formate angezeigt, die Du unter gocr öffnen kannst.

    Für den Inhalt des Beitrages 295301 haftet ausdrücklich der jeweilige Autor: matbhm

  • Sorry!


    Code
    https://postimg.cc/MMfg6454
    https://i.postimg.cc/XjbvnVNy/Bildschirmfoto-vom-2021-12-10-10-53-50.png

    Für den Inhalt des Beitrages 295306 haftet ausdrücklich der jeweilige Autor: uname

  • Es gibt bestimmte Bereiche, in denen Linux nicht brauchbar ist. Neben der Texterkennung gehört dazu die Spracherkennung.

    Dem möchte ich teilweise widersprechen!

    Die Texterkennung ist sogar hervorragend, wenn die Vorlage entsprechend gut ist.


    Mach mal ein gutes ProbeFoto.jpg und dann ein:

    Code
    tesseract -l deu ProbeFoto.jpg Probefoto_mit_erkanntem_text.pdf pdf

    Du wirst überrascht sein.