Gibt es für "tesseract-ocr" eine Benutzeroberfläche? Oder gibt es es ein anderes ähnliches Programm?
tesseract-ocr
- Freitag
- Erledigt
Hinweis: In dem Thema tesseract-ocr gibt es 14 Antworten auf 2 Seiten. Der letzte Beitrag () befindet sich auf der letzten Seite.
-
-
Gibt es für "tesseract-ocr" eine Benutzeroberfläche?
Nicht wirklich.
Oder gibt es es ein anderes ähnliches Programm?
Was willst du denn genau machen?
Für reines OCR ist tesseract-ocr auch ohne grafische Oberfläche prima geeignet.
Ich kenne nichts besseres.
Bei WYSIWYG (Wat You See Is What You Get) wird es schwierig.
-
Was willst du denn genau machen?
Dokumente einscannen, zu pdf konvertieren und speichern.
-
Dokumente einscannen, zu pdf konvertieren und speichern.
Schon mal
probiert?
Eine GUI empfinde ich da als überflüssig.
Tesseract erspart das Konvertieren bzw. speichert gleich als PDF, wenn gewünscht.
-
Gibt es für "tesseract-ocr" eine Benutzeroberfläche? Oder gibt es es ein anderes ähnliches Programm?
Man kann es in den Einstellungen von xsane einbinden.
-
Man kann es in den Einstellungen von xsane einbinden.
Hallö Fr 13..
häätest Du ein toDo dazu für mich ??
Wollte mich die nächsten Tage eh mal damit beschäfftigen .. könntest etwas Arbeit ersparen..
..und nun auch Dir fröhliche Weihnachten 🎄 🎁 🎅 ☃️☃️
-
Hallö Fr 13..
häätest Du ein toDo dazu für mich ??
Fr. der 13 war zwar mal ein Glückstag für mich, aber mehr auch nicht
So z. B. ist es bei mir:
1. tesseract-ocr muss installiert sein
2. Man braucht ein script wie xsane2tess, das ist im Web zu finden
z. B. hier https://wiki.ubuntuusers.de/tesseract-ocr/
im Abschnitt xsane2tess zu finden.
Das was ich habe, ist wohl älter und hat weniger Optionen.
Falls das neuere im Link oben Probleme kann ich meine alte
Version hier mal posten.
Es ist bei mir im ~/bin untergebracht, das ist hier im PATH enthalten.
3. In der Konfiguration von xsane im Reiter Texterkennung
- OCR Befehl: xsane2tess -l deu
- Option für Eingabedatei: -i
- Option für Ausgabedatei: -o
4. Für den Scanvorgang nehme ich dann
- Betrachter
- Typ TEXT
- irgendeinen Dateinamen wie z. B. /tmp/001.txt
5. Scannen ggf. mit Vorschau für Feineinstellungen
6. Im Betrachter zum speichern unter Datei
Bild speichern
oder
OCR - als Text speichern
7. Das Ergebnis ist nun in der Datei von 4. wenn alles geklappt hat.
Standardmäßig ist in xsane wohl gocr voreingestellt.
Evtl. davon ein Screencopy machen, falls man wieder zurück möchte ...
Nachtrag:
Für PDF oder JPG als Zielformat braucht man das alles natürlich nicht. Das kann xsane von Haus aus.
Frohe Rest-Weihnachten.
-
-
gImageReader wäre vielleicht eine Option. Ist zwar nicht in den offiziellen Repositories, aber es gibt Community-Versionen.
-
Unter diesem Link findet man eine recht gute Übersicht für Konsolen und GUI Tools für sehr viele Bereiche.
Auch für OCR Software.