XSane & Tesseract

Hinweis: In dem Thema XSane & Tesseract gibt es 7 Antworten. Der letzte Beitrag () befindet sich ganz unten auf dieser Seite.
  • Ich benutze (wenn auch selten) xsane zum scannen von Bildern.
    XSane, weil Ich damit auch direkt OCR benutzen kann.
    Bei der Arbeit "lag" ein Dokumentanscanner da (Fujitsu fi 6300), der SOFORT funktioniert hat.
    Ich scane damit öfters Text, was SAUSCHNELL geht. Was mich ein wenig stört ist, daß man zuerst die ganze Seite scannen muß, dann einen Ausschnitt auswählen, das Blatt noch einmal einlegen muß UND nocheimal das Scannen starten muß.


    Die Frage ist, kann man bei dem gascanten Bild einen Ausschnitt auswählen, der gespeichert bzw. OCRt werden kann? Ich habe keinen Auschnitt in gescannten Bild auswählen können.


    DANKE ;)


    Noch ein Frage: Tesseract ist SUPER (bis auf das, daß es eine Möglichkeit geben sollte, das Wörter nicht abgebrochen werden. Beispielweise können Wörter am Ende des Blattes mit "-" enden und in der nächsten Zeite fortgesetzt werden- Es wäre besser wenn beide Teile zusammengesetzt werden.
    Anstatt Beispielweise "Auto-rennen" "Autorennen" UND nicht in einer neuen Zeile beginnen.


    Danke, den Leuten die solche Software entwickeln!

  • Hi Darius,


    Zitat

    ch scane damit öfters Text, was SAUSCHNELL geht. Was mich ein wenig
    stört ist, daß man zuerst die ganze Seite scannen muß, dann einen
    Ausschnitt auswählen, das Blatt noch einmal einlegen muß UND nocheimal
    das Scannen starten muß.

    Ich nutze auch Xsanse. Ist zwar nicht sauschnell, denn es liegt wohl eher an meinem ca. 16 Jahre alten Scanner. Okay, ich muß auch das gesamte Dokument einscannen, bevor ich einen Ausschnitt auswählen kann.
    Der liegt ja wohl auch bei den meisten Vorlagen auch immer woanders. Ausnahmen gibt es bestimmt.
    Aber wieso das Blatt nochmal einlegen? Und dann nochmal scannen?


    Zum Thema Tesseract?
    Dazu werden dir die Moderatoren bestimmt etwas sagen.....


    Gruß
    Thomas

    Für den Inhalt des Beitrages 78437 haftet ausdrücklich der jeweilige Autor: ThomasS

  • Ist zwar nicht sauschnell, denn es liegt wohl eher an meinem ca. 16 Jahre alten Scanner.

    zu Hause benutze Ich den Drucker, auch zum scannen und da muß sich viel bewegen (also langsamer).
    Auf der "Arbeit" gibt es einen Dokumentenscanner, wo das Blatt einfach durchgezogen wird und damit die Aktion maximal 3 sekunden dauert ;)

    Okay, ich muß auch das gesamte Dokument einscannen, bevor ich einen Ausschnitt auswählen kann.

    besser wäre es, das ganze Bild zu 100% zu scannen in der Richtigen auflösung und dann den Ausschnitt zu wählen.

    Okay, ich muß auch das gesamte Dokument einscannen, bevor ich einen Ausschnitt auswählen kann.

    das ist das blöde wenn man nur Text um OCR scannen will und auf diesem Text auch Bilder eingefügt sind.

  • DariusBrewka:
    Nur als Info nebenbei:
    Es gibt übrigens auch eine kostenpflichtige OCR-Software für Linux die sehr gut und einfach zu funktionieren scheint:
    http://www.abbyy.de/ocr-sdk-linux/
    Hier wird die Software sehr gut beschrieben und veranschaulicht:
    http://www.linuxforen.de/forum…it-Grafik-in-odt-Dokument
    Musst Du natürlich selbst wissen ob Dir diese Funktion das Geld wert ist.
    Ich bevorzuge ja auch kostenloses open-source, weshalb eine Anleitung für Tesseract mir auch lieber wäre!

  • Ich benutze YAGF,Tesseract(-gui) oder Cuneiform

    Theoretisch ja, das Problem am Rechner bei der Arbeit ist:


    YAGF, immer wenn ein Bild geöffnet wird (auch direkt über den Scanner), beendet sich YAGF (genau kann Ich mich aber, zur Zeit nicht erinnern).


    Tesseract-gui startet erst gar nicht."Attempt to unlock mutex that was not locked". Das kennst du ja ?, hast ja auch zum zweiten Teil meiner Frage geantwortet (Stelllarium).


    Cuneinform (ist irgendwie so etwas ähnliches wie Tesseract??), die GUI macht für mich aber kaum sinn, da Ich ebenso wie bei XScane keinen Ausschnitt wählen kann, d.h. den mit OCR zu erkennenden Text, erst aus dem Bild herausschneiden muß.

  • Dann poste doch einmal, woher Yagf oder Tesseraxt-Gui sowie cuneiform ist:

    Code
    zypper se -si tesseract yagf cuneiform

    Für den Inhalt des Beitrages 78492 haftet ausdrücklich der jeweilige Autor: Sauerland