OCR

Hinweis: In dem Thema OCR gibt es 31 Antworten auf 4 Seiten. Der letzte Beitrag () befindet sich auf der letzten Seite.
  • Dem möchte ich mit anschließen, es kommt auf mehrere Aspekte an.


    An Abby Finereader kommt natürlich keiner heran, aber das ist unter Windows wahrscheinlich auch nicht anders....

    Für den Inhalt des Beitrages 295310 haftet ausdrücklich der jeweilige Autor: Sauerland

  • Tesseract ist ein Konsolenprogramm - und ich denke gar nicht daran, irgendetwas mit Konsole zu machen. Dieser ganze Konsolenkram ist einer der Gründe, weshalb sich Linux nicht weiter als Desktop verbreitet. Es bleibt mir auch unverständlich, weshalb man es nicht schafft, tesseract eine vernünftige GUI mitzugeben.

    Für den Inhalt des Beitrages 295311 haftet ausdrücklich der jeweilige Autor: matbhm

  • Es geht um optische Texterkennung von gescannten Seiten. Ich habe nach diesem Verweis: OCR

    xsane und gocr installiert.

    Ich komme damit nicht recht klar. Hat jemand Erfahrung damit?

    OCR ist nicht unbedingt eine Stärke von Linux

    Eine Übersicht findest du hier:

    Texterkennung › Wiki › ubuntuusers.de


    Ich habe selbst keinen Bedarf mehr an OCR, daher kann ich keine qualifizierte Aussage dazu machen, wie es mit den diversen Programmen unter Opensuse aktuell damit klappt.

    Es gibt einige readiris- und abby-Versionen, die seinerzeit einwandfrei unter Wine liefen und tadellose Ergebnisse brachten.

    Man findet diese Versionen manchmal noch auf ebay.


    Wenn dieser Weg zu mühsam ist: Es gibt eine Reihe von Online-Diensten, die preiswert/Kostenlos (je nach Umfang und Anspruch) diesen Service übernehmen.
    Stichwort: "OCR online"

    There's no place like 127.0.0.1

    Einmal editiert, zuletzt von wurzel99 ()

    Für den Inhalt des Beitrages 295316 haftet ausdrücklich der jeweilige Autor: wurzel99

  • denn Texterkennung unter Linux kannst Du vergessen.

    Das würde ich so pauschal nicht formulieren. Ich habe da in der Vergangenheit schon gute Ergebnisse erzielt.

    Hier findest du eine Liste, welche grafischen Lösungen es für OCR unter Linux gibt (wohl nicht vollständig). Etwas Zeit und Geduld solltest du allerdings mitbringen. Du wirst dich da schon etwas mit befassen müssen.

    Direkt über dieser Liste, findest du weitere Anwendungen (Konsolenbasiert).

  • Yagf wird seit Ende 2019 nicht mehr weiterentwickelt und führt zu Abhängigkeitskonflikten. Es gibt eben kein offizielles Paket.

    Für den Inhalt des Beitrages 295326 haftet ausdrücklich der jeweilige Autor: matbhm

  • und führt zu Abhängigkeitskonflikten.

    Das ist tatsächlich nicht ohne, wenn man qt4 nicht komplett selbst bauen will. Es gibt Distributionen, da kannst du das schmerzfrei installieren. Bei openSUSE würde ich da in der Tat davon Abstand nehmen. Aber es gibt ja noch Alternativen, wie man in der Liste sieht, die ich oben verlinkt habe.

  • Gimagereader kann man natürlich selbst kompilieren - benutzerfreundlich ist anders (Das Herunterladen der von sandromi zuletzt Anfang 2020 gepflegten Version führt zu Abhängigkeitskonflikten). Es bleibt bei der Frage, weshalb man nicht tesseract von vornherein mit einem GUI ausliefert. Es ist eben symptomatisch für die Probleme Linux', was der Verbreitung auf dem Desktop entgegensteht. Und es ist eben typisch, dass es mehrere entsprechende Programme gibt, die aber alle nicht richtig ausgereift sind. Die gocr-GUI ist ein Witz und bewegt sich auf dem Niveau von Anfang der 90er des letzten Jahrhunderts, jenseits der mäßigen Fähigkeiten der Texterkennung. Und Tesseract mag ganz gut funktionieren - als Konsolenprogramm. Das ist aber 2021 sicher nicht state of the art! Die Konsoleneingabe ist etwas für Neerds.

    Für den Inhalt des Beitrages 295335 haftet ausdrücklich der jeweilige Autor: matbhm

  • Gimagereader kann man natürlich selbst kompilieren - benutzerfreundlich ist anders (Das Herunterladen der von sandromi zuletzt Anfang 2020 gepflegten Version führt zu Abhängigkeitskonflikten). Es bleibt bei der Frage, weshalb man nicht tesseract von vornherein mit einem GUI ausliefert. Es ist eben symptomatisch für die Probleme Linux', was der Verbreitung auf dem Desktop entgegensteht. Und es ist eben typisch, dass es mehrere entsprechende Programme gibt, die aber alle nicht richtig ausgereift sind. Die gocr-GUI ist ein Witz und bewegt sich auf dem Niveau von Anfang der 90er des letzten Jahrhunderts, jenseits der mäßigen Fähigkeiten der Texterkennung. Und Tesseract mag ganz gut funktionieren - als Konsolenprogramm. Das ist aber 2021 sicher nicht state of the art! Die Konsoleneingabe ist etwas für Neerds.

    Ich habe nicht vom kompilieren gesprochen.......


    Denn wie du eigentlich wissen müsstest, baue ich so etwas im OBS und stelle damit der Gemeinschaft auch mein Repo mit den rpms zur Verfügung......

    Und damit einfach über zypper/Yast zu installierende Pakete.

    Für den Inhalt des Beitrages 295336 haftet ausdrücklich der jeweilige Autor: Sauerland