Dem möchte ich mit anschließen, es kommt auf mehrere Aspekte an.
An Abby Finereader kommt natürlich keiner heran, aber das ist unter Windows wahrscheinlich auch nicht anders....
Dem möchte ich mit anschließen, es kommt auf mehrere Aspekte an.
An Abby Finereader kommt natürlich keiner heran, aber das ist unter Windows wahrscheinlich auch nicht anders....
Tesseract ist ein Konsolenprogramm - und ich denke gar nicht daran, irgendetwas mit Konsole zu machen. Dieser ganze Konsolenkram ist einer der Gründe, weshalb sich Linux nicht weiter als Desktop verbreitet. Es bleibt mir auch unverständlich, weshalb man es nicht schafft, tesseract eine vernünftige GUI mitzugeben.
Es geht um optische Texterkennung von gescannten Seiten. Ich habe nach diesem Verweis: OCR
xsane und gocr installiert.
Ich komme damit nicht recht klar. Hat jemand Erfahrung damit?
OCR ist nicht unbedingt eine Stärke von Linux
Eine Übersicht findest du hier:
Texterkennung › Wiki › ubuntuusers.de
Ich habe selbst keinen Bedarf mehr an OCR, daher kann ich keine qualifizierte Aussage dazu machen, wie es mit den diversen Programmen unter Opensuse aktuell damit klappt.
Es gibt einige readiris- und abby-Versionen, die seinerzeit einwandfrei unter Wine liefen und tadellose Ergebnisse brachten.
Man findet diese Versionen manchmal noch auf ebay.
Wenn dieser Weg zu mühsam ist: Es gibt eine Reihe von Online-Diensten, die preiswert/Kostenlos (je nach Umfang und Anspruch) diesen Service übernehmen.
Stichwort: "OCR online"
denn Texterkennung unter Linux kannst Du vergessen.
Das würde ich so pauschal nicht formulieren. Ich habe da in der Vergangenheit schon gute Ergebnisse erzielt.
Hier findest du eine Liste, welche grafischen Lösungen es für OCR unter Linux gibt (wohl nicht vollständig). Etwas Zeit und Geduld solltest du allerdings mitbringen. Du wirst dich da schon etwas mit befassen müssen.
Direkt über dieser Liste, findest du weitere Anwendungen (Konsolenbasiert).
nochmal was aktuelles
tesseract
https://de.wikipedia.org/wiki/Tesseract_(Software)
gibt es für Opensuse incl einer GUI
Es gibt noch weitere Oberflächen - einfach mal im Wikipedia-Artikel nachsehen. Einige habe ich für Opensuse schon gefunden.
Yagf wird seit Ende 2019 nicht mehr weiterentwickelt und führt zu Abhängigkeitskonflikten. Es gibt eben kein offizielles Paket.
und führt zu Abhängigkeitskonflikten.
Das ist tatsächlich nicht ohne, wenn man qt4 nicht komplett selbst bauen will. Es gibt Distributionen, da kannst du das schmerzfrei installieren. Bei openSUSE würde ich da in der Tat davon Abstand nehmen. Aber es gibt ja noch Alternativen, wie man in der Liste sieht, die ich oben verlinkt habe.
Gerade mal gimagereader aus dem Repo von Malcolm Lewis gebaut, installiert, heutigen Brief aufgelegt und gescannt und funktioniert.
Gimagereader kann man natürlich selbst kompilieren - benutzerfreundlich ist anders (Das Herunterladen der von sandromi zuletzt Anfang 2020 gepflegten Version führt zu Abhängigkeitskonflikten). Es bleibt bei der Frage, weshalb man nicht tesseract von vornherein mit einem GUI ausliefert. Es ist eben symptomatisch für die Probleme Linux', was der Verbreitung auf dem Desktop entgegensteht. Und es ist eben typisch, dass es mehrere entsprechende Programme gibt, die aber alle nicht richtig ausgereift sind. Die gocr-GUI ist ein Witz und bewegt sich auf dem Niveau von Anfang der 90er des letzten Jahrhunderts, jenseits der mäßigen Fähigkeiten der Texterkennung. Und Tesseract mag ganz gut funktionieren - als Konsolenprogramm. Das ist aber 2021 sicher nicht state of the art! Die Konsoleneingabe ist etwas für Neerds.
Gimagereader kann man natürlich selbst kompilieren - benutzerfreundlich ist anders (Das Herunterladen der von sandromi zuletzt Anfang 2020 gepflegten Version führt zu Abhängigkeitskonflikten). Es bleibt bei der Frage, weshalb man nicht tesseract von vornherein mit einem GUI ausliefert. Es ist eben symptomatisch für die Probleme Linux', was der Verbreitung auf dem Desktop entgegensteht. Und es ist eben typisch, dass es mehrere entsprechende Programme gibt, die aber alle nicht richtig ausgereift sind. Die gocr-GUI ist ein Witz und bewegt sich auf dem Niveau von Anfang der 90er des letzten Jahrhunderts, jenseits der mäßigen Fähigkeiten der Texterkennung. Und Tesseract mag ganz gut funktionieren - als Konsolenprogramm. Das ist aber 2021 sicher nicht state of the art! Die Konsoleneingabe ist etwas für Neerds.
Ich habe nicht vom kompilieren gesprochen.......
Denn wie du eigentlich wissen müsstest, baue ich so etwas im OBS und stelle damit der Gemeinschaft auch mein Repo mit den rpms zur Verfügung......
Und damit einfach über zypper/Yast zu installierende Pakete.