Was ist neu

Anständige Freeware zur Texterkennung

Seniors
Beitritt
28.01.2008
Beiträge
1.006

Anständige Freeware zur Texterkennung

Guten Tag, emsige Autoren,

kennt jemand von Euch ein kostenloses Programm zur Texterkennung, das auch etwas taugt? Ich will einen Berg Schrift auf Altpapier einscannen und bin da gestern stundenlang dran verzweifelt; entweder wollen die Programme gekauft sein, oder sie erkennen kein Deutsch, oder sie laufen nach wenigen Scans ab. Eines, das dreißig Tage lang als Vollversion zu laufen verprach, spuckte nur rätselhafte Zeichenkolonnen aus.
Vielleicht gibt's das ja auch einfach nicht, dann muß ich eben alles eintippen, aber natürlich hoffe ich jetzt auf den Link des Jahrhunderts von Euch. Make my day!

Makita.

 

Hehe. Das ist nicht schlecht! In der Form erkennt er zumindest generell mal Deutsch. Ich hatte mir freeOCR heruntergeladen, aber da wollte er nur Englisch und Spanisch erkennen.
Hier mein erstes Ergebnis mit Deinem Link (Auszug):

hart und steif wurde wie eine güne Buxmeßnuna stzeiäe sich ihren Reck uber denK\^pfund machte ein paar Schritte mfdep goßen Kirsäenk zu.Sie eüiete beideTüren und ein Stunnelstrium um Kettenßumnimasken und ckrchsichtiger Spitzen·wäsche
:D

Ich übe noch, vielen Dank jedenfalls mal.

 

also n hunni ist mir mein finereader echt wert. der erkennt alles, so lange die auflösung stimmt. der schneidet und dreht auch automatisch gerade, liest zeitung und von farbigem papier, bildet tabellen bearbeitbar nach und nutzt mehrfacheinzug. mit freeware kriegt man mehr salat. scanne mit gut 200 dpi, dann wird ocr generell besser.

 
Zuletzt bearbeitet:

krill, Du willst wohl ein Stunnelstrium in die Buxmeßnuna! Kannst Du denn gar nichts ernstnehmen? Ich leide hier, Du ahnst es nicht.
Jetzt versuche ich gerade, ein language pack zu installieren. Das eröffnet ganz neue Möglichkeiten für bizarrste Fehlermeldungen.

Da, guckt, was es gebracht hat:

z! ,_¤¤: ¢ x .
¤ ~!®;*¢· Ö? *1 Ei; ¤··w*= —« ..
‘ ,4, ' T-„E£ »"‘§ ‘ é . &;-‘- V ’ !¥. ‘ g "" ‘?° ¤ 2;;* gw ,„„ , ,_
if ' — ’'“ ‘ Hä ·— ‘ ‘ E ‘“ ‘ E pf " ÄQ._ $== —·— · ~: ~-V»— · A „ ,

SchreiBär, daß Dein Programm taugt, bezweifle ich nicht. Mit der Demo hatte ich viel Freude, bevor sie nach wenigen Scans grausam ablief.
Ich hab aber keinen Hunni. Geduld hab ich auch nicht, aber vor allem keinen Hunni. :(

 
Zuletzt bearbeitet:

Danke, SchreiBär, für das liebe Angebot, aber es sind zu viele Seiten, über hundert, auf teilweise schauerlichst zerknicktem Karopapier, vergilbt, uralte Schreibmaschine oder totenblasser Nadeldrucker, teilweise winzigkleine Buchstaben; es ist handschriftlich darin herumgekritzelt, manches ist nach den Regeln des Mad Professor mithilfe rostiger Büroklammern irgendwie gebündelt, das meiste fliegt einfach so herum.
Ich hab mir in den Kopf gesetzt, das einzuscannen und zu korrigieren, weil geile Sachen dabei sind, geschrieben von einem alten Freund, den ich jahrelang nicht gesehen habe und der mir das jetzt endlich in die Finger gab ("Mach damit, was du willst"). Vielleicht kann ich ihn in ferner Zukunft sogar noch dazu überreden, sich ein Internet zuzulegen.

Inzwischen konnte ich einen Teilerfolg verbuchen: FreeOCR hat mein language pack gefressen, und mit Deinem Tip zur niedrigen Auflösung hab ich 6 der unproblematischeren Seiten brauchbar eingescannt.

 
Zuletzt bearbeitet:

Word kostet aber Geld.

Und Google machts mit Tesseract, das auch FreeOCR verwendet und das Ding hinter dem Link von Berg.

 

Word kostet aber Geld.

Ja. Der dummerweise nicht hingeschriebene Gedanke hinter meinem Post oben war, daß Word auf vielen Rechnern sowieso installiert ist, aber vermutlich nur wenige Leute von den OCR-Fähigkeiten wissen.

 

Hallo Makita,

ich scane sehr viel mit einem alten Finereader 5.0, den ich mal für n paar Euro bei Amazon erworben habe. Das zentrale Problem sehe ich bei

zerknicktem Karopapier, vergilbt, uralte Schreibmaschine ... totenblasser Nadeldrucker, ... winzigkleine Buchstaben; ... handschriftlich darin herumgekritzelt
Das ist nach meinen Erfahrungen oft nur mit viel Arbeit - hohe Auflösung und mit Helligkeit und Kontrast herumprobieren - zu schaffen und auch dann ist sehr viel Korrekturarbeit erforderlich.
Ich scanne in diesen Fällen die Texte erst einmal mit einem Zeichenprogramm (notfalls Paint) ein und speichere sie. Dann Bearbeitung der Texte (Flecken und handschriftliche Notizen soweit möglich entfernen) und dann im OCR durchlaufen lassen, wenn ich mal wieder Zeit habe.
Auf jeden Fall eine zeitraubende Arbeit, die mich in manchen Fällen dazu getrieben hat, die Texte abzutippen, weils einfach schneller geht und nicht so frustrierend ist.

Gruss

Jobär

 

Letzte Empfehlungen

Neue Texte

Zurück
Anfang Bottom