Logo

Suche in HISTOFOX

LerneinheitAutomatische Texterkennung

Übung 3

Welche Vor- und Nachteile bietet ATR? Wo liegen die Grenzen dieser Systeme? Machen Sie sich Notizen und vergleichen Sie mit dem Lösungsvorschlag.

ATR ermöglicht die schnelle Umwandlung einer großen Zahl an Textdokumenten in ein maschinenlesbares Format, im Idealfall fast oder sogar vollständig automatisch. Durch die technologische Weiterentwicklung ist die Erkennungsrate auch bei Handschriften oder Fraktur zunehmend besser. Gerade bei diesen kann das Ergebnis dennoch noch immer zu wünschen übrig lassen. Auch veraltete Schreibweisen oder Eigennamen lassen ATR-Systeme oft an ihre Grenzen stoßen. Das manuelle Transkribieren von einigen Inhalten als Training für ein ATR-System lohnt sich insbesondere bei einem einheitlichen (hinsichtlich Schriftart, Wortgebrauch etc.) und großen Korpus. Auch wenn überwiegend manuelle Transkription notwendig ist, können andere Features von ATR-Systemen dennoch nützlich sein, beispielsweise Zeilenerkennung.