Optical Character Recognition (OCR)
Optical Character Recognition (OCR) bezeichnet die automatische TexterkennungMit der automatischen Texterkennung werden in Digitalisaten enthaltene gedruckte oder handschriftliche Texte in maschinenlesbare, durchsuchbare Texte umgewandelt.Bei gedruckten oder maschinengeschriebenen Werken erfolgt eine Optical Character Recognition (OCR), bei handschriftlichen Texten heißt das Verfahren Handwritten Text Recognition (HTR). Weiterlesen von gedruckten oder maschinengeschriebenen Werken. Der Scan des Durckwerks wird maschinell erfasst und in einen elektronischen Text umgeformt. Die Automatisierung beruht auf dem Erkennen von Mustern und Gesetzmäßigkeiten, dem so genannten maschinellen Lernen'Machine Learning, bzw. maschinelles Lernen im Deutschen, ist ein Teilbereich der künstlichen Intelligenz. Auf Grundlage möglichst vieler (Text-)Daten erkennt und erlernt ein Computer die häufig sehr komplexen Muster und Gesetzmäßigkeiten bestimmter Phänomene. Daraufhin können die aus den Daten gewonnen Erkenntnisse verallgemeinert werden und für neue Problemlösungen oder für die Analyse von bisher unbekannten Daten verwendet werden.' (Glossar forTEXT) Weiterlesen.
Die automatische Erkennung von Handschriften wird Handwritten Text Recognition (HTR)Handwritten Text Recognition (HTR) bezeichnet die automatische Erkennung von Handschriften. Der Scan der Handschrift wird maschinell erfasst und in einen elektronischen Text umgeformt. Die Automatisierung beruht auf dem Erkennen von Mustern und Gesetzmäßigkeiten, dem so genannten maschinellen Lernen (forTEXT). Weiterlesen genannt.
Zitierweise
HISTOFOX. 2026. „Optical Character Recognition (OCR)“. HISTOFOX. Das Informations-, Lern- und Lehrportal für Datenkompetenzen in den historisch arbeitenden Disziplinen. NFDI4Memory und Freie Universität Berlin. https://histofox.4memory-dataliteracy.de/glossar/optical-character-recognition-ocr/
