Logo

Suche in HISTOFOX

TooleScriptorium

eScriptorium

Übersicht

Das Tool eScriptorium ist eine webbasierte Anwendung für die automatische Texterkennung bei Bilddigitalisaten, sowohl bei Handschriften, der sog. Handwritten Text Recognition (HTR), als auch bei gedruckten Texten, der sog. Optical Character Recognition (OCR).

Methoden und Arbeitstechniken

Automatische Texterkennung (ATR)Mit der automatischen Texterkennung werden in Digitalisaten enthaltene gedruckte oder handschriftliche Texte in maschinenlesbare, durchsuchbare Texte umgewandelt.Bei gedruckten oder maschinengeschriebenen Werken erfolgt eine Optical Character Recognition (OCR), bei handschriftlichen Texten heißt das Verfahren Handwritten Text Recognition (HTR). Weiterlesen, Handwritten Text Recognition (HTR)Handwritten Text Recognition (HTR) bezeichnet die automatische Erkennung von Handschriften. Der Scan der Handschrift wird maschinell erfasst und in einen elektronischen Text umgeformt. Die Automatisierung beruht auf dem Erkennen von Mustern und Gesetzmäßigkeiten, dem so genannten maschinellen Lernen (forTEXT). Weiterlesen, Optical Character Recognition (OCR)Optical Character Recognition (OCR) bezeichnet die automatische Texterkennung von gedruckten oder maschinengeschriebenen Werken. Der Scan des Durckwerks wird maschinell erfasst und in einen elektronischen Text umgeformt. Die Automatisierung beruht auf dem Erkennen von Mustern und Gesetzmäßigkeiten, dem so genannten maschinellen Lernen. Weiterlesen

Anwendungsbeispiel

Video: UB Mannheim – Einführung eScriptorium, Universitätsbibliothek Mannheim 2022, lizenziert unter Standard-YouTube-Lizenz

Steckbrief

  • Systemanforderungen: Webbrowser für gehostete Instanzen; eScriptorium kann auch lokal aufgesetzt werden, dann speziellere Systemanforderungen wie Docker etc.
  • Stand der Entwicklung: Wird aktiv seit 2019 entwickelt
  • Herausgeber: Université Paris Sciences et Lettres, kollaborative Entwicklung und Unterstützung durch diverse Geldgeber u.a. durch Horizon 2020 der Europäischen Union
  • Lizenz: MIT-Lizenz
  • Kosten: kostenfrei, evtl. anfallende Kosten für Server zum Hosten einer eigenen Instanz
  • Weblink: https://scripta.gitlab.io/escriptorium/ Quellcode: https://gitlab.com/scripta/escriptorium Dokumentation: https://escriptorium.readthedocs.io/en/latest/ 
  • Im- und Export:
    • Import: PNG, JPG, TIFF, PDF, IIF, XML
    • Export: Nur Text, PAGE-XML, XML-ALTO'ALTO, auf Deutsch 'Analysiertes Layout und Textobjekt' ist ein XML-Standard für die Darstellung des physischen Layouts und der logischen Struktur von Text, der mit OCR oder HTR transkribiert wurde. Es behält alle geometrischen Koordinaten des Inhalts (Text, Illustrationen, Grafiken) im Bild bei und ermöglicht die Überlagerung von Bild und Text.' (o. A. 2024) Weiterlesen
  • Sprachen: Englisch, unvollständig Deutsch und Französisch

Eigenschaften

1. Für welche Methoden/Arbeitsschritte kann das Tool eingesetzt werden?

Das Kerngeschäft von eScriptorium ist die Digitalisierung von Handschriften, d. h. die automatisierte Handschriftenerkennung (HTR) und das manuelle Transkribieren. Zusätzlich ist auch eine optische Zeichenerkennung (OCR) für Druckschriften bei Auswahl entsprechender Modelle möglich. Editionswissenschaftliche Projekte können in eScriptorium ausgeführt werden, die Digitalisierung kann aber auch als Vorbereitung für eine Weiterverarbeitung der Texte mit anderen digitalen Tools dienen; dazu stehen unterschiedliche, auch XML-basierte Exportformate zur Verfügung (s.o.). eScriptorium steht konzeptionell in Konkurrenz zu Transkribus, ist im Gegensatz zu diesem aber Open Source. Es kann und muss auf eigenen Servern betrieben werden, was Vor- und Nachteile mit sich bringt. Die Einstiegshürden sind im Vergleich zu Transkribus deutlich höher, dafür können sämtliche Daten aber unter eigener Kontrolle verbleiben und es besteht keine Abhängigkeit zu einer Firma, die Nutzungskosten und Funktionsumfang der Software regelmäßig ändert.

2. Welche Funktionalitäten bietet das Tool und wie zuverlässig ist es?

eScriptorium bietet einen Workflow, der zentral auf die Automatic Text Recognition (siehe Artikel Automatic Text Recognition) ausgelegt ist:

  • Erstellen von Projekten und Upload von Dokumenten in unterschiedlichen Formaten
  • Automatische und manuelle Segmentierung des Textes, Training und Nutzung eigener Segmentierungsmodelle möglich
  • Nutzung automatischer Texterkennung mittels HTR- und OCR-Modellen
  • Training eines eigenen HTR-Modells für eine bestimmte Schrift, Import von vorgefertigten Modellen aus anderen Projekten
  • Fehlerquotenmessung von HTR und OCR
  • Ausgabe der Transkripte in unterschiedliche Formate

Grundvoraussetzung für die Nutzung ist wie bei allen ATR-Systemen, dass hochwertige Scans verwendet werden. Durch die verwendeten Segmentierungsmodelle können auch komplexere Layouts (wie bspw. Tabellen oder Texte mit mehreren Spalten) häufig größtenteils richtig erfasst werden. eScriptorium bietet neben den Methoden zur automatischen Erkennung auch die Möglichkeit der manuellen Auszeichnung von Zeilen, ihrer Abfolge und ihres Inhaltes.

3. Ist das Tool für Digital-History-Einsteiger*innen geeignet?

Checkliste√ / teilweise / –
Grafische Benutzeroberfläche
Intuitive Bedienbarkeitteilweise
Leichter Einstieg
Handbuch vorhandenteilweise
Videotutorials
Gibt es eine gute Nutzerbetreuung?teilweise

Die Benutzeroberfläche ist für Einsteiger nicht intuitiv. Die für ein übliches Projekt benötigten Einstellungen und der zugehörige Workflow sind jedoch immer ähnlich, so dass über ausführliche Tutorials auch ein Einstieg für Laien möglich ist. Aus Einsteigerperspektive ist problematisch, dass es keine zentrale Nutzerbetreuung gibt, sondern diese dezentral erfolgen muss durch die Betreiber der jeweiligen Instanz und allgemein verfügbare Tutorials, Handreichungen und Schulungen bzw. Videos.

4. Unterstützt das Tool kollaboratives Arbeiten?

☒  ja☐  nein

Es kann kollaborativ an Projekten gearbeitet werden, wodurch vor allem die Korrektur der Segmentierung und Texterkennung auf mehrere Personen verteilt werden kann. Es können Nutzergruppen angelegt werden, deren Mitgliedern dann gemeinschaftlich Berechtigungen für ein Projekt zugewiesen werden. Eine differenzierte Rechteverwaltung ist jedoch nicht vorgesehen.

5. Hinweise zur Sicherheit?

Durch Bereitstellen einer eigenen Instanz verbleibt die volle Kontrolle über alle hochgeladenen Bilddigitalisate und die erstellten Transkriptionen beim jeweiligen Projekt. Gleichzeitig ist die betreibende Institution oder Person der jeweiligen Instanz damit dann auch für deren Sicherheit verantwortlich. Es muss alles richtig konfiguriert sein, so dass kein unberechtigter Zugriff stattfinden kann und Sicherheitsupdates müssen eingespielt werden. Außerdem muss darauf geachtet werden, ob eventuelle Sicherheitsprobleme in von eScriptorium benutzen Komponenten aufgetreten sind.

Tutorials

Literatur und Quellenangaben

Zitierweise

Benz, Jacob. 2026. „eScriptorium“. HISTOFOX. Das Informations-, Lern- und Lehrportal für Datenkompetenzen in den historisch arbeitenden Disziplinen. NFDI4Memory und Freie Universität Berlin. https://histofox.4memory-dataliteracy.de/tools/escriptorium/