LEAF-Writer
Inhaltsverzeichnis
Übersicht
LEAF-Writer ist eine webbasierte Anwendung insbesondere zur digitalen Annotation von Texten, die im TEI-Format vorliegen. LEAF-Writer abstrahiert dabei die Details von TEITEI (Text Encoding Initiative) bezeichnet sowohl eine Organisationsiehe unter: https://tei-c.org/ als auch ein gleichnamiges Dateiformat. Letzteres basiert auf XML (Extensible Markup Language), einer weit verbreiteten Auszeichnungssprache, und hat sich in den Geisteswissenschaften als Standard zur Kodierung und Auszeichnung von Texten durchgesetzt. Mit Hilfe von TEI ist es möglich, maschinenlesbar Elemente eines Textes auszuzeichnen, wie beispielsweise Absätze oder Überschriften.Die Spezifikation von TEI - auch Guidelines genannt - kann unter https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html eingesehen werden. Zudem können Inhalte wie Personen- oder Ortsnamen als solche markiert und Anmerkungen eines kritischen Apparates eingefügt werden. Im Hinblick auf das Forschungsdatenmanagement ist es vorteilhaft, dass es sich bei TEI um ein Nur-Text-Format handelt, es also auch ohne spezielle Programme von Menschen interpretiert werden kann. Weiterlesen und bietet einen benutzerfreundlichen Einstieg in Annotation, aber auch Transkription.
Methoden und Arbeitstechniken
AuszeichnungAuszeichnung bezeichnet den Vorgang, Daten oder Inhalte mit einer Zeichenfolge zu versehen, um bestimmte Eigenschaften oder Metadaten maschinenlesbar zu kennzeichnen. Typische Beispiele sind HTML-Tags oder Markup-Sprachen wie XML. Auszeichnung ist damit eine spezifische, technisch formalisierte Form der Annotation. Weiterlesen, AnnotationAnnotieren bezeichnet die Tätigkeit, Informationen über ein digitales Objekt explizit zu machen, indem Notizen, Metadaten, Schlüsselwörter, Tags oder Links hinzugefügt werden. Dies können erklärende Anmerkungen sein, die einen Abschnitt kommentieren oder kontextualisieren, strukturelle oder sprachliche Informationen explizit machen, mit offenen Daten verknüpfen, die die Beziehungen zwischen Objekten maschinenlesbar machen, oder allgemeine Metadaten, die das Objekt als Ganzes beschreiben. Eine spezifische Form der Annotation ist die technische Auszeichnung mittels Markup-Sprachen wie z. B. Markdown oder XML (Borek et al 2021). Weiterlesen, DatenbearbeitungBearbeiten bezieht sich auf das Hinzufügen, Korrigieren, Verdichten, Organisieren oder anderweitige Modifizieren von Informationen zu einem bestimmten Objekt mit dem Ziel, dieses inhaltlich zu vervollständigen. Dies kann durch strukturelle, layoutbezogene oder semantische Auszeichnungen erfolgen, entweder direkt im Dokument (Inline-Markup) oder in einer separaten Datei (Stand-off-Markups) (Borek et al 2021). Weiterlesen
Steckbrief
- Systemanforderungen: Webbrowser
- Stand der Entwicklung: aktive Weiterentwicklung
- Herausgeber: Collaboratory for Writing and Research on Culture (CWRC) / Hochschule Darmstadt
- Lizenz: GNU AGPLv3
- Kosten: kostenfrei
- Weblink: stabile Instanz der Hochschule Darmstadt: https://stable.leafwriter.users.h-da.cloud/ / Entwicklungsinstanz der Hochschule Darmstadt: https://dev.leafwriter.users.h-da.cloud/ / Instanz des CWRC: https://leaf-writer.leaf-vre.org/
- Im- und Export:
- Import: TEITEI (Text Encoding Initiative) bezeichnet sowohl eine Organisationsiehe unter: https://tei-c.org/ als auch ein gleichnamiges Dateiformat. Letzteres basiert auf XML (Extensible Markup Language), einer weit verbreiteten Auszeichnungssprache, und hat sich in den Geisteswissenschaften als Standard zur Kodierung und Auszeichnung von Texten durchgesetzt. Mit Hilfe von TEI ist es möglich, maschinenlesbar Elemente eines Textes auszuzeichnen, wie beispielsweise Absätze oder Überschriften.Die Spezifikation von TEI - auch Guidelines genannt - kann unter https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html eingesehen werden. Zudem können Inhalte wie Personen- oder Ortsnamen als solche markiert und Anmerkungen eines kritischen Apparates eingefügt werden. Im Hinblick auf das Forschungsdatenmanagement ist es vorteilhaft, dass es sich bei TEI um ein Nur-Text-Format handelt, es also auch ohne spezielle Programme von Menschen interpretiert werden kann. Weiterlesen-XML, BilddigitalisateDigitalisate werden hergestellt, indem analoge Materialien wie Bücher, Handschriften, Urkunden, Bilder, Artefakte in digitale Formate überführt werden, die elektronisch gesichert werden. Digitale Daten haben den Vorteil, dass sie vervielfacht, geteilt und maschinell verarbeitet werden können (Data Affairs, Glossar). Weiterlesen
- Export: TEI-XML, MarkdownMarkdown ist eine Auszeichnungssprache für Text. Es können grundlegende Formatierungen wie Überschriften, Aufzählungen, Tabellen etc. ausgezeichnet werden. Ziel von Markdown ist es, leicht les- und erstellbar zu sein. Softwareentwicklungsplattformen wie GitHub oder GitLab nutzen Markdown beispielsweise für die Formatierung von ReadMe-Dateien und Projekt-Wikis. Ein mit Markdown ausgezeichnetes Beispiel... Weiterlesen, HTML
- Sprachen: Englisch, Deutsch, unvollständige Übersetzung ins Französische, Spanische und Portugiesische
Eigenschaften
1. Für welche Methoden/Arbeitsschritte kann das Tool eingesetzt werden?
Der LEAF-Writer eignet sich besonders zum Annotieren von TEI-Dokumenten, um darin Entitäten wie beispielsweise Personen, Orte, Werke etc. auszuzeichnen und diese mit Normdaten'Normdaten bilden Identifikationen und standardisierte normierte Datensätze in Form von eindeutigen Nummern, anhand derer Personen, Werke, Institutionen, Forschungsförderer, Körperschaften oder Schlagwörter eindeutig beschrieben und zuordenbar werden. Eine fälschliche oder doppelte Zuordnung entfällt durch diese normierten Daten. Insbesondere in Katalogen und Datenbanken können durch Normdaten Informationen zu bestimmten Entitäten vereinfacht herausgefunden werden, wodurch eine digitale Vernetzung und Auffindbarkeit zwischen Projekten stattfinden kann. Weiterlesen z. B. aus WikidataWikidatasiehe: https://www.wikidata.org/wiki/Wikidata:Main_Page ist eine internationale, kollaborative Wissensdatenbank, die eng mit Wikipedia verknüpft ist und auf deren Konzept der Wissenssammlung aufbaut. Sie kann als Normdatei verwendet werden. Viele Einträge sind zudem mit weiteren Ressourcen verknüpft und verweisen beispielsweise auf zugehörige Einträge in der GND. Weiterlesen und der GNDDie Gemeinsame Normdatei (GND) ist eine deutschsprachige Normdatei, die von der Deutschen Nationalbibliothek zusammen mit Partnern aus den deutschsprachigen Bibliotheksverbünden und weiteren Einrichtungen gepflegt wird. Sie umfasst Einträge zu einer breiten Auswahl an Entitäten aus den Bereichen Personen, Körperschaften, Konferenzen, Geografika, Sachbegriffen und Werken (Gemeinsame Normdatei (GND) 2025). Weiterlesen zu verknüpfen. Basierend auf diesen Auszeichnungen können anschließend weitere Analysen wie beispielsweise Netzwerkanalysen ausgeführt werden. Momentan wird der LEAF-Writer erweitert, um auch das manuelle Transkribieren und Überführen nach TEI von Bilddigitalisaten zu unterstützen.
2. Welche Funktionalitäten bietet das Tool und wie zuverlässig ist es?
- Anzeige von TEI-Dokumenten und Bilddigitalisaten Seite-an-Seite
- Darstellung von TEI-Elementen nach dem Prinzip What You See Is What You Mean (WYSIWYM)
- Auszeichnen von Entitäten und Verknüpfung mit Normdaten
- Transkribieren und Strukturierung des Dokuments durch TEI-Elemente
- Speichern von Projekten (Bilddigitalisate und zugehöriges TEI-Dokument) in einem git-Repositorium auf GitLab oder GitHub. Dabei werden auch selbstgehostete Instanzen, beispielsweise von Universitäten, unterstützt.
LEAF-Writer ist ein insgesamt zuverlässiges Tool, das international im Rahmen von Projekten der Digital Humanities unter anderem zur Erstellung digitaler Editionen eingesetzt wird und stabil läuft. Fehler werden im Rahmen der Weiterentwicklung behoben.
3. Ist das Tool für Digital-History-Einsteiger*innen geeignet?
| Checkliste | √ / teilweise / – |
|---|---|
| Grafische Benutzeroberfläche | √ |
| Intuitive Bedienbarkeit | größtenteils |
| Leichter Einstieg | √ |
| Handbuch vorhanden | √ |
| Videotutorials | √ |
| Gibt es eine gute Nutzerbetreuung? | teilweise |
LEAF-Writer wurde mit dem expliziten Ziel entwickelt, einsteigerfreundlich zu sein und die Details von TEI-XML zu abstrahieren. Bei Nutzung von GitHub oder GitLab als Speicherort sind jedoch zumindest grundlegende Kenntnisse über dieses SoftwareentwicklungsplattformenModerne Softwareentwicklung findet in aller Regel über speziell dafür entwickelte Plattformen statt, die Methoden zum Projektmanagement und der Verwaltung des Quellcodes bieten. Für Letzteres hat sich das Tool git als De-Facto-Standard etabliert. Softwareentwicklungsplattformen bieten die Möglichkeit, die Entwicklung projektzentriert durchzuführen und neben dem Quellcode beispielsweise ein Wiki zu pflegen und Fehler mittels eines Issue-Trackers nachzuverfolgen. Über diesen können auch Nutzer*innen von Software Fehler melden. Diese Plattformen bieten auch weitere Mechanismen zur Automatisierung, z. B. das automatische Erstellen von lauffähigen Programmen aus dem Quellcode, die dann zum Herunterladen angeboten werden können. Weiterlesen notwendig. Wie bei allen Open-Source-Tools erfolgt der Support freiwillig auf dezentraler Basis, wodurch eine explizit ansprechbare Nutzerbetreuung fehlt.
4. Unterstützt das Tool kollaboratives Arbeiten?
| ☒ ja | ☐ nein |
LEAF-Writer bietet das Speichern von TEI-Dokumenten und Bilddigitalisaten in Git-Repositorien auf den Plattformen GitHub und GitLab, wodurch kollaborativ standortunabhängig an diesen gearbeitet werden kann. Das gleichzeitige Bearbeiten desselben Dokumentes kann jedoch zu Versionskonflikten führen.
5. Hinweise zur Sicherheit?
Der LEAF-Writer wird vollständig im Browser des jeweiligen Nutzers ausgeführt. Die Betreiber der jeweiligen Instanzen können keine Kenntnis über Inhalt und Art der hochgeladenen Dokumente erhalten. Die Instanz der Hochschule Darmstadt trackt die Nutzer*innen auch nicht anderweitig.
Zum Speichern auf GitHub oder GitLab benötigt der LEAF-Writer die Berechtigung, auf den Account des jeweiligen Nutzers, der jeweiligen Nutzerin zuzugreifen. Die dafür erteilten Rechte sind weitreichend. Bei einem unberechtigten Zugriff auf die LEAF-Writer-Server könnten Angreifer dies ausnutzen, um unberechtigte Aktionen im Namen der bei LEAF-Writer registrierten Nutzer*innen auf GitHub oder GitLab auszuführen.
Tutorials
- Der Englischsprachige YouTube-Kanal LEAF-VRE bietet eine Vielzahl von Tutorials und Videos zu LEAF-Writer: https://www.youtube.com/@leaf-vre
- Das Video “LEAF-Writer: Ein online XML-Editor” aus der 4Memory-Reihe “Von Büchern zu Bytes”: https://www.youtube.com/watch?v=aEFuYRDausY
- LEAF-Writer-Dokumentation (englischsprachig):https://www.leaf-vre.org/docs/documentation/leaf-commons/leaf-writer-documentation-basic
Literatur und Quellenangaben
Collaboratory for Writing and Research on Culture. 2025. „CWRC homepage | CWRC“. Zuletzt aufgerufen am 22. Januar 2026. https://cwrc.ca/.
Hochschule Darmstadt. 2024. „LEAF-Writer-X“. GitLab / leafwriter-x. Zuletzt aufgerufen am 28. Januar 2026. https://code.fbi.h-da.de/leaf-writer-x/leafwriter-x.
Zitierweise
Benz, Jacob. 2026. „LEAF-Writer“. HISTOFOX. Das Informations-, Lern- und Lehrportal für Datenkompetenzen in den historisch arbeitenden Disziplinen. NFDI4Memory und Freie Universität Berlin. https://histofox.4memory-dataliteracy.de/tools/leaf-writer/
