Dateninterpretation, Kontextualisierung historischer Informationssysteme und Visualisierung
Inhaltsverzeichnis
Methoden
Erlernen von Methoden zur Visualisierung und Analyse von XML-Daten.
Kompetenzen und Lernziele
Auf Basis zur Verfügung stehenden strukturierten XML-Daten können die Studierenden diese mithilfe von Karten visualisieren sowie Datenanalysen und ‑interpretationen durchführen.
Kompetenzziele: Datenanalyse, Digital Mapping, Kontextualisierung historischer Informationssysteme
Voraussetzungen und Tools
- Transkribus
- eScriptorium
- Tesseract
Vorkenntnisse
Für die o. g. Werkzeuge kann auf eine Reihe von Tutorials zurückgegriffen werden und aufgrund der vorhandenen Datenbasis die Genauigkeit abgeglichen werden.
Transkribus kann als Webtool genutzt werden, für den ein Nutzer*innen-Account angelegt werden muss. Die Studierenden können Transkribus in der Regel mittels einer Test-Version abhängig vom Scan-Volumen kostenlos nutzen. eScriptorium und Tesseract sind Open-Source-Lösungen, die als Applikation auf lokalen Rechnern installiert werden müssen. Die Nutzer*innen sollten über entsprechende Kenntnisse der jeweiligen Betriebssysteme verfügen und erste Kenntnisse in der Auszeichnung von Textdateien mittels xml haben.
Tutorials
Für die genutzten Tools existieren eine Reihe von einführenden Tutorials und es entstehen laufend weitere.
- Transkribus: https://help.transkribus.org/text-recognition
- eScriptorium: https://ub-mannheim.github.io/eScriptorium_Dokumentation/Nutzungsanleitung_eScriptorium.html
- Tesseract: https://github.com/tesseract-ocr/tesseract
Vorbereitung
Sowohl die Bildigitalisate als auch die XML-Dateien können unter Beachtung der entsprechenden Lizenzen heruntergeladen und genutzt werden. Abhängig von den geplanten Fragestellungen und Schwerpunkten des Kurses sollten die entsprechenden Tools auf lokalen Rechnern installiert bzw. im Falle von Transkribus entsprechende Accounts angelegt werden.
Vorgehen
Ziel ist es, Studierende an den forschungspraktischen Umgang mit historischen Quellen im digitalen Format heranzuführen. Das konkrete Lernziel dieses Szenarios besteht darin, dass digitale und analytische Kompetenzen zur exemplarischen Analyse von Informationen des Bomber’s Baedekers entwickelt werden sollen. Hierfür werden die Studierenden einen selbst gewählten Ausschnitt (Infrastrukturbereich) der zur Verfügung stehenden strukturierten XML-Daten mithilfe von Karten visualisieren und auf dieser Basis Datenanalysen und ‑interpretationen durchführen.
Ziel: Historische Analyse der industriellen Infrastruktur auf Basis der strukturierten XML-Daten.
Die Lehrveranstaltung orientiert sich an den Prinzipien des forschenden Lernens, entdeckenden Lernens sowie dem Konzept des problem-based learning (PBL). Die Datensätze dienen als Ausgangspunkt zur eigenständigen Entwicklung historischer Fragestellungen und zur Aneignung digitaler Analysemethoden.
Als Zielgruppe werden fortgeschrittene Bachelor-Studierende (z. B. 5./6. Semester) oder Master-Studierende in Geschichte, Digital Humanities, Public History, Informationswissenschaft, Archiv‑ und Bibliothekswissenschaft adressiert.
Wie dies umgesetzt werden kann, zeigt das folgende Beispiel, das im Rahmen einer Lehrveranstaltung zur Digitalisierung und Retro-Digitalisierung von gedruckten Beständen entwickelt wurde:
Aufgabenstellung:
Extrahieren Sie alle Einträge zu einem spezifischen Infrastrukturbereich (z. B. Chemieindustrie oder Eisen‑ und Stahlbetriebe) aus dem XML.
- Visualisieren Sie diese Daten auf einer Karte (z. B. mit Palladio, QGIS, Google MyMaps oder DARIAH-DE Geo-Browser).
- Interpretieren Sie Ihre Ergebnisse:
a) Wo lagen industrielle Schwerpunkte?
b) Welche Muster lassen sich erkennen?
c) Können Sie Hinweise in diesen finden, ob diese im strategischen Bombing-Konzept der Royal Air Force bzw. des Allied Bomber Command eine Rolle spielten? - Diskutieren Sie die Unterschiede und Gemeinsamkeiten bei der Visualisierung der genutzten Werkzeuge. Können Sie identifizieren, weshalb Sie unterschiedliche Ergebnisse erhalten haben?
Lehrmethode:
Projektbasiertes Lernen mit interdisziplinären Elementen (GIS, Quelleninterpretation)
Literatur und Quellenangaben
Bach, Felix, Cristian Secco, Thorsten Wübbena, und Fabian Cremer. 2021. „Bomber’s Baedeker. Automatische Extraktion strukturierter Daten mit Python“. Github.com/ieg-dhr. Zuletzt aufgerufen am 23. Januar 2026. https://github.com/ieg-dhr/bombers_baedeker
Bach, Felix, Stefan Schmunk, Cristian Secco, und Thorsten Wübbena. 2021. The Bomber’s Baedeker. A Guide to the Economic Importance of German Towns and Cities. Zenodo. https://doi.org/10.5281/zenodo.5138504
Bach, Felix, Stefan Schmunk, Cristian Secco, und Thorsten Wübbena. 2021. „Bomber’s Baedeker – vom Text zum Bild zur Datenquelle“. In Fabrikation von Erkenntnis – Experimente in den Digital Humanities, herausgegeben von Manuel Burghardt, Lisa Dieckmann, Timo Steyer, Peer Trilcke, Niels Walkowski, Joëlle Weis, und Ulrike Wuttke. Wolfenbüttel. https://doi.org/10.17175/sb005_004
Zitierweise
Schmunk, Stefan. 2025. „Dateninterpretation, Kontextualisierung historischer Informationssysteme und Visualisierung“. HISTOFOX. Das Informations-, Lern- und Lehrportal für Datenkompetenzen in den historisch arbeitenden Disziplinen. NFDI4Memory und Freie Universität Berlin. https://histofox.4memory-dataliteracy.de/lehrszenarios/dateninterpretation-kontextualisierung-historischer-informationssysteme-und-visualisierung/
