Anwendungsbeispiele: Archivierung
Beispiel: Auszug aus einem Interview mit Stefan Schmunk zum Bomber’s Baedeker, 2025
als Audio
Audio: Interviewauszug Stefan Schmunk zum Bomber’s Baedeker, 2025, lizenziert unter CC BY-NC-ND 4.0
als Transkript
Jacob B.: Lieber Stefan, vielen Dank, dass du dir Zeit genommen hast für unser Interview, auch zum Thema Digitales Arbeiten in den Geschichtswissenschaften mit dem Fokus auf deinem Projekt Bomber’s Baedeker. Es würde mich freuen, wenn du dich vielleicht kurz selbst vorstellen könntest.
Stefan Schmunk: Hi, mein Name ist Stefan Schmunk. Ich bin von Hause aus Historiker, Politologe und Informationswissenschaftler und bin hier an der Hochschule Darmstadt seit mittlerweile sieben Jahren, seit 2018 auf einer Professur für Informationswissenschaft und Bibliothekswissenschaften.
Jacob B.: Vielen Dank. Vielleicht gleich die erste Frage. Kannst du uns kurz dein Projekt vorstellen und auch sagen, was speziell der digitale Anteil daran war?
Stefan Schmunk: Wir haben vor, ja eigentlich vor der Pandemie, also vor sieben, acht Jahren per Zufall durch die Leiterin der wissenschaftlichen Bibliothek des Instituts für Europäische Geschichte in Mainz den Bomber’s Baedeker entdeckt. Und in Deutschland ist das eine der wenigen Bibliotheken, die die beiden Bände noch im Original besitzen, aus dem Jahr 1944.
Und gemeinsam mit Thorsten Wübbener, dem Leiter der DH-Abteilung in Mainz, hatten wir uns überlegt, das ist so ein toller Bestand, der weltweit eigentlich gar nicht zugänglich ist digital, dass wir gemeinsam mit der Universitätsbibliothek der Uni Mainz diesen Baedeker digitalisiert haben und zugleich aber uns einfach gefragt haben – ich muss kurz ausholen an der Stelle, was ist überhaupt der Baedeker?
Bomber’s Baedeker ist kein Reiseführer, wie der Name vielleicht nahelegen würde. Bomber’s Baedeker ist eine Aufstellung der Royal Air Force und des Foreign Office Großbritanniens während des Zweiten Weltkrieges über die zentralen strategischen Ziele für die Royal Air Force während des Zweiten Weltkrieges im Deutschen Reich. Ungefähr 400 Städte sind dort verzeichnet und diese Städte sind nicht nur verzeichnet als Namen oder auf einer Landkarte, sondern es gibt ganz konkrete Informationen darüber, welche Industriebetriebe in diesen Städten existierten.
Das Faszinierende aus der historischen Perspektive daran ist, dass die Alliierten, insbesondere Großbritannien, ganz viele Informationen über Deutschland hatten zu dem Zeitpunkt, weil die Brandversicherungsakten aus dem Deutschen Reich Mitte der 30er Jahre an britische Rückversicherungen gingen und dementsprechend man ganz genau wusste, wie die Hausstruktur in allen Städten und Dörfern des Deutschen Reiches waren, ob die Gebäude mit Ziegeln gebaut waren, ob es Fachwerk war, ob es Lehmbauten waren, wie die Dachstrukturen waren, ob es Holzaufbauten gab etc. Also eine faszinierende Informationsflut über die urbanen Zentren des Deutschen Reiches, gepaart mit den Straßen- und Ortsangaben von dort ansässigen Unternehmen. Das kombiniert mit Geheimdienstinformationen während des Zweiten Weltkrieges. Eine Reihe von Unternehmen gingen aufgrund des Bombenkriegs dann aus den Städten raus, wurden ausgelagert oder entwickelten sich. All das findet sich in diesem Bomber’s Baedeker und deswegen ist es eben nicht als Reiseführer zu verstehen, sondern eigentlich aus einer wirtschaftspolitischen Perspektive echt faszinierend. Man hat den Überblick über den Stand des Wissens, was die Alliierten 1944 über das Deutsche Reich wussten und über die Industrie.
Das ist so ein für uns spannender Bestand gewesen, wo wir sagten, Digitalisierung reicht nicht aus. Da sind ganz viele Informationen drin von Straßennamen, von Unternehmensnamen, von Größenangaben oder eben auch von Produktionstypen, die dort hinterlegt sind, wo wir einfach sagten, naja, wir müssen es nicht nur digital erschließen, sondern auch auf eine gewisse Art und Weise eben auch maschinenlesbar und interpretierbar machen, weil so viel Substanz und Material einfach in einer Dichte drin steckt, die man in dieser Form eigentlich kaum findet, auch für die Epoche. Das vielleicht als kurzer, wirklich ganz kurzer Abriss dazu.
Jacob B.: Genau, aber das wäre nämlich auch so ein bisschen die Frage nach dem Mehrwert. Was war denn wirklich nur möglich, weil du eben digital gearbeitet hast, beziehungsweise welche Vorteile, sagen wir mal, von der wissenschaftlichen Erschließung haben sich daraus denn ergeben?
Stefan Schmunk: Klar, also das Problem bei Digitalisierung ist oftmals, dass wir eigentlich immer dann nur so digitale Repräsentationen des analogen Materials vorliegen haben. Und das ist dann, naja, ein PDF ist nichts anderes als eine kopierte Seite, bloß als Datei. Und der Mehrwert besteht genau darin, was ich eben schon beschrieben habe. Wir haben eben nicht nur ein PDF, nicht nur ein Bilddigitalisat vorliegen, sondern wir haben eigentlich den Text und die Inhalte ausgezeichnet. Das Spannende für uns eben auch aus einer Lehrperspektive, das war ein Lehrforschungsprojekt im ersten Schritt mit Studierenden an der Hochschule Darmstadt, wo wir sagten, naja, dann lasst uns doch mal bitte probieren, die OCR zu verbessern. Dann lasst uns mal bitte probieren, die Fehlerrate zu reduzieren. Und lasst uns im nächsten Schritt auch überlegen, wie können wir eigentlich maschinell auf einer Code-Basis, naja, eine Verbesserung des Qualitätsgrades herstellen.
Es sind unter anderem Geokoordinaten angegeben. Und dann ist vollkommen klar, wenn da eine Ziffer falsch ist, ist der Fehler ganz eklatant. Und man findet auf einmal nicht mehr Mannheim, was geografisch dann am Rhein liegt, sondern Mannheim ist Minsk. Und man hat durch den Zahlendreher eben eine komplett andere Geokoordinate an dieser Stelle. Und der Mehrwert, um auf deine Frage nochmal eingangs einzugehen, ist, dass eigentlich erst jetzt auch so eine richtige Interpretierbarkeit des Materials möglich ist, was im Vorfeld gar nicht machbar wäre, weil man müsste eigentlich Tage, Wochen, Monate, wenn nicht sogar Jahre über großen Plänen hängen, um all die Informationen einzutragen und einen Abgleich dann zu machen. Also insofern, das Digitale eigentlich als Tor in die Analyse überhaupt per se.
Jacob B.: Gab es eine Archivierungsstrategie speziell für dieses Projekt? Wie sah diese aus? Genannt sei auch die Archivierung im Sinne 10-jähriger Aufbewahrungsfrist zur Sicherung der guten wissenschaftlichen Praxis. Was habt ihr archiviert? Habt ihr auch Zwischenstände archiviert oder irgendwelche Projektnotizen, andere Sachen, die noch angefallen sind?
Stefan Schmunk: Das war für uns eine spannende Frage, weil es ja keinen guten Standard gibt. Ich weiß nicht, ob du einen guten Standard kennst, den man anwenden sollte.
Wir haben Versionen gespeichert. Oder vielleicht Step by Step. Im ersten Schritt sind wir bewusst eine Kooperation mit der Universitätsbibliothek in Mainz eingegangen. Weil wir gesagt haben, Universitätsbibliotheken haben einen öffentlichen, gesellschaftlichen und damit auch politischen Auftrag, Daten frei zugänglich zu halten und die entsprechende Infrastruktur dafür zu betreiben. Das heißt, die kompletten Bilddigitalisate finden sich dort. Das Original ist in der Bibliothek des Institut für europäische Geschichte weiterhin. Die Bilddigitalisate bei der UB der Uni Mainz. Und alle anderen Anreicherungen werden als Version dort mit angeboten. Wir haben zugleich den Code auf Git publiziert und veröffentlicht, haben eine Referenzierung über Zenodo, sodass dass das zugänglich ist, und haben auf Basis von diesen drei Repositorien unsere Publikationen dann auch veröffentlicht, wo auf persistente Identifier eben referenziert wird und all diejenigen, die sich dafür interessieren und die auch dann nachverfolgen wollen, mit welchen Daten wir zu welchen Schlüssen gekommen sind, können darauf zugreifen. Das finde ich, ist der große Vorteil.
Also ich denke, wir müssen mehr in Versionen denken. Wir müssen vor allem auch mehr daran oder darüber nachdenken, dass Forschung eigentlich nicht beendet sein kann und beendet wird dann zu einem gewissen Zeitpunkt, sondern dass dieses Fluide des Digitalen eigentlich auch dann in den Forschungsergebnissen Einklang findet.
Jacob B.: Das war also von Anfang an auch in dem Sinne gedacht, das so zur Verfügung zu stellen und zur Nachnutzbarkeit?
Stefan Schmunk: Das ja, aber wir wissen selber nicht, ob es der bestmögliche Weg ist. Also ich glaube, das wird sich nochmal zeigen, aber es war ein Weg, den wir halt sehr bewusst gegangen sind, Thorsten und ich, wo wir gesagt haben, okay, lasst uns das so publizieren, weil dann haben wir, glaube ich, auch einen guten Use-Case. Zugleich aber auch der Versuch für uns, zu erproben, wie man damit umgehen kann. Es ist aufwendig. Es ist einfach aufwendig, weil diese Publikation von Versionen, das ist halt nicht fire and forget und man ist damit zu Ende, sondern man muss durchaus überlegen, wann Zwischenstand eben auch Sinn macht.
