Logo

Suche in HISTOFOX

AbschnittDiskussion: Nachnutzung

Diskussion: Nachnutzung

Die Nach- und Weiternutzung von Daten ist ein zentrales Motiv der Geschichtswissenschaft. Allen historisch arbeitenden Disziplinen ist das Studium von Primärquellen in Kombination mit der Rezeption von Sekundärquellen inhärent. Primärquellen können dabei unbeabsichtigt überlieferte Hinterlassenschaften wie Einkaufszettel oder Notizen von Wissenschaftler*innen sein, sind aber ebenso bewusst archivierte Dokumente. In letztere Kategorie fällt auch die Nachnutzung'Eine Nachnutzung, oftmals auch Sekundärnutzung genannt, befragt bereits erhobene und veröffentlichte Forschungsdatensätze erneut mit dem Ziel, andere Erkenntnisse, möglicherweise aus einer neuen oder unterschiedlichen Perspektive, zu erhalten. Die Aufbereitung von Forschungsdaten für eine Nachnutzung erfordert einen erheblich höheren Anonymisierungs-, Aufbereitungs- und Dokumentationsaufwand als die bloße Archivierung im Sinne von Datenspeicherung.' (Data Affairs, Glossar) Weiterlesen von zuvor archivierten (siehe Artikel Archivierung) Forschungsdaten. Es handelt sich um eine klassische, geschichtswissenschaftliche Nutzung von Quellenmaterial. Der Vorgang ist also vergleichbar mit der Nutzung von edierten Quellen zur Beantwortung eigener Fragestellungen. Wie auch klassische Schriftquellen in unterschiedlichsten Formen und Qualitätsstufen herausgegeben werden können – von schludrigen, handschriftlichen Abschriften, abgedruckten Transkriptionen bis hin zu kritischen Editionen – so ist auch die QualitätDatenqualität (in historisch arbeitenden Fächern) ist ein Maß für den Zustand von Daten hinsichtlich quantitativer Merkmale wie Genauigkeit und Vollständigkeit sowie qualitativer Aspekte wie Relevanz und Nachvollziehbarkeit. Dabei gibt es keinen absoluten Qualitätsmaßstab: Was als qualitativ hochwertig gilt, hängt stets vom konkreten Forschungsvorhaben, der zugrundeliegenden Fragestellung und der angewandten Methode ab.In historisch arbeitenden Fächern treten zwei spezifische Herausforderungen hinzu. Erstens sind historische Forschungsdaten in außerordentlicher inhaltlicher Vielfalt und struktureller Heterogenität überliefert – von Handschriften und Drucken über Fotografien und Tonaufnahmen bis hin zu nativ digitalen Datensätzen. Welche Kontextinformationen zu einer Quelle erfasst werden müssen, ist dabei nicht absolut bestimmbar, sondern ergibt sich neben der Quellentypspezifik aus der jeweiligen Fragestellung: Denn die Kontextualisierung einer Quelle könnte theoretisch unbegrenzt fortgesetzt werden, ist in der Praxis aber auf das für den Forschungszweck Notwendige beschränkt. Zweitens sind historische Daten grundsätzlich durch Überlieferungslücken und Unschärfen geprägt: Bestimmte Informationen sind schlicht nicht mehr rekonstruierbar, was Vollständigkeit als Qualitätskriterium im historischen Kontext nur bedingt anwendbar macht. Datenqualität bedeutet hier daher weniger das Erreichen eines absoluten Vollständigkeitsideals als vielmehr die transparente Dokumentation dessen, was vorhanden ist, was fehlt und warum (vgl. Körfer 2026). Weiterlesen von zur Nachnutzung bereitgestellten Forschungsdaten selbstverständlich nach den Prinzipien der klassischen QuellenkritikDie Quellenkritik ist die zentrale Arbeitsweise der Geschichtswissenschaft. Sie bezeichnet die kritische Untersuchung von Artefakten der Vergangenheit mit dem Ziel, Antworten auf bestimmte Fragestellungen zu finden. Ihr grundsätzlicher Aufbau geht auf Johann Gustav Droysen (1808 - 1884) zurück, ein ähnliches Vorgehen findet aber auch in anderen, verwandten Geisteswissenschaften wie der Literaturwissenschaft statt. Quellenkritische Arbeit findet nicht nur bei schriftlichen Überlieferungen statt, sondern kann auch auf Oral History oder digitale Artefakte angewendet werden (vgl. Artikel Digitale Quellenkritik). Quellenkritik umfasst stets eine äußere und eine innere Quellenkritik. Erstere untersucht dabei die Herkunft und Überlieferung der Quelle, also beispielsweise, wer Verfasser und Adressat sind, oder ob es sich um eine Fälschung handelt. Die innere Quellenkritik setzt sich hingegen mit den Inhalten der Quelle auseinander, wozu nicht nur Fragen nach Aufbau/Gliederung, der Textgattung und den vorgebrachten Inhalten oder Argumenten gehören, sondern auch die Person des Verfassers und sein Horizont.  (vgl. 'Quellenkritik'. 2024. Historiucm-eStudies.net. Januar 8. https://historicum-estudies.uni-koeln.de/archiv/arbeiten-mit-quellen/quellenkritik).  Weiterlesen zu analysieren.
Durch zunehmende Nutzung digitaler Methoden in den Geschichtswissenschaften entstehen zudem neue Arten von Forschungsdaten, die oftmals eine andere Qualität und Quantität haben als beispielsweise herkömmliche Quellenbestände oder als Anhang von Forschungsarbeiten transkribierte Quellen. Hierzu können maschinenlesbar aufbereitete und ausgezeichnete Textkorpora zählen, welche immer wieder mithilfe von maschinellen Analysemethoden auf neue Fragestellungen hin untersucht werden können. Solche maschinellen Methoden ermöglichen dabei insbesondere Analysen auf großen Datenmengen, die von Hand nicht durchzuführen wären. Dafür werden große Mengen an entsprechend aufbereiteten Daten benötigt. Durch intensive Nachnutzung, die zusätzlich zu einer zunehmenden AnreicherungAnreicherung bezeichnet die Tätigkeit, ein Untersuchungsobjekt durch zusätzliche Informationen zu ergänzen, indem deren Herkunft, Beschaffenheit, Struktur, Bedeutung oder einzelne Elemente explizit gemacht werden (Borek et al 2021). Weiterlesen und Validierung sowie Datenqualität führen kann, ist es deutlich einfacher, solche großen Datenmengen zur Verfügung zu haben. Durch die Verwendung von Repositorien'Ein Repositorium bildet einen Ort der Aufbewahrung wissenschaftlicher Dokumente. In Online-Repositorien werden Publikationen digital gespeichert, verwaltet und mit persistenten Identifikatoren versehen. Die Katalogisierung vereinfacht die Suche und Nutzung von Publikationen und Autor*innen. In den meisten Fällen sind Dokumente in Online-Repositorien uneingeschränkt und offen zugänglich (Open Access).' (Data Affairs, Glossar) Weiterlesen wird zudem das Auffinden und Nutzen solcher Forschungsdaten erheblich bequemer und einfacher, wodurch sich Zeit und Aufwand für Forschungsprojekte reduzieren, ebenfalls begünstigt durch deren digitale Natur.
Herausfordernd bleibt jedoch, dass sich für historisch arbeitende Disziplinen die fachspezifischen Infrastrukturen, wie z. B. das Repositorium RADAR4Memory erst im Entstehen befinden und noch nicht den vollständigen Bedarf decken, wie z. B. regulierte Zugänge zu den Forschungsdaten. Davon unberührt bleiben grundsätzliche Probleme bei der Nachnutzung von Daten wie bspw. im Einzelfall mangelnde Datendokumentation'Forschungsdaten bilden nicht nur die Basis wissenschaftlicher Veröffentlichungen der jeweiligen Forscher*innen, sondern werden in vielen Fällen anderen zugänglich gemacht. Dies setzt voraus, dass Forschungsdaten verständlich dokumentiert sind. Unverzichtbar wird dies, wenn eine Datenpublikation beabsichtigt ist. Eine zentrale Rolle für das Finden, Durchsuchen und Nutzen von Forschungsdaten spielen Metadaten, also Daten, die strukturierte Informationen über andere Daten enthalten. In verschiedenen Wissenschaftskreisen haben sich für die Dokumentation in Form von Metadaten sogenannte Metadatenstandards etabliert, die Konventionen für die Beschreibung und Dokumentation von Forschungsdaten über Metadaten festlegen. Weiterlesen, bedingt auch durch die ausstehende Etablierung von Datenqualitätsstandards in den Geschichtswissenschaften.
Ein zusätzliches Problem liegt in der rasanten technischen Entwicklung. Vielfach ist Software ein Teil von Forschungsdaten, z. B. zur Analyse eines Datensatzes, oder diese wird zur Präsentation der Daten, wie z. B. bei digitalen Editionen, benötigt. Hier besteht die Herausforderung, diese Software in der sich ständig verändernden digitalen Welt lauffähig in neueren Umgebungen (z. B. neue Betriebssystemversion) zu halten.