Vorgehen: Einführung in das Forschungsdatenmanagement
Die Maßnahmen und Strategien des FDMs umfassen folgende Bereiche, auf die in den weiteren Artikeln vertiefend eingegangen wird:
- Planung des Forschungsvorhabens: Entwicklung des Arbeitsprogramms anhand der Ziele und Methoden unter Berücksichtigung des Datenmanagements und dessen Dokumentation in einem Datenmanagementplans (DMP)'Ein Datenmanagementplan (DMP) beschreibt und dokumentiert den Umgang mit den Forschungsdaten und Forschungsmaterialien einer Forschung während und nach der Projektlaufzeit. Im DMP wird festgehalten, wie die Daten und Materialien entstehen, aufbereitet, gespeichert, organisiert, veröffentlicht, archiviert und ggf. geteilt werden. Zudem werden im DMP Verantwortlichkeiten und Rechte geregelt. Als 'living document' (also ein dynamisches Dokument, das sich fortlaufend in Bearbeitung und Veränderung befindet) wird der DMP im Laufe des Projektes regelmäßig geprüft und bei Bedarf angepasst.' (Data Affairs, Glossar) Weiterlesen
- Datenorganisation (z. B. Speichersysteme, Ablageordnung, Kollaboration, Zugriffssteuerung, Data Policy)
- Quellensammlungsstrategien (z. B. Recherche, Repositorien'Ein Repositorium bildet einen Ort der Aufbewahrung wissenschaftlicher Dokumente. In Online-Repositorien werden Publikationen digital gespeichert, verwaltet und mit persistenten Identifikatoren versehen. Die Katalogisierung vereinfacht die Suche und Nutzung von Publikationen und Autor*innen. In den meisten Fällen sind Dokumente in Online-Repositorien uneingeschränkt und offen zugänglich (Open Access).' (Data Affairs, Glossar) Weiterlesen, DigitalisierungBei der Digitalisierung werden analoge Materialien in digitale Formate, sog. Digitalisate, überführt. Diese Formate können weitergegeben, gespeichert, archiviert und maschinell verarbeitet werden. Weiterlesen, Aufzeichnung von Oral History Interviews)
- Datenerhebung und -erschließung (z. B. Datenmodellierung, automatisierte Erschließungsverfahren, Metadatenstandards, digitale Quellenkritik, Korpusbildung)
- Aufbereitung, Analyse, Auswertung, Visualisierung und Interpretation von Daten durch (digitale) Methoden und mit Hilfe von Softwaretools
- DatenqualitätDatenqualität (in historisch arbeitenden Fächern) ist ein Maß für den Zustand von Daten hinsichtlich quantitativer Merkmale wie Genauigkeit und Vollständigkeit sowie qualitativer Aspekte wie Relevanz und Nachvollziehbarkeit. Dabei gibt es keinen absoluten Qualitätsmaßstab: Was als qualitativ hochwertig gilt, hängt stets vom konkreten Forschungsvorhaben, der zugrundeliegenden Fragestellung und der angewandten Methode ab.In historisch arbeitenden Fächern treten zwei spezifische Herausforderungen hinzu. Erstens sind historische Forschungsdaten in außerordentlicher inhaltlicher Vielfalt und struktureller Heterogenität überliefert – von Handschriften und Drucken über Fotografien und Tonaufnahmen bis hin zu nativ digitalen Datensätzen. Welche Kontextinformationen zu einer Quelle erfasst werden müssen, ist dabei nicht absolut bestimmbar, sondern ergibt sich neben der Quellentypspezifik aus der jeweiligen Fragestellung: Denn die Kontextualisierung einer Quelle könnte theoretisch unbegrenzt fortgesetzt werden, ist in der Praxis aber auf das für den Forschungszweck Notwendige beschränkt. Zweitens sind historische Daten grundsätzlich durch Überlieferungslücken und Unschärfen geprägt: Bestimmte Informationen sind schlicht nicht mehr rekonstruierbar, was Vollständigkeit als Qualitätskriterium im historischen Kontext nur bedingt anwendbar macht. Datenqualität bedeutet hier daher weniger das Erreichen eines absoluten Vollständigkeitsideals als vielmehr die transparente Dokumentation dessen, was vorhanden ist, was fehlt und warum (vgl. Körfer 2026). Weiterlesen durch Daten- und Prozessdokumentation und Verwendung von (Meta)Datenstandards (z. B. TEITEI (Text Encoding Initiative) bezeichnet sowohl eine Organisationsiehe unter: https://tei-c.org/ als auch ein gleichnamiges Dateiformat. Letzteres basiert auf XML (Extensible Markup Language), einer weit verbreiteten Auszeichnungssprache, und hat sich in den Geisteswissenschaften als Standard zur Kodierung und Auszeichnung von Texten durchgesetzt. Mit Hilfe von TEI ist es möglich, maschinenlesbar Elemente eines Textes auszuzeichnen, wie beispielsweise Absätze oder Überschriften.Die Spezifikation von TEI - auch Guidelines genannt - kann unter https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html eingesehen werden. Zudem können Inhalte wie Personen- oder Ortsnamen als solche markiert und Anmerkungen eines kritischen Apparates eingefügt werden. Im Hinblick auf das Forschungsdatenmanagement ist es vorteilhaft, dass es sich bei TEI um ein Nur-Text-Format handelt, es also auch ohne spezielle Programme von Menschen interpretiert werden kann. Weiterlesen, EAD, CEI, DDI)
- Recht (Urheberrecht'Das Urheberrecht (UrhG) schützt bestimmte geistige Schöpfungen (Werke) und Leistungen. Unter Werke fallen Sprachwerke, Lichtbild-, Film- und Musikwerke sowie Darstellungen wissenschaftlicher oder technischer Art, wie Zeichnungen, Pläne, Karten, Skizzen, Tabellen und plastische Darstellungen (Gesetz über Urheberrecht und verwandte Schutzrechte 2021, §2). Die künstlerischen, wissenschaftlichen Leistungen von Personen oder die getätigte Investition gelten dagegen als schützenswerte Leistungen (Leistungsschutzrecht). Der*die Urheber*in ist berechtigt, das Werk zu veröffentlichen und zu verwerten.' (Data Affairs, Glossar) Weiterlesen, Nutzungs- und Archivrecht, Datenschutz, Lizenzen)
- Datenpublikation (z. B. Rechte, Lizenzen, Repositorienauswahl, PID'Ein Persistent Identifier (PID) (auf Deutsch: dauerhafter Identifikator) ist ein dauerhafter, digitaler Code, der einer digitalen Ressource wie z. B. einem Datensatz, einem wissenschaftlichen Artikel oder einer anderen Veröffentlichung direkt zugeordnet ist und diese damit permanent identifizier- und auffindbar macht. Im Gegensatz zu anderen seriellen Identifikatoren (beispielsweise URL-Adressen) verweist ein Persistent Identifier auf das Objekt selbst und nicht auf seinen Standort im Internet. Ändert sich der Standort eines mit einem Persistent Identifier assoziierten digitalen Objekts, so bleibt der Identifikator derselbe. Es muss lediglich in der Identifikator-Datenbank der URL-Standort geändert oder ergänzt werden. So wird sichergestellt, dass ein Datensatz dauerhaft auffindbar, abrufbar und zitierbar bleibt (Forschungdaten.info 2023). Weiterlesen)
- Langzeitarchivierung und Nachnutzungsszenarien (Repositorienauswahl)
Bei besonderen Forschungsvorhaben wie Oral History Interviews auch:
- Maßnahmen zum Schutz von personenbezogenen oder sensiblen Daten (z. B. Anonymisierung, informierte Einwilligung, Datenverschlüsselung)
- Umsetzung ethischer Vorgaben
