Vorgehen: Digitale Quellenarten
Durch digitale Quellentypen ergeben sich erweiterte quellenkritische Fragestellungen, die sich zum einen aus dem technischen Entstehungsprozess und zum anderen aus dem inhaltlichen und institutionellen Kontext der digitalen Quelle zusammensetzen.
Die Frage nach der Autor:innenschaft
Die Autor:innenschaft lässt sich im digitalen Umfeld deutlich schwieriger bestimmen. Dies liegt einmal an den spezifischen Eigenschaften von digitalen Objekten und den unterschiedlichen Formen der Entstehung. Viele digitale Texte beispielsweise auf Webseiten entstehen kollaborativ und / oder ohne namentliche Nennung. Hinzu kommt noch der Einsatz von automatisierten Verfahren (maschinelle Übersetzung) oder künstlicher Intelligenz (bspw. ChatGPT). Auch sind falsche Zuschreibungen im digitalen Raum leichter möglich, wie etwa das Kopieren von fremden Inhalten ohne namentliche Nennung (Plagiat) oder das Verbreiten von gezielten Falschinformationen (Fake News).
- Wer oder was hat die Quelle erzeugt?
- Wie lässt sich die Autor:innenschaft nachweisen?
- Gibt es Hinweise auf eine kollektive oder redaktionelle Bearbeitung?
- Welche Rolle spielen technische Systeme in der Produktion? (automatisch generierte Website-Inhalte, algorithmisch sortierte Feeds)
- Wie ist die Autor:innenschaft rechtlich oder ethisch zu bewerten?
Die Frage nach Intention, Perspektive und Standpunkt
Ebenso wie bei analogen Quellen muss auch bei Digitalen die Perspektive, der Standpunkt und die Intention der Erstellung und Verbreitung/Veröffentlichung kritisch hinterfragt werden. Dies lässt sich sinnbildlich am Beispiel einer Fotografie verdeutlichen. Zwar gibt die räumliche Perspektive Rückschlüsse über den Entstehungkontext durch beispielsweise die Position der Kamera oder den Aufnahmewinkel. Schwieriger ist jedoch die Beurteilung der Nachbearbeitung. Wurde das Bild nachträglich farblich verändert oder zugeschnitten, um bestimmte Aspekte hervorzuheben?
- Warum wurde die Quelle erstellt und veröffentlicht?
- Für wen ist die Quelle bestimmt?
- Welche Rolle spielt das Medium?
- Wie beeinflussen Filter, Algorithmen die Sichtbarkeit von Inhalten?
Die Frage nach der Authentizität
Das Verändern und Kopieren von digitalen Inhalten ist deutlich einfacher im Vergleich zu analogen Objekten und lässt sich oft nur anhand von Metadaten nachvollziehen (Zeitpunkt der Erstellung, Format, Speicherort). Diese Metadaten können jedoch bei Formatumwandlungen ( z.B. von RAW zu PNG), Kompressionen oder Speichervorgängen verloren gehen. Dies erschwert die Überprüfung von Herkunft und Echtheit. Was implizit mit der Frage der Authentizität einer digitalen Quelle einhergeht, ist die Frage nach der Originalität. Da digitale Objekte unbegrenzt und verlustfrei kopiert werden können, verliert der Begriff des “Originals” seine herkömmliche Bedeutung. Für die historische Analyse ist jedoch die Frage nach dem ursprünglichen Zustand von großer Bedeutung. Die Prüfung der Authentizität erfordert im digitalen Kontext somit eine Reflexion über technische, mediale und historische Bedingungen des Entstehungs- und Nutzungskontexts.
- Woher stammt die Datei / der Post / das Video? Gibt es Archive, Screenshots, Metadaten?
- Wurde das Objekt verändert? Lässt sich dies über Metadaten und/oder Versionierung nachvollziehen?
- Ist ein “Original” überhaupt identifizierbar?
- Wie ist die Quelle in den digitalen Raum eingebettet?
- Welche Institution bewahrt oder präsentiert die Quelle und wie zuverlässig ist diese?
Die Frage nach der Vollständigkeit und Integrität
Die einfache Veränder- und Löschbarkeit digitaler Objekte erschwert es, ihre Vollständigkeit zuverlässig zu beurteilen. Oft ist unklar, ob ein digitales Dokument vollständig vorliegt oder nur einen Ausschnitt des ursprünglichen Inhalts zeigt. Hinweise darauf lassen sich meist nur durch den Vergleich mehrerer Versionen oder Kopien gewinnen, die auf dasselbe Original zurückgehen. Auch Metadaten können Aufschluss geben: Deutliche Unterschiede zwischen Erstellungs- und Bearbeitungsdatum deuten darauf hin, dass nachträgliche Eingriffe oder Auslassungen erfolgt sein könnten. Ansätze aus der digitalen Forensik schaffen Impulse, die bei der Analyse von digitalen Quellen helfen. Einige dort genutzte Verfahren lassen sich auch auf historische digitale Quellen übertragen: Wenn neben einer Datei weitere formale Informationen, etwa Logfiles, vorliegen, kann ihr Lebenszyklus rekonstruiert und nachvollzogen werden, ob Inhalte verändert oder gelöscht wurden. Hash-Werte (Prüfsummen) dienen dabei der Überprüfung von Authentizität und Integrität, indem sie zeigen, ob eine Datei unverändert geblieben ist.
Besonders aussagekräftig sind Analysen, wenn die komplette digitale Umgebung eines Objekts (Betriebssystem und Speicher) in Form eines sogenannten Bitstream-Images vorliegt. In solchen Fällen lassen sich selbst gelöschte oder fragmentierte Dateien noch teilweise wiederherstellen. Jede Datei besitzt zudem einen spezifischen Header, der ihren Typ ausweist, was die Identifikation und Rekonstruktion verlorener Inhalte ermöglicht (vgl. Willer 2012).
Allerdings setzt der Einsatz forensischer Methoden spezialisiertes technisches Wissen voraus und ist in der historischen Forschungspraxis oft schwer umsetzbar.
- Liegt ein möglichst vollständiges digitales Abbild der Quelle vor?
- Sind Metadaten zu Erstelltungsdatum, Format, Dateigröße und Speicherort vorhanden?
- Gibt es Hinweise auf Bearbeitungen, Umwandlungen oder Kompressionen?
- Ist die technische Umgebung nachvollziehbar dokumentiert? (Betriebssystem, Softwareversion)
Die Frage nach der Provenienz
Die Provenienz gibt Aufschluss darüber, woher eine Quelle stammt, wie sie überliefert wurde und unter welchen Umständen sie erhalten blieb.Im digitalen Kontext ist die Rekonstruktion der Provenienz jedoch besonders schwierig, da digitale Objekte leicht kopiert, verändert oder vervielfältigt werden können. Forschende sind daher häufig mit mehreren, parallelen Versionen derselben Quelle konfrontiert. Die Überprüfung der Provenienz kann nur bedingt technisch erfolgen, etwa durch die Analyse formaler und materieller Eigenschaften digitaler Objekte (z. B. Dateiformate, Größen, Metadaten). Diese Merkmale geben Hinweise darauf, wie und wo eine Datei verarbeitet oder gespeichert wurde, und können Rückschlüsse auf mögliche Veränderungen oder Übertragungsschritte liefern.
Da eine lückenlose Rekonstruktion der Provenienz digitaler Objekte meist nicht möglich ist, sollte das Ziel nicht absolute Gewissheit, sondern Transparenz sein: Lücken, Unsicherheiten und mögliche Manipulationen müssen offen benannt und reflektiert werden.
- Woher stammt die digitale Quelle?
- Welche technischen Merkmale lassen Rückschlüsse auf Herkunft und Bearbeitung zu?
- Wie könnten Manipulationen oder Verluste aufgetreten sein?
- Existieren mehrere Versionen derselben Quelle?
- Lassen sich Unterschiede zwischen diesen Versionen nachvollziehen?
Die Frage nach der Verfügbarkeit
Obwohl durch zahlreiche Digitalisierungsprojekte der Eindruck entsteht, historische Quellen seien inzwischen in großem Umfang digital verfügbar, zeigt sich bei näherer Betrachtung ein anderes Bild: Bis 2020 waren nur etwa vier Prozent der Bestände in Gedächtnisinstitutionen tatsächlich digitalisiert (vgl. König 2020). Zudem konzentriert sich die Digitalisierung stark auf Textquellen aus dem globalen Norden, während Materialien aus anderen Weltregionen kaum erfasst sind. Diese ungleiche Verfügbarkeit digitaler Quellen beeinflusst, oft unbemerkt, welche Themen und Perspektiven in der geschichtswissenschaftlichen Forschung sichtbar werden und damit als relevant gelten (König 2020).
- In welchem Verhältnis steht die Quelle zu nicht digitalisierten Materialien aus demselben Themenfeld und gibt es ähnliche/weitere Quellen, die (noch) nicht digitalisiert wurden?
- In welchem Format liegt die Quelle vor?
- Welche Informationen zur Digitalisierung sind dokumentiert?
- Aus welchem Projekt- oder Institutionskontext stammt die Digitalisierung dieser Quelle?
- Wurde die Quelle während des Digitalisierungsprozesses auf Grundlage einer spezifischen Fragestellung ausgewählt?
Beim Arbeiten mit digitalen Quellen gibt es Eigenschaften, die sich von nicht-digitalen Quellen unterscheiden. Im Folgenden werden die fünf prägnantesten Unterscheidungsfaktoren aufgezeigt, welche bei einer (digitalen) Quellenkritik zu prüfen sind:
- Interaktivität und Manipulierbarkeit
Texte, die mit digitalen Schreibprogrammen verfasst wurden, lassen sich leicht verändern, und auch digitale Fotos können mit Bildbearbeitungssoftware manipuliert werden. Ihre logisch-formalen Strukturen ermöglichen spezifische Formen der Interaktion, sowohl durch Menschen als auch durch Software, wobei solche Interaktionen wiederum neue digitale Objekte erzeugen können. Für die wissenschaftliche Analyse ergibt sich daraus eine zentrale methodische Herausforderung: Es muss gefragt werden, welche Formen der Interaktion bereits im digitalen Objekt selbst angelegt sind oder welche typischerweise mit seiner Nutzung einhergehen.
Während bei analogen Quellen Veränderungen am Material physisch nachvollziehbar sind, können digitale Objekte auf den ersten Blick unbemerkt manipuliert werden. Ein zentrales Charakteristikum von digitalen Quellen ist die Nicht-Unterscheidbarkeit zwischen einem Original und einer Kopie. Daher können mehrere “Originale” eines Objekts bestehen. Für die Analyse dieser Quellen ergibt sich daraus die Besonderheit, die Authentizität nicht ausschließlich materiell, sondern prozessual und kontextabhängig zu bestimmen (Deicke & Schmunk, 2023).
- Flüchtigkeit und Volatilität
Digitale Objekte existieren primär als binärer Code und werden auf unterschiedlichen Medien (z. B. Server, Festplatten, USB-Sticks) gespeichert. Ähnlich wie analoge Quellen sind auch digital geborene Objekte nicht mehr zugänglich, wenn die Speichermedien beschädigt, zerstört oder durch Alterung unbrauchbar werden. Online bereitgestellte Inhalte auf Webseiten oder in Sozialen Netzwerken sind unter spezifischen Internetadressen auf Servern abgelegt. Diese Adressen sind nicht permanent und die dort präsentierten Inhalte können sekündlich bearbeitet oder gelöscht werden. Gar die gesamte Existenz der Plattform ist jederzeit gefährdet. Hinzu kommt, dass digitale Objekte nicht unmittelbar lesbar sind, sondern stets technischer Vermittlung durch Maschinen bedürfen. Diese Abhängigkeit wird durch den rasanten Fortschritt in der Informationstechnologie noch verschärft. Die Konsequenz ist eine beschleunigte technische Obsoleszenz: Formate, Programme und Plattformen, die einst alltäglich waren, verlieren schnell ihre Kompatibilität oder verschwinden ganz. Ein prominentes Beispiel dafür ist der Adobe Flash Player, der viele Jahre eine Schlüsselrolle in der Darstellung multimedialer Webinhalte spielte, aber inzwischen nicht mehr unterstützt wird.
Die Flüchtigkeit digitaler Objekte erfordert eine kontinuierliche Dokumentation. Forschende müssen nicht nur prüfen, ob ein digitales Objekt noch zugänglich ist, sondern auch in welcher Form es erhalten bleibt und welche technischen Veränderungen seit seiner Entstehung eingetreten sind. Jede Migration in ein neues Format oder jede Wiederherstellung aus einem Archiv kann unbemerkt zu Veränderungen führen. Zudem ist kritisch zu reflektieren, dass digitale Objekte oft nur temporär stabil erscheinen und ihre Verfügbarkeit von externen Faktoren, etwa proprietären Infrastrukturen oder wirtschaftlichen Entscheidungen von Plattformbetreibern, abhängt.
- Kopierbarkeit
Die digitale Datenverarbeitung ermöglicht es, mit wenigen standardisierten Befehlen beliebig viele scheinbar identische Duplikate einer Datei zu erzeugen. Dabei bleiben sowohl die formal-logische Struktur als auch der semantische Inhalt vollständig erhalten; lediglich der physikalische Speicherort verändert sich. Diese Kopierbarkeit ist nicht nur ein bewusst genutzter Vorgang im Umgang mit digitalen Daten, sondern geschieht häufig auch automatisch im Hintergrund: Betriebssysteme und Programme erzeugen fortlaufend Sicherungskopien und Redundanzen, um die Integrität und Kohärenz von Dateien bei ihrer Verarbeitung oder Übertragung zu gewährleisten. Diese technische Praxis dient nicht nur der Absicherung gegen Datenverlust, sondern ermöglicht auch die Rückverfolgbarkeit von Änderungen sowie die Wiederherstellung früherer Zustände einer Datei. So können etwa versehentlich vorgenommene Manipulationen rückgängig gemacht werden, ein Vorgang, der in der analogen Welt meist nicht möglich ist.
Die scheinbare Identität digitaler Kopien darf nicht mit inhaltlicher Authentizität oder historischer Unveränderlichkeit gleichgesetzt werden. Vielmehr muss bei jeder digitalen Quelle hinterfragt werden, ob sie eine Originaldatei, eine Kopie oder eine bearbeitete Version darstellt, unter welchen Bedingungen sie entstanden ist und welchen Weg sie durch verschiedene Speicher- und Bearbeitungsprozesse genommen hat.
- Multidimensionalität
Digitale Objekte zeichnen sich dadurch aus, dass sie stets mehrere Ebenen oder Dimensionen besitzen. Ihr Inhalt kann in unterschiedlicher Form codiert, an verschiedenen Speicherorten abgelegt und mit variierendem Umfang oder Gehalt vorhanden sein, was insbesondere bei der Analyse relevant ist. Für eine fundierte digitale Quellenkritik ist es daher wichtig, diese unterschiedlichen Dimensionen zu erkennen, miteinander in Beziehung zu setzen und zu analysieren, welche Auswirkungen das Fehlen oder die Unzugänglichkeit einzelner Komponenten auf die Interpretation der Quelle haben kann. Darüber hinaus spielt auch das ursprüngliche technische Umfeld digitaler Objekte eine Rolle. Es ist zu berücksichtigen, auf welchem Medium sie ursprünglich gespeichert waren und ob diese Umgebung Einfluss auf ihre Struktur oder Nutzbarkeit hatte. Auch die Frage, unter welchen technischen Voraussetzungen eine digitale Quelle ursprünglich funktionierte, etwa bei älteren Programmen, wie z. B. Computerspielen, ist relevant: Hier sind Faktoren wie Prozessorgeschwindigkeit, grafische Darstellungsmöglichkeiten und verwendete Hardwarekomponenten von Bedeutung. Ein weiterer Aspekt betrifft die Bewertung der Echtheit und Unversehrtheit digitaler Objekte. Da in vielen Fällen nicht alle Dimensionen eines digitalen Objekts vollständig zugänglich oder rekonstruierbar sind, ist es besonders wichtig, solche Lücken zu benennen und kritisch zu reflektieren, welche Konsequenzen sie für die Aussagekraft der Quelle im Hinblick auf die Forschungsfrage haben. D.h. die Provinienz und Überlieferungsgeschichte einer digitalen Quelle umfasst neue Dimensionen.
- Medialität/Materialität
Im Gegensatz zu physischen Medien sind digitale Objekte deutlich flexibler in Bezug auf ihren Speicherort und ihre materielle Verankerung: Sie können problemlos kopiert, verschoben oder auf verschiedene Speichermedien übertragen werden. Diese hohe Mobilität ist auf die technische Struktur digitaler Daten zurückzuführen, die eine unkomplizierte Vervielfältigung erlaubt. Dadurch wird es gleichzeitig schwieriger, Veränderungen am Inhalt zweifelsfrei nachzuvollziehen, insbesondere im Vergleich zu analogen Quellen. Hinzu kommt, dass moderne Computersysteme Inhalte wie Text, Metadaten und Formatierung meist separat abspeichern. Eine sichere Einschätzung darüber, ob ein digitales Objekt im Originalzustand oder bereits verändert vorliegt, ist nur dann möglich, wenn alle Komponenten vollständig und unverändert zugänglich sind.
Trotz dieser Herausforderungen bietet die materielle Beschaffenheit digitaler Objekte auch wichtige Ansatzpunkte für die quellenkritische Bewertung. So kann die physische Speichermethode Rückschlüsse auf Struktur und Herkunft der Daten erlauben. Auch technische Rahmenbedingungen vergangener Zeiten, wie etwa begrenzte Übertragungskapazitäten zu Beginn des Internetzeitalters, haben Spuren hinterlassen: Daten wurden häufig komprimiert oder vereinfacht dargestellt. Ebenso können bestimmte Eigenschaften digitaler Inhalte, etwa eingebettete Medien oder anpassungsfähige Layouts für verschiedene Endgeräte, Hinweise auf ihre Entstehungszeit oder ursprüngliche Nutzungskontexte liefern. In diesem Sinne eröffnet die materielle Seite digitaler Objekte auch Chancen für eine reflektierte Einschätzung ihrer Authentizität, Vollständigkeit und Herkunft.
