Motivation: Digitale Annotation von Quellen
Die digitale Annotation ist die Übertragung des Arbeitsprozesses der Quellenauswertung aus dem Analogen in das Digitale. Wie auch im Analogen hängen Detailgrad und Arbeitsaufwand von der konkreten Forschungsfrage bzw. den Projektzielen ab. Wenn das Ziel ein Editionsprojekt ist, bei dem möglichst präzise die Textgenese erforscht werden soll, so werden Textpassagen bspw. mit Informationen zu verschiedenen Autorinnen und Schreibstufen ausgezeichnet. Normalerweise aber bezieht sich die Annotation konkret auf die Beantwortung der Forschungsfrage. Das heißt, dass entsprechend der Methode Textpassagen mit Informationen angereichert werden, um die Forschungsfrage beantworten zu können. Oft wird dabei ein eigenes Vokabular entwickelt, das die verschiedenen Aspekte, die zur Beantwortung der Forschungsfrage in den Quellen ermittelt werden, repräsentiert. So ist es im späteren Auswertungs- und Schreibprozess leichter möglich, sich alle Belege aus den Quellen zu einem Aspekt zusammenzusuchen, diese vergleichend nochmals zu analysieren, um die entsprechenden Schlussfolgerungen zu ziehen. Anschließend können auch die Belegstellen zu den Forschungsergebnissen einfacher, korrekt und vollständig zitiert werden. Dies ist eine Arbeitserleichterung, weil das Wiederauffinden von Quellenbelegen und deren anschließende Zitation leichter wird. Außerdem ist die Nachnutzung des selbst entwickelten Vokabulars für eigene nachfolgende Forschungsprojekte eine gute Grundlage, da man vielfach in ähnlichen Forschungsbereichen bleibt und sich somit über Jahre hinweg eine systematische Wissensdatenbank aufbaut. Früher waren dies die sogenannten Zettelkataloge bzw. Karteikästen, die sich Forschende individuell über ihre Forschungskarriere hinweg aufgebaut haben.
Digitale Annotation kann helfen, Inkonsistenzen zu reduzieren, da diese in einem systematisch aufbereiteten digitalen Vokabular leichter auffallen und dann abgebildet werden können. Ein gut dokumentiertes Vokabular kann zudem mit anderen Forschenden gemeinsam in neuen Forschungsprojekten und standortunabhängig eingesetzt werden. Die Arbeit, die im Analogen in den Aufbau von Zettelkatalogen gesteckt wird, kann also bei digitalen Methoden einfacher weiter genutzt werden. Dies betrifft sowohl die annotierten Dokumente als auch das dahinterstehende Vokabular. Bei sorgfältiger Dokumentation (vgl. Artikel Normvokabulare) und Nutzung geeignet Formate wie TEITEI (Text Encoding Initiative) bezeichnet sowohl eine Organisationsiehe unter: https://tei-c.org/ als auch ein gleichnamiges Dateiformat. Letzteres basiert auf XML (Extensible Markup Language), einer weit verbreiteten Auszeichnungssprache, und hat sich in den Geisteswissenschaften als Standard zur Kodierung und Auszeichnung von Texten durchgesetzt. Mit Hilfe von TEI ist es möglich, maschinenlesbar Elemente eines Textes auszuzeichnen, wie beispielsweise Absätze oder Überschriften.Die Spezifikation von TEI - auch Guidelines genannt - kann unter https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html eingesehen werden. Zudem können Inhalte wie Personen- oder Ortsnamen als solche markiert und Anmerkungen eines kritischen Apparates eingefügt werden. Im Hinblick auf das Forschungsdatenmanagement ist es vorteilhaft, dass es sich bei TEI um ein Nur-Text-Format handelt, es also auch ohne spezielle Programme von Menschen interpretiert werden kann. Weiterlesen erhöht sich dadurch zudem die Qualität, die Nachvollziehbarkeit und Transparenz der Forschungsergebnisse, weil die Quellen und die zugehörigen Annotationen anderen Wissenschaftlerinnen in Form von FAIR 'Die FAIR-Prinzipien wurden 2016 erstmals von der FORCE 11-Community (The Future of Research Communication and e-Scholarship) entwickelt. FORCE11 ist eine Gemeinschaft von Wissenschaftlern, Bibliothekaren, Archivaren, Verlegern und Forschungsförderern, die durch den effektiven Einsatz von Informationstechnologie einen Wandel in der modernen wissenschaftlichen Kommunikation herbeiführen und so eine verbesserte Wissenserstellung und -weitergabe unterstützen will. Das primäre Ziel liegt in der transparenten und offenen Darlegung wissenschaftlicher Erkenntnisprozesse. Demnach sollten Daten online findable (auffindbar), accessible (zugänglich), interoperable (kompatibel) und reusable (wiederverwendbar) abgelegt und strukturiert sein. Ziel ist es, Daten langfristig aufzubewahren und im Sinne der Open Science und des Data Sharing für eine Nachnutzung durch Dritte bereitzustellen. Genaue Definitionen der FORCE11 selbst können auf der Website nachgelesen werden siehe: https://force11.org/info/the-fair-data-principles/. Die FAIR-Prinzipien berücksichtigen ethische Aspekte der Weitergabe von Daten in sozialwissenschaftlichen Kontexten nicht hinreichend, weshalb sie um die CARE-Prinzipien ergänzt wurden.' (Data Affairs, Glossar) Weiterlesenaufbereiteten Forschungsdaten bereitgestellt werden können. Des Weiteren sind solch hochqualitativ annotierten Daten für andere Forschungsprojekte, auch aus ggf. ferneren Disziplinen, leichter auffindbar, weil sie aufgrund ihrer hohen Erschließungstiefe erst als potenzielle Untersuchungsmaterialien für andere sichtbar werden, woraus sich auch neue Forschungskooperationen ergeben können (vgl. Artikel Nachnutzung).
