Logo

Suche in HISTOFOX

ArtikelDateibenennung

Dateibenennung

Dieser Text ist eine an die Fachdisziplin angepasste Fassung des Textes „Dateibenennung“ aus Data Affairs von Anne Voigt und Birgitt Röttger-Rössler, lizenziert unter CC BY-SA 4.0.

Übersicht

In diesem Artikel geht es um Benennungen von (Forschungs)-Daten. Eine klare Dateibenennung, z. B. mithilfe einer Benennungskonvention, ist neben einer systematischen Ordnerstruktur (vgl. Artikel Ordnerstruktur) ein wichtiger Baustein der Dateiaufbewahrung und -sicherung.

Definition

Der Dateiname identifiziert eine Datei eindeutig. Er besteht aus der eigentlichen Benennung und der DateierweiterungDie Dateiendung gibt an, um welche Art von Datei es sich handelt (Dokument, Bild, Video, etc.) und in welchem Format sie gespeichert ist. Die Dateiendung bestimmt auch, mit welchem Programm die Datei standardmäßig geöffnet wird. Sie sollte unbedingt dem tatsächlichen Dateityp entsprechen und nicht geändert werden.' (Data Affairs, Glossar) Weiterlesen/ -endung'Die Dateiendung gibt an, um welche Art von Datei es sich handelt (Dokument, Bild, Video, etc.) und in welchem Format sie gespeichert ist. Die Dateiendung bestimmt auch, mit welchem Programm die Datei standardmäßig geöffnet wird. Sie sollte unbedingt dem tatsächlichen Dateityp entsprechen und nicht geändert werden.' (Data Affairs, Glossar) Weiterlesen. Die Erweiterung (z. B. *.gif, *.pdf, *.docx, *.mp3, ...) gibt Hinweise auf die Art des DateitypsDie Begriffe Dateityp und Dateiformat werden meist synonym verwendet, bezeichnen jedoch verschiedene Dinge. Weiterlesen (Bild-, Text-, Audiodateien).

Grafik: Beispiel eines Dateipfades unter Microsoft Windows, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Motivation

Die Art und Weise der Benennung von Dateien ist ein wichtiger Baustein der Datenmanagaments. Eine klare Dateibenennung

  • dient dazu, Dateien eindeutig unterscheiden zu können,
  • hilft dabei, bei verschiedenen Versionen einer Datei die aktuellste eindeutig ermitteln zu können,
  • verhindert/verkürzt das aufwändige Suchen nach Dateien,
  • erleichtert die Zuordnung und Auffindbarkeit, insbesondere wenn Dateien (versehentlich) verschoben wurden und
  • dient der Übersichtlichkeit, da Dateien logisch sortiert angezeigt werden.

Durch ein systematisches Vorgehen bei der Dateiorganisation kann sichergestellt werden, dass Informationen nicht irrtümlich gelöscht oder überschrieben werden, aus Backup-Routinen'Der Begriff Backup bedeutet Datensicherung beziehungsweise Datenrettung und bezeichnet das Kopieren von Daten als Vorsorge für den Fall, dass es durch einen Schaden z. B. an der Festplatte oder durch versehentliches Löschen zu Datenverlusten kommt. Mit einem Backup können die Daten wiederhergestellt werden. Dafür wird der Datensatz auf einem anderen Datenträger zusätzlich gesichert (Sicherungskopie) und offline oder online abgelegt.' (Data Affairs, Glossar) Weiterlesen herausfallen oder verloren gehen. Systematische Dateibenennungen sind besonders wichtig, wenn mehrere Personen eines Teams Dateien gemeinsam bearbeiten bzw. darauf zugreifen.

Vorgehen

Allgemeine Empfehlungen

Die folgenden Elemente sind für eine klare Dateibenennung meist ausreichend. Je nach Kontext, Projekt und Arbeitsumfeld können jedoch einige entfallen oder weitere hinzugenommen werden (VerbundFDB, 2018).

  1. Datum
  2. ggf. Organisation/Zugehörigkeit zu einem Projekt, Abteilung o. ä.
  3. Kurztitel
  4. Version
  5. bei Teamarbeit: der/die jeweilige Autor*in oder Bearbeiter*in

Die angegebene Reihenfolge ist nicht bindend. In der Regel wird jedoch empfohlen, das Datum voranzustellen, da die Dateien so in chronologischer Reihenfolge sortiert werden. Wichtig ist in jedem Fall, dass die Dateibenennung konsistent erfolgt, d. h. unter Verwendung der festgelegten Bestandteile in immer der gleichen Reihenfolge.

Auf Leerzeichen, Satzzeichen, Sonderzeichen (z. B. Schrägstriche, Dollar, Euro, Paragraph), Umlaute und diakritische Zeichen verzichten. Diese Sonderzeichen erschweren die Kompatibilität zwischen verschiedenen Systemen, weil sie je nach Betriebssystem unerwünschte Effekte erzeugen können, wie z. B. eine Änderung des Dateinamens.

Grafik: Zeichen in Dateinamen, Anne Voigt, 2025, lizenziert unter CC BY-SA 4.0

Für die Trennung der Bestandteile im Dateinamen haben sich aus den Programmiersprachen kommend folgende mögliche Schreibweisen etabliert:

Grafik: Trennungsmöglichkeiten der Bestandteile von Dateinamen, Anne Voigt, 2023, lizenziert unter CC BY-SA 4.0

Bestandteile des Dateinamens

Datum

Grundsätzlich wird in jedem Dateisystem das Datum der letzten Änderung einer Datei gespeichert. Diese Informationen sind aber nicht immer betriebssystemübergreifend verfügbar und gehen evtl. beim Kopieren/Verschieben/Versenden/… verloren. Spielt das Datum eine wichtige Rolle, sollte es mit in den Dateinamen geschrieben werden.

  • Steht das Datum am Anfang des Dateinamens, werden die Dateien auch bei alphabetischer Sortierung nach Dateinamen chronologisch sortiert angezeigt.
  • ISO 8601-Format: JJJJ-MM-TT (gekürzt: JJ-MM-TT oder JJMMTT)
    Dieses Format ist ein international anerkannter und eindeutiger Standard und lässt sich von anderen Programmen auslesen, dies ist z. B. relevant für Archivierungszwecke (Wikipedia, 2023).

Beispiele

2021-02-10_
2021-02-21_
2021-03-05_

Organisation/Zugehörigkeit

Damit auch nach längerer Zeit oder für Dritte erkennbar ist, aus welchem Kontext eine Datei stammt, ist es hilfreich, ein Kürzel für die Organisation/das Projekt/ … im Dateinamen festzuhalten. Optimalerweise sind alle verwendeten Abkürzungen in einer ReadMe-Datei dokumentiert, sodass sie bei Bedarf leicht auffindbar sind. Dies gewährleistet Einheitlichkeit bei der Dateibenennung und hilft, Missverständnisse über die Abkürzungen zu vermeiden.

Beispiele

Task Area 4 Data Literacy: 2025-02-10_TA4 
Qualitative Interviews: 2025-02-10_QI
Hausarbeit: 2025-02-10_HA

Kurztitel der Datei

Der Kurztitel sollte den Inhalt der Datei deutlich widerspiegeln, aber trotzdem sehr knapp formuliert werden. Es sollten so viele Informationen in die Namensgebung einfließen, dass Dateien und Dokumente auch ohne den Ablagekontext (Ordnerstruktur) z. B. beim Versenden identifiziert werden können.

Beispiele

Protokoll: 2025-02-10_TA4_Protokoll-jf
Transkript zu Interview 1: 2025-02-10_QI_Int01-Transkript
Hausarbeit zur Methode Interview: 2025-02-10_HA_Methode-Int

Versionierung

Versionierungen'Versionierung bedeutet die Erfassung aller Veränderungen von Forschungsdaten während des Arbeitsprozesses. Es empfiehlt sich bei jeder Datenanpassung eine neue Version dieser zu speichern, um die Veränderung nachvollziehbar kenntlich zu machen. Dafür können manuelle Maßnahmen wie Versionierungsschemata (z. B. durch Nummerierung: Version 1.3.2.) ergriffen, oder Versionierungssoftware wie Git verwendet werden. Versioniert wird während des Forschungsprozesses selbst, aber auch bei bereits veröffentlichten Forschungsdaten ist eine Versionierung im Nachhinein möglich, um nachnutzenden Dritten die korrekte Version der Forschungsdaten zur Verfügung zu stellen.' (Data Affairs, Glossar) Weiterlesen sind wichtig, um vor allem auch in Projektteams Änderungen sowie Arbeits- und Denkprozesse nachvollziehen zu können. Benennungen mit „final2″, „finalfinal”, „FINAL!!!”, „bearbeitet” etc. sind nicht eindeutig. Es empfiehlt sich daher, eine Versionierung mit „v+Nummerierung” in den Dateinamen einzufügen. Verwenden Sie jeweils eine vorangestellte Null bei der Hauptversion (01, 02 usw.), bleibt die Sortierung der Dateien auch dann noch korrekt, wenn mehr als neun Versionen existieren.

In Abhängigkeit von der Arbeitsweise kann bei der Versionierung zwischen größeren und kleineren Änderungen an einer Datei unterschieden werden. Die allererste Version wird dann mit v01-0 markiert, die nächste kleine Änderung (Rechtschreib- und Grammatikfehler verbessern, Formatierung, etc.) erhält ein v01-1 und die nächste große Änderung (neues Kapitel hinzugefügt, umstrukturiert, usw.) ein v02-0 als Versionsnummer.

Beispiele

Erste Version: 2025-02-10_QI_Int01-Transkript-v01-0
Erste Version mit kleineren Änderungen: 2025-02-10_QI_Int01-Transkript-v01-1
Erste größere Revision: 2025-02-10_QI_Int01-Transkript-v02-0

Autor*in/Bearbeiter*in

Die Nennung der zuletzt bearbeitenden Person im Dateinamen ist hilfreich, wenn verschiedene Personen am gleichen Dokument arbeiten. So ist transparent, wer welche Änderungen vorgenommen hat, oder von wem ein Dokument stammt. Die Initialen sind meist ausreichend.

Beispiele

Person, die das Dokument erstellt hat: 2025-02-10_QI_Int01-Transkript-v01-0_XY
Person, die die letzten Änderungen vorgenommen hat: 2025-02-10_QI_Int01-Transkript-v01-1_YZ

Anwendungsbeispiele

Grafiken: Abbildung 1 bis 5, Anne Voigt, lizenziert unter CC BY-SA 4.0

Diskussion

Betriebssysteme und Speicherung des Datums einer Dateiänderung
„Es werden doch die Daten der Erstellung und der letzten Bearbeitung gespeichert, warum soll das auch noch in den Dateinamen?”
Es ist trotzdem sinnvoll, das Datum mit in den Dateinamen zu schreiben, obwohl in jedem Dateisystem das Datum der letzten Änderung einer Datei gespeichert wird. Diese Informationen sind nicht immer betriebssystemübergreifend verfügbar und können beim Kopieren/Verschieben/Versenden/… verloren gehen.

Versionierung vs. Änderungsverfolgung (bei Word)
„Viele Programme bieten mittlerweile Funktionen, um Änderungen nachvollziehen zu können (u. a. Word). Sollte ich trotzdem für jede Version eine eigene Datei erstellen?”
Ja, weil so direkt aus dem Dateinamen ersichtlich wird, dass eine Änderung stattgefunden hat und nie zwei (oder mehr) Dateien mit ähnlichem Namen z. B. Kopien o. ä., aber unterschiedlichen Inhalten existieren. Dies wird insbesondere dann zum Problem, wenn Dateien per E-Mail hin und her geschickt werden und der Dateiname nicht immer entsprechend angepasst wird nach der Bearbeitung.  Außerdem kann das Nachverfolgen von Änderungen z. B. in Word abgeschaltet werden, oder die verschiedenen Autor*innen unterschiedliche Software benutzen, die Versionierung nicht (vollständig) unterstützen

Versionierungen und höherer Speicherverbrauch
„Wenn jede auch noch so kleinste Änderung als neue Version abspeichert wird, verbraucht das nicht unnötig viel Speicherplatz?”
Das gilt vor allem für Video-, Audio- und Bilddateien. Hier empfiehlt es sich, die Rohdaten im Original zu behalten und eine „Arbeitsdatei” zu erstellen, aus der dann ggf. verschiedene Versionen bzw. die finale Datei generiert werden.
Textdateien verbrauchen i. d. R. nicht so viel Speicherplatz. Arbeiten Sie in einem Team gemeinsam an Dateien, ist es ratsam, jede Veränderung zu versionieren, damit den Teammitgliedern zur weiteren Bearbeitung immer die aktuellste Datei vorliegt. Arbeiten Sie allein an den Dateien, können Sie selbst entscheiden, ob Sie auch für kleinste Rechtschreib- und Grammatikkorrekturen eine Version anlegen, oder nur bei inhaltlichen (größeren) Bearbeitungen.

Versionierungen und Übersichtlichkeit
„Verliert man nicht die Übersicht bei zu vielen Versionierungen von Dateien? Wohin mit den vielen alten Versionen?”
Es bietet sich an, die vorherigen Versionierungen in einem Archiv-Ordner abzulegen, und alle Versionen bis auf die aktuellste dorthin zu verschieben. So liegen im Hauptordner nur die aktuellen Versionen, die dann direkt gefunden werden. Es ist ratsam, Ordner regelmäßig aufzuräumen und nicht gebrauchte Dateien (inkl. Versionen) zu löschen, da dies Energie spart und so die Umwelt schont.

Literatur und Quellenangaben

Zitierweise

Voigt, Anne. 2025. „Dateibenennung“. HISTOFOX. Das Informations-, Lern- und Lehrportal für Datenkompetenzen in den historisch arbeitenden Disziplinen. NFDI4Memory und Freie Universität Berlin. https://histofox.4memory-dataliteracy.de/artikel/dateibenennung/