Dateiformat
aus Wikipedia, der freien Enzyklopädie
Ein Dateiformat beschreibt die Art, in der Informationen in einer Datei gespeichert werden.
Jede Art von Datenspeicher kann Informationen zunächst einmal nur in Form von Bits, also Nullen und Einsen, speichern. Aus diesem Grund müssen Festlegungen getroffen werden, wie eine Information (z. B. Text, Daten, Bilder) in Nullen und Einsen umgewandelt wird und zurück. Für verschiedene Arten von Informationen gibt es auch verschiedene Arten von Dateiformaten. Innerhalb eines Formattyps (z. B. für Textverarbeitung) gibt es oft eine Reihe verschiedener Dateiformate, die miteinander konkurrieren.
Inhaltsverzeichnis |
[Bearbeiten] Entstehung und Bedeutung
Dateiformate werden in der Regel durch Hersteller von Computersoftware oder durch ein standardisierendes Gremium festgelegt. Bei Formaten, die nur durch einen Hersteller festgelegt wurden, spricht man auch von proprietären Dateiformaten. Auch aus proprietären Dateiformaten können sich Standardformate entwickeln, wenn sie dokumentiert sind und von anderen aufgegriffen werden. Standardformate machen es möglich, dass Software verschiedener Hersteller mit den gleichen Dateiformaten arbeitet.
Organisationen des Archivwesens arbeiten seit einigen Jahren an der Erstellung von Dateiformat-Verzeichnissen (file format registries), welche die automatisierte Erkennung von Formaten ermöglichen und Informationen zu deren Benutzung bereitstellen.
[Bearbeiten] Spezifikationen
In einer Spezifikation sollte die Art der Codierung und Anordnung von Daten innerhalb eines Dateiformats genau beschrieben werden. Für viele Dateiformate sind die Spezifikationen veröffentlicht, andere Spezifikationen werden als Geschäftsgeheimnisse behandelt, und ebenso gibt es Dateiformate, die überhaupt nicht schriftlich dokumentiert sind.
[Bearbeiten] Erkennung von Dateiformaten
[Bearbeiten] Dateinamenserweiterungen
Eine häufig verwendete Methode, um Dateiformate zu unterscheiden, ist die Verwendung unterschiedlicher Dateinamenserweiterungen für unterschiedliche Formate. Diese Methode wird zum Beispiel in den Betriebssystemen Mac OS X, CP/M, DOS und Windows angewandt. Dabei wird der letzte Punkt im Dateinamen als Trennzeichen betrachtet, und der folgende Erweiterungsteil als Kennung für das Dateiformat verwendet. Da in vielen Betriebssystemen diese Dateinamenserweiterungen zunächst auf drei Zeichen beschränkt waren, werden auch heute noch die meisten Dateiformate durch eine dreistellige Kennung identifiziert. Da die Kennungen nicht standardisiert sind, kann es vorkommen, dass verschiedene Dateiformate die gleiche Dateinamenserweiterung verwenden. Wird eine Datei umbenannt, kann dabei auch die Dateinamenserweiterung geändert werden, was dazu führt, dass der Datei ein anderes Dateiformat zugeordnet wird. Für fortgeschrittene Anwender kann dies ein Vorteil sein (zum Beispiel, um die Datei mit einer anderen Anwendung zu öffnen), für weniger versierte Benutzer ist dies jedoch eine Fehlerquelle. Aus diesem Grund sind neuere Betriebssysteme dazu übergegangen, die Dateinamenserweiterung standardmäßig zu verbergen.
[Bearbeiten] Magische Zahlen
Eine andere Art, Dateiformate zu kennzeichnen, sind sogenannte magische Zahlen. Hierbei wird das Dateiformat nicht unbedingt aus dem Dateinamen ersichtlich, sondern durch den Inhalt der Datei selbst, zum Beispiel durch eine bestimmte Kennung am Anfang der Datei. Diese Art der Kennzeichnung wird beispielsweise in vielen Unix-Derivaten verwendet. Die korrekte Identifizierung des Dateiformats wird damit eher sichergestellt als durch den veränderlichen Dateinamen. Sie führt aber auch dazu, dass die Datei zur Identifikation des Dateiformats stets geöffnet und durchsucht werden muss und hat daher Effizienznachteile.
[Bearbeiten] Metadaten
Eine weitere Möglichkeit, das Dateiformat zu kennzeichnen, ist die Verwendung von Metadaten im Dateisystem, d. h. die Information über das Dateiformat wird von der Datei getrennt gespeichert.