Format de fichiers

Objectifs

  • Découvrir la différence entre format propriétaire et format ouvert ;

  • Découvrir la convention d'extension de fichiers ;

  • Découvrir la structure des fichiers.

Mise en situation

Le codage en binaire n'est pas suffisant pour représenter de l'information dans un ordinateur. Il est également nécessaire de définir des formats. Un format décrit la façon de coder l'information, par exemple le fait que l'on va associer le nombre 65 à la lettre A est défini par le format ASCII.

Dans le machine, l'information est stockée sous forme de fichiers. Ces fichiers ont donc un format qui permet de définir comment les utiliser. Il existe une grande variété de formats de fichiers, par exemple :

  • pour l'audio : MP3 ou FLAC,

  • pour le texte : DOC ou ODT,

  • pour la vidéo : MP4 ou AVI.

DéfinitionFormat de fichier

Un format de fichier définit comment l'information codée au sein d'un fichier est organisée.

ExempleFormats utilisés pour le traitement de texte

Pour le traitement de textes, il existe différents formats de fichiers. Les plus courants sont :

  • TXT, qui représente le texte sans style,

  • DOC, qui est le format utilisé et rendu populaire par le logiciel Word développé par Microsoft,

  • ODT, qui est le format utilisé par les logiciels Open Office et Libre Office.

ExempleFormats utilisés pour les images

Pour les images, il existe une grande variété de formats. Les plus courants sont :

  • PNG qui gère la transparence des images,

  • JPEG qui est bien adapté pour des photographies,

  • SVG qui gère les images vectorielles.

Remarque

Il faut remarquer la différence entre l'organisation d'un fichier et le codage des informations qu'il contient. Un format de fichier définit à la fois l'organisation des informations nécessaires pour représenter la ressource et leur codage.

FondamentalFormat ouvert et format propriétaire

Les formats de fichiers peuvent être ouverts ou propriétaires.

Un format ouvert se base sur un standard public : la manière dont est structuré le fichier est transparente. Ce format permet l'interopérabilité des systèmes et des logiciels.

Un format propriétaire se base sur un standard privé : la manière dont est structuré le fichier est uniquement connue de l'auteur.

ExempleFormat de documents textes

  • Le format HTML est un format ouvert de document : n'importe quel navigateur peut afficher de tels documents et n'importe qui peut facilement modifier ce document à l'aide de n'importe quel éditeur de textes.

  • Le format DWG est un format dont Autodesk est propriétaire : ce type de document ne peut être ouvert et modifié qu'avec AutoCAD, le logiciel de dessin assisté par ordinateur de texte d'Autodesk.

FondamentalExtension

Chaque format de fichier possède une ou plusieurs extension qui facilite son identification.

ExempleExtension de fichiers multimédia

Images

Format

Extension

GIF : Graphics Interchange Format

.gif

JPEG

.jpeg, .jpg

AVI : Audio Video Interleave

.avi

PDF : Portable Document Format

.pdf

AttentionUne extension n'est qu'une convention

L'extension du fichier facilite l'identification du type d'un fichier et aide le système d'exploitation à trouver l'application adaptée pour son utilisation.

Néanmoins, ce n'est qu'une convention : l'extension du fichier peut être changée sans affecter le contenu du fichier.

Ainsi, une image JPEG portant une extension .txt sera toujours une image JPEG et pourra être exploitée par tous les logiciels d'image.

FondamentalStructure d'un format de données binaire

Un format de données binaire est un format qui ne stocke pas l'information sous forme de texte. Ces formats structurent les fichiers en plusieurs segments. Les types de segments sont les suivants :

  • une signature qui indique le type de fichier.

  • un en-tête qui spécifie des informations sur le contenu du fichier comme le type d'encodage, la taille de l'encodage, la version du format, la longueur du contenu, etc., ou qui contient certaines méta-données propres au type de fichier. On parle aussi de header.

  • son contenu, tel que spécifié par le format.

  • un segment de fin de fichier éventuellement.

ExempleStructure du format MP3

MP3 est un fichier audio qui stocke la majorité de son information sous un format binaire. MP3 est structuré par des datagrammes. Chaque datagramme est composé d'un segment d'en-tête et d'un bloc de données.

Le header comporte toute l'information nécessaire pour pouvoir interpréter les données dans le segment suivant : on retrouve par exemple la version du format MP3 à utiliser et la fréquence d'échantillonnage.

Un fichier peut comporter un en-tête général qui spécifie des méta-données. Dans le cas de MP3, ces méta-données sont typiquement les informations sur l'enregistrement tel que l'auteur, l'album, une référence vers la pochette de l'album, etc.

À retenir

  • Il existe beaucoup de formats de fichiers que l'on peut classer en deux types : les formats propriétaires et les formats ouverts.

  • L'extension d'un fichier n'est qu'une convention : elle n'est là que pour aider à identifier le format.

  • Les formats de fichiers complexes sont souvent structurés en segments.

Stéphane Crozat, Julien Jerphanion, Quentin Duchemin Paternité - Partage des Conditions Initiales à l'Identique