Cours de niveau Débutant Licences Université Paul Valéry Montpellier 3 Formats de fichier Cours de niveau Débutant Licences Université Paul Valéry Montpellier 3
Plan Origine des formats Quelques exemples de codage Gestion des formats Annexe : quelques formats de fichiers
Origine des formats En informatique, tout s’exprime sous forme de bits (0 ou 1) Le BIT (Binary digIT) a pour valeur 0 ou 1 Au niveau électronique : 0 Volt / +5 Volts Au niveau magnétique : champ magnétique / champ magnétique inverse Octet = regroupement de 8 bits L'usage impose de stocker des informations diverses : nombres, textes, images, ...
Qu’est ce qu’un fichier? Dupont Jean, 48 ans Vétérinaire… Codage 1010001000011110 00011001000100… Des données… … stockées en machine dans un fichier
Codage ? Règles permettant de passer d’une représentation de données à une autre En général : les règles sont sans perte d'informations et inversibles 123 Cent vingt trois CXXIII
Format Format ≈ codage en binaire Pour de mêmes données, plusieurs codages ou représentations possibles ⇒ nombreux formats Chacun a ses avantages et inconvénients
Codage des entiers Avec 1 bit : 2 (21) possibilités 0 → 0 1 → 1 Avec 2 bits : 4 (2*2=22) possibilités 00 → 0 01 → 1 10 → 2 11 → 3 Avec 3 bits : 8 (2*2*2= 23) possibilités 000 → 0 001 → 1 010 → 2 011 → 3 100 → 4 101 → 5 110 → 6 111 → 7
Codage des entiers (suite) Exemple sur 8 bits : Avec 8 bits, 256 entiers peuvent être codés : de 0 à 255 = 27+26+25+…+21+20=255 65=64+1=26+1
Codage des entiers (fin) Pour des entiers plus grands, coder sur plus de bits 16 bits : de 0 à 216-1 = 65535 32 bits (4 octets) : de 0 à 232 = 4294967295 ...
Codage du texte Codage d'un caractère Associer une valeur numérique (codée en binaire) à chaque lettre Par exemple : A est codé par 65 en code ASCII A 65 1 1 27 26 25 24 23 22 21 20 1 1 B 66 27 26 25 24 23 22 21 20
Exemple : une table ASCII étendue (256 caractères)
Codage du texte Un texte = suite des codages de caractères (texte seulement) Tables normalisées : ASCII (American Standard Code for Information Exchange) : que 128 caractères ASCII étendue : 256 caractères liées à des langues Unicode et variantes (UTF-8, UTF-16) permet d'intégrer des jeux de caractères multilinguistes
Texte enrichi Bien faire la différence entre éditeur de texte traitement de texte Les éditeurs de texte ne gère que le texte (utiles pour la mise en place de codes de programmation). Les traitements de textes stockent non seulement des caractères mais aussi des mises en forme, des images, des graphiques, …
Editeur de texte Je veux stocker l’information « Moi je vous dis coucou » Moi je vous dis coucou Je vais mettre cette information dans un fichier coucou.txt Pour voir le texte contenu dans ce fichier J’utilise un éditeur de texte
Enrichissement de texte Je veux mettre en gras le mot coucou Utilisation d'un logiciel de traitement de texte L'information est alors souvent stockée dans le fichier sous forme de balises (cachées à l'utilisateur) Je vous dis Balise_debut_gras Coucou Balise_fin_gras
Evolution des formats Les logiciels de traitement de texte ont été amené à gérer des informations de plus en plus diverses. Les formats ont évolués en conséquence. Le format XML, à base de balises explicites, s'impose de plus en plus pour la description de données : Les formats html, odt, docx sont basés dessus
Du bon choix de logiciels Remarque : si on ouvre avec un éditeur de texte notre fichier enrichi (fichier créé avec un traitement de texte), nous obtiendrons quelque chose du genre (illisible pour nous) :
Codage des couleurs Plusieurs principes existent. Un fréquent = Coder sur 3 octets l’intensité des 3 composantes Rouge Vert Bleu (RGB)
Codage d'images Deux principes fréquents Images vectoriels : les courbes et figures mathématiques de l'image sont stockées. Images point à point : l'image est décomposé en point (pixels) Codage-de-la-couleur- du-pixel-(1,1), ... Codage-de-la-couleur -du-pixel-(n,n)
Vidéo 2 méthodes de visualisation : en direct : visualisation pendant le téléchargement Qualité moyenne Besoin d’une connexion très rapide à Internet (sinon « projections » saccadées) en différé : tout le fichier est téléchargé sur le disque dur avant de le visionner Meilleure qualité car temps de téléchargement non synchronisé avec temps de visualisation. Mais, selon le débit de la connexion, le téléchargement peut prendre du temps !!
Compression et archivage Archivage = regrouper plusieurs fichiers dans un même fichier de destination / regrouper des répertoires, des sous-répertoires et tout leur contenu dans un même fichier Compression de fichiers = réduire leur taille en appliquant un algorithme qui enregistre l'information sous une forme plus compacte archivage .sit compression .zip
Compression et archivage (suite) L'opération d'archivage est souvent gérée dans les logiciels de compression (et souvent de manière transparente). Cela parfois de manière bizarre : l'opération de désarchivage est parfois assimilée à l'opération de décompression (bien que différente). Les systèmes d'exploitation intègrent de plus en plus des fonctionnalités pour gérer une archive comme si c'était un dossier : Attention ! Alors modifications impossibles.
Autre type de codage de l’information : cryptographie Chiffrement des fichiers. Moyen le plus connu : codage RSA aussi appelé codage à clef publique Buts Sécurité des transmissions Protection de la vie privée Protection des secrets industriels Autorisé en France depuis 2004 (loi LCEN)
Gestion des formats La désignation d'un fichier est double : un préfixe qui est son nom un suffixe qui désigne son format Le suffixe : pour chaque format, il est normalisé 2, 3 ou 4 caractères terminant le nom du fichier et précédés d'un point) Conseil : autant que possible, laisser les applications le gérer, ne pas le saisir
Gestion des formats Le suffixe sert souvent aux systèmes d'exploitation ou aux navigateurs internet, pour choisir l'application à utiliser lors de l'ouverture d'un fichier. En général, cela peut se paramétrer. Remarque : possibilité de trier les fichiers par format (ou type) de fichier dans un gestionnaire de fichiers
Quelques formats de fichiers Annexes Quelques formats de fichiers
Formats texte Textes non formatés. TXT (Text) Textes non formatés. Utiliser : Navigateurs, traitement de texte, éditeurs de texte (Bloc-note de Windows, TextEdit de Mac). .RTF (Rich Text Format) Documents textuels normalisés. Utiliser : Logiciels de traitement de texte. .DOC .DOCX (Document) Textes mis en forme (logiciel Microsoft Word). Attention à la version de Word utilisée Utiliser : Wordviewer (Windows) ; logiciels de traitement de texte .SXW .ODT (Open Document Text) Textes mis en forme (logiciel OpenOffice) Utiliser : NeoOffice / OpenOffice (gratuit :-) )
Formats texte Format du logiciel Acrobat de Adobe A présent normalisé .PDF (Portable Document Format) Format du logiciel Acrobat de Adobe A présent normalisé Utiliser : Adobe reader (gratuit) .PS .EPS (PostScript et Encapsuled PostScrip) Typographie et mise en page. Pour imprimantes laser. Utiliser : GhostScript, Aperçu ; envoyer directement à une imprimante laser compatible.
Formats texte .PPT .PPS .PPTX (PowerPoint et PowerPoint Slideshow) Diapositives électroniques (logiciel PowerPoint de Microsoft). Utiliser : PowerPoint Viewer . .XLS .XLSX (Excel Sheet) Tableur Excel de Microsoft. Utiliser : Excel, visionneuses gratuites de Microsoft, OpenOffice. .HTML .HTM (Hypertext Markup Language) Rédaction de page Web Utiliser : Mozilla, Firefox, Safari, Microsoft Internet Explorer ou tout autre navigateur Internet Pour éditer ces fichiers : tout éditeur de .TXT (TextEdit, ...) si l'on connaît le langage HTML - Editeur web : Adobe Dreamweaver - Mozilla Composer - Frontpage
Formats image .BMP (Bitmap) Image graphique stockant les pixels sous forme de tableau de points. Simple et passe partout. Utiliser : navigateurs, logiciels de traitement d'image. .GIF (Graphics Interchange Format) Petites images, icônes, boutons des pages Web, etc. Fichiers compressés (→ assez compacts), 256 couleurs maximum .JPEG .JPG (Joint Photography Experts Group) Photos et images texturées. Fichiers très compacts (compression efficace mais avec perte de qualité) .TIFF .TIF (Tagged Image File Format) Images de qualité. Compression sans perte. « Gros » Fichiers. Utiliser : Windows : Irfan View. Mac : SimpleImage
Formats audio Format utilisé par Windows. .WAV (Waveform Audio File Format) Format utilisé par Windows. Utiliser : Windows : Lecteur multimédia. Mac : QuickTime. .MP3 (Moving Pictures Expert Group) Format public, (qualité ≈ disque compact). Utiliser : Windows : Lecteur multimédia. Mac : QuickTime… .RA .RAM (RealAudio) Séquences sonores et vidéo par Internet. Utiliser : RealAudio .OGG (OggSquich) Format open source de la fondation Xiph.org. Très bonne qualité.
Formats vidéo .AVI (Audio Video Interleave) Format vidéo générique pour Windows Généralement visualisation en différé Fichiers peu volumineux, échangeables, bonne qualité Utiliser : Windows : Lecteur multimédia. Mac : QuickTime .MOV .QT (QuickTime Movie) Développé par Apple. Excellente qualité d'image. Généralement visualisation en différé. Utiliser : QuickTime .MPEG .MPG (Moving Pictures Expert Group) Norme publique
Formats : compression et archivage .SIT .SEA (StuffIt, Self-Extracting Archives) Archivage avec compression Archives « auto-extractibles ». Utiliser : Mac : StuffIt… Windows : StuffIt… .ZIP, .GZIP, .TAR .RAR Archivage avec ou sans compression Utiliser : Mac : StuffIt… Windows : QuickZip… .7z Utiliser : 7zip
Formats : exécutables Fichiers exécutables Mac OS X (Programmes) .APP (application) Fichiers exécutables Mac OS X (Programmes) Utiliser : (Mac ) lancer l’application. .EXE (executable) Fichiers exécutables Windows. (Programmes) Mais parfois archives dites « auto-extractibles ». Utiliser : (Windows seulement): Exécuter le fichier. Archives : Décompression possible sans l’application