CoursAtelier Editorial
Plan Atelier Editorial : Concepts et Notion PAO : Publication Assistée par Ordinateur PAO Libre Vers un atelier éditorial pour les documents structurés
Atelier Editorial : Concepts et Notions
Plan Préambule Définition Documentation technique Qualité Editorial Texte Images
Texte
Texte : définition Un texte est une succession de caractères organisée selon un langage. Un texte est une suite de mots, et de caractères. On peut écrire un texte dans n’importe quelle langue écrite. Un texte est écrit, puis lu. Le texte comporte à la fois des chaînes de caractères significatifs et des éléments de mise en page.
Texte : définition Quatre grandes classes, liées à la représentation et à l’utilisation du texte: 1) est la chaîne de caractères ; 2) issue des outils de traitement de texte et de mise en page, reste liée à la présentation visuelle du texte, et s’adapte bien à la préparation de documents destinés à l’impression ; 3) de type hypertexte, le présentation sur écran inclut dans le texte des contenus, comme des liens avec d’autres documents, des appels à des éléments multimédias, voire à des programmes externes, définissant ainsi des modes de déplacement (ou de navigation), des niveaux de lecture, etc. 4) tente de modéliser le texte par une structure logique et documentaire qui le dégage de ses représentations visuelles ou navigationnelles.
Texte modélisé par les outils de traitement de texte Les logiciels de TT sont en évolution constante. Vs. PAO autorisent l’introduction d’éléments structurant le texte (les feuilles de style ou les modèles de documents, le mode plan, etc.) et permettent les macro-procédures. d’éléments de mise en évidence (gras, souligné, taille et polices de caractères...). Les modèles de documents et les feuilles de style portent la structure de mise en page et d’enrichissement, libérant ainsi le corps du texte de marques inutiles La Structure logiqueest prise en compte. L’introduction de styles (titres, sous-titres, notes, paragraphes, résumés, etc.), la mise en place de champs de saisie (dates, adresses, auteurs, etc.) de balisages cachés : (Méta-données) d’informations autres que visuelles, (documentaires ou porteuses de repères destinés à l’exploitation informatique ).
Texte modélisé par les outils PAO Dans les TT, le texte reste linéaire, les outils PAO introduisent une notion de pages maquettées (matérialisées par des blocs). Le placement des images, des tableaux, des intertitres, la distribution du texte, le multicolonnage, etc. sont attachés aux blocs ; le document est une suite de blocs chaînés. Dans les deux cas, PAO ou TT, les fichiers numériques résultants sont constitués de: caractères affichables (ASCII), ponctués de caractères invisibles mise en page de bas niveau (tabulations, back space, blancs insécables), de balisages qui marquent le début et la fin d’un titre, d’un paragraphe, d’une mise en évidence, etc. pointeurs sur les portions balisées du texte, ( instructions de mise en page (taille, police, justification, etc.) . Le codage interne dépend de l’outil et débouche sur des formatspropriétaires. pour exploitation du fichier Il faut avoir l’outil qui a permis de les créer. (MS Word ou Xpress), avoir la licence pour pouvoir exploiter un CD-ROM ou consulter en ligne des documents Les conversions d’un format à un autre, si elles existent, sont très souvent accompagnées de la perte de certains enrichissements.
Texte modélisé par les outils PAO (2) Le codage interne dépend de l’outil et débouche sur des formatspropriétaires. pour exploitation du fichier Il faut avoir l’outil qui a permis de les créer. (MS Word ou Xpress Quick Xpress), avoir la licence pour pouvoir exploiter un CD-ROM ou consulter en ligne des documents. Les conversions d’un format à un autre, si elles existent, sont très souvent accompagnées de la perte de certains enrichissements.
Texte modélisé par les outils d’impression Le meilleur exemple est le langage PostScript créé par Adobe en 1984, qui était au départ un langage de description des caractères pour l’impression des textes. Les caractères y sont décrits non plus sous forme matricielle, mais sous forme de petits programmes qui dessinent les lettres. PostScript est devenu un format standard pour les images vectorielles et l’impression. Il est reconnu par la quasi-totalité des imprimantes. Les outils offrent les fonctions d’impression, qui transforment leur codage propriétaire en un fichier PostScript, qui est un véritable programme informatique.
Une structure logique de navigation hypertextuelle Les outils les plus courants proposent la mise en page ou en écran des documents, doublée d’une structure de navigation, réalisée par un réseau d’ancres ou d’arcs orientés (liens avec d’autres objets (textes, images, sons...) ou avec des applications externes). Des zones sensibles de type textuel, graphique ou iconique (source) vers un document cible, L’organisation de la recherche peut prendre plusieurs aspects: Certains outils construisent des indexations automatiques (sommaire de MS Word) et proposent des recherches sur le texte entier ou sur des portions identifiées (titres, chapitres, etc.). D’autres y ajoutent des modes d’indexation particuliers (champs, ensemble de mots-clés, etc.).
Une structure logique de navigation hypertextuelle Fréquemment, sont ajoutées des interactions plus riches (menus, diverses variétés de QCM, etc.) et des modalités d’interfaçage (multi-fenêtrages, boutons, etc.). Document interactif Formulaire PDF
Texte: Format
Texte: Format
Caractéristiques : Typographie, Dimension, Style. Police : L'apparence de chacun des caractères d'un document est déterminée par les caractéristiques de mise en forme de la police de caractères utilisée. Les caractéristiques de mise en forme de la police de caractères sont les suivantes : Police et soulignage:- La police de caractères- La taille de la police- La couleur de la police- Le soulignage Attributs: Gras, Italique, Barré, Barré double, Exposant, Indice, Petites majuscules, Majuscules, Ombré, Contour, Relief, Empreinte Espacements: La mise à l'échelle (Zoom), L'espacement entre caractères, La position sur la ligne (décalage vers le haut/vers le bas), Le crénage L'affichage d'un caractère sur un écran ou son impression avec une imprimante nécessite les données spécifiant le dessin exact du caractère, le glyphe. Comme en typographie, un ensemble de glyphes d'une même famille de caractères est une police de caractères.
Numérisation d’un texte Définition Dans son sens le plus répandu, la numérisation est la conversion d'un signal (vidéo, image, audio, caractère d'imprimerie, impulsion, etc.) en une suite de nombres permettant de représenter cet objet en informatique La numérisation est une des manières de créer des données à traiter. Procédé La numérisation directe de textes s'effectue à l'aide d'un scanneur, qui convertit les niveaux de lumière et les couleurs en données binaires. Le résultat peut alors être stocké dans un fichier et édité dans un logiciel de traitement de texte qui ont été convertis par reconnaissance optique de caractères.
Le codage d’un texte Comme les PC travaillent sur des nombres binaires, chaque caractère reçoit un numéro, qui peut être codé sur 1, 2, ou N variable d'octets. +ieurs standards de codage de caractères, dont les plus connus sont ASCII, ISO 8859, et Unicode. Dans les standards ASCII, ISO 8859, et Unicode, le caractère «A» a reçu le numéro 65, «B» le 66, «a» le 97 et «,» le 44. Le caractère «é» n'existe pas en ASCII, qui ne contient que 128 caractères. En revanche, «é» a le numéro 233 en ISO 8859-1 et Unicode. Le caractère «€»n'existe pas en ISO 8859-1. En revanche en Unicode, «€» a reçu le numéro 8364. Ce dernier numéro ne peut pas être codé sur un seul octet car il faut 14 bits pour représenter 8364 en base 2 (10000010101100). 1er codage largement répandu fut l'ASCII. Pour des raisons historiques (US) et techniques (7 bits disponibles seulement pour coder un caractère), ce codage ne prenait en compte que 27 soit 128 caractères. ASCII ne comporte pas les caractères accentués, les cédilles, etc.
ASCII : American Standard Code for Information Interchange « Code américain normalisé pour l'échange d'information ») est la norme de codage de caractères en informatique la plus connue et la plus largement compatible. Contient les caractères pour écrire en anglais. Elle est à la base de nombreuses autres normes comme ISO 8859-1 et Unicode qui l'étendent. L'ASCII définit 128 caractères numérotés de 0 à 127 et codés en binaire de 0000000 à 1111111 pour un octet le 8e bit est 0. n° 0 à 31 et le 127ne sont pas affichables ; des commandes de contrôle de terminaux. (N° 4 End of Transmission (fin de transmission)) n° 32 est l'espace. Les autres caractères sont les chiffres arabes, les lettres latines maj et min et quelques symboles de ponctuation.
Page de Code D'autre normes ont repris les codes ASCII, et défini d'autres caractères pour les codes supérieurs à 127 en utilisant le 8e bit Pour définir les n° de 128 à 255. La norme ISO/CEI 8859 fournit des extensions pour diverses langues. ISO 8859-1, aussi appelée Latin-1, étend l'ASCII avec les caractères accentués utiles aux langues FR et G. On appelle souvent « ASCII » des normes qui étendent ASCII, mais qui ne sont pas compatibles entre elles: Windows-1252 (couramment utilisé sur Microsoft Windows dans les pays occidentaux), ISO 8859-1 (couramment utilisé sur Internet et UNIX) et la page de code 850 (couramment utilisée sur DOS) ne sont pas la norme ASCII. Les caractères non ASCII comme les « lettres accentuées » (éÈç) s'affichent mal.
Le codage d’un texte L'ISOa donc défini de nouvelles normes, ISO 8859-1, ISO 8859-2, etc. jusqu'à ISO 8859-15. Ces jeux de caractères permettent de coder la plupart des langues occidentales. Le français utilise (ISO 8859-1), aussi nommé latin1, ou ISO 8859-15 (latin9), qui a l'avantage de contenir des caractères comme le « œ » ou le « € ». Afin d'unifier les différents codages de caractères complétant l'ASCII et y intégrer les codages complètement différents (le JIS pour le japonais par exemple), la norme Unicode a été inventée. Le besoin de supporter de multiples écritures, Le codage Unicode a pour ambition d'être un surensemble de tous les autres, et est souvent représenté en UTF-8 ou en UTF-16.
Unicode Le répertoire complet d'Unicode contient près de 100 000 caractères, chacun possédant un unique code entier compris entre 0 et hexadécimal 10FFFF (soit un peu plus de 1,1 million - il existe donc des entiers auxquels aucun caractère n'est associé). Deux autres répertoires fréquemment utilisés, le code ASCII et l'ISO 8859-1, sont respectivement identiques aux 128 et 256 premiers caractères d'Unicode. BUT Unicode, (1991) pour remplacer l’utilisation de pages de code nationales. Ces pages de code présentaient en effet quelques problèmes: « signe monétaire », dollar US devient livre UK sans changer le texte. Dans la pratique, tous les systèmes d’écriture ne sont pas encore présents, recherche en cours
Unicode : versions 3.0 sont ceux de la norme ISO/CEI 10646:2000. 3.2 classait 95 221 caractères, symboles et directives. 4.1 contient 137 468 caractères à usage privé + 97 755 lettres ou syllabes, chiffres ou nombres, symboles divers, signes + 70 207 caractères idéographiques, 8 258 points de codes réservés de façon permanente interdits pour le codage de texte (assignés dans toutes les versions d’Unicode) ; et soit Total de près de 245 000 points de codes assignés dans un espace pouvant contenir 1 114 112 codes différents. La version 5.0 a été publiée en juillet 2006 et la version 5.2 en octobre 2009.
Image Définition Il existe 2 sortes d'images numériques : Une image est une représentation visuelle voire mentale de quelque chose (objet, être vivant et/ou concept). Elle peut être : naturelle (ombre, reflet) ou artificielle (peinture, photographie), visuelle ou non, tangible ou conceptuelle (métaphore), Platon: « j'appelle image d'abord les ombres ensuite les reflets qu'on voit dans les eaux, ou à la surface des corps opaques, polis et brillants et toutes les représentations de ce genre ». Le mot image vient du latin imago, qui désignait les masques mortuaires. Il existe 2 sortes d'images numériques : les images matricielles et les images vectorielles.
Image vectorielle est une image numérique composée d'objets géométriques individuels (segments de droite, polygones, arcs de cercle, etc.) définis chacun par divers attributs de forme, de position, de couleur, etc. L'intérêt est de pouvoir redimensionner l’image à volonté sans aucun effet d’escalier (de pixellisation). L'inconvénient est que pour atteindre une qualité photoréaliste, il faut pouvoir disposer d'une puissance de calcul importante et de beaucoup de mémoire. De plus, Un dessin vectoriel est dessiné à nouveau à chaque visualisation, ce qui engendre des calculs sur la machine. Ces images sont essentiellement utilisées pour réaliser des schémas ou des plans. Les logiciels de dessin industriel fonctionnent suivant ce principe ; les principaux logiciels de traitement de texte ou de PAO (publication assistée par ordinateur) proposent également de tels outils.
Image vectorielle : principe Consiste à décrire des formes géométriques simples arcs de cercle ou d'ellipse, segments, courbes de Bézier...), auxquelles on peut appliquer des transformations : rotations, écrasement, mise à l'échelle. Chacune des primitives géométriques possède un certain nombre d'attributs (position, couleur, remplissage). Lors d'une représentation, le logiciel travaille avec des lignes (ou encore courbes) et des surfaces. Toutes les lignes, individuellement, sont définies par des points caractéristiques qui définissent son équation. Ces points caractéristiques forment un vecteur. Ainsi, cette équation est calculée par l'ordinateur et est gardée en mémoire. Par exemple, en traçant une ellipse, elle existera sous deux formes : (1) une formule mathématique en mémoire et (2) un tracé sur l'écran qui est commandé par le vecteur, les caractères du trait et la couleur de la surface. Ainsi, tous ces paramètres restent modifiables séparément.
Image vectorielle : principe Consiste à décrire des formes géométriques simples arcs de cercle ou d'ellipse, segments, courbes de Bézier...), auxquelles on peut appliquer des transformations : rotations, écrasement, mise à l'échelle. Chacune des primitives géométriques possède un certain nombre d'attributs (position, couleur, remplissage). Lors d'une représentation, le logiciel travaille avec des lignes (ou encore courbes) et des surfaces. Toutes les lignes, individuellement, sont définies par des points caractéristiques qui définissent son équation. Ces points caractéristiques forment un vecteur. Ainsi, cette équation est calculée par l'ordinateur et est gardée en mémoire. Par exemple, en traçant une ellipse, elle existera sous deux formes : (1) une formule mathématique en mémoire et (2) un tracé sur l'écran qui est commandé par le vecteur, les caractères du trait et la couleur de la surface. Ainsi, tous ces paramètres restent modifiables séparément.
Image vectorielle : caractéristiques La représentation vectorielle introduit une notion de couches de dessin. Il est possible de superposer plusieurs plans de courbes, ce qui est impossible à réaliser en représentation bitmap puisqu'il n'y a qu'une seule couche, chaque point nouveau écrase le point précédent. L'avantage d'une représentation vectorielle est la finesse et la précision des tracés. Il est possible de modifier chaque ligne très rapidement. À chaque zoom, le tracé reste précis car l'ordinateur recalcule les coordonnées en fonction de l'échelle demandée. Le dessin vectoriel offre une possibilité de « zoom infini ».
Image matricielle Une image matricielle est formée d'un tableau de points ou pixels. Plus la densité des points est élevée, plus le nombre d'informations est grand et plus la résolution de l'image est élevée. Corrélativement la place occupée en mémoire et la durée de traitement seront d'autant plus grandes. Les images vues sur un écran de télévision ou une photographie sont des images matricielles. On obtient également des images matricielles à l'aide d'un appareil photo numérique, d'une caméra vidéo numérique ou d'un scanner.
Résolution d’une image image est divisée en points ou pixels. Pour une image de 10 cm sur 10 cm avec une résolution très faible de 10 pixels par cm. Elle est codée sur 100 x 100 = 10000 pixels. convenable de 100 pixels par cm (un pixel mesure 0,1 mm), elle serait codée sur 1000 x 1000 = 1000000 pixels = 1 M pixels. Le symbole M signifiant million. Remarque: en général on utilise l'unité de longueur anglo-saxonne le pouce ou inch. La résolution d'une image s'exprime alors en pixels par pouce (ppp) ou dots per inch (dpi) en anglais.
Résolution d’une image La définition d'une image avec sa notion connexe de résolution définit le niveau de détails qui seront visibles dans l'image. Plus une image a de pixels, plus elle est de grande qualité et de taille La résolution définit le nombre de pixels par unité de longueur (centimètre ou pouce). La résolution d'une image numérique s'exprime en PPI (Pixel Per Inch) ou PPP (Pixels Par Pouce). La résolution d'impression d'une imprimante se détermine en DPI (Dot Per Inch) ou PPP (Points Par Pouce) La résolution à partir de laquelle un œil humain moyen ne voit plus la différence est de 76dpi à 1m de distance. 6,3 cm 1200 dpi /12,7 cm 600 dpi / 20 cm 380 dpi / 25,3 cm 300 dpi.
Résolution d’image 18 pixels par pouce soit environ 7 pixels par cm dans ce cas on observe l'effet de pixelisation 72 pixels par pouce soit environ 30 pixels par cm. Cette dernière résolution correspond à celle d'un écran d'ordinateur, elle est donc idéale pour visualiser une image sur l'écran.
Codage de l’image numérique Le codage de l'information L'information est codée en binaire. Le support évolue mais le principe est toujours le même. A l'aide de 1 bit on a donc 2 possibilités 0/1 ou ouvert/fermé ou noir/blanc A l'aide de 2 bits on a 2x2 = 4 possibilités : 00/01/10/11- A l'aide de 3 bits on a 2x2x2 = 8 possibilités : 000/001/010/011/100/101/110/111 A l'aide de 8 bits on a 2x2x2x2x2x2x2x2 = (2)8 = 256 possibilitésCet ensemble de 8 bits est appelé "octet". En général les informations sont regroupées par groupe de 8, 16, 24, 32 ou 64 bits c'est à dire 1, 2, 3 ou 4 octets. Avec 16 bits ou 2 octets on a 2x2x2x2x2x2x2x2x2x2x2x2x2x2x2x2 = (2)16 = 256 x 256 = 65536 possibilités - Avec 24 bits ou 3 octets on a 256 x 256 x 256 = 16777216 possibilités (plus de 16 millions).On parle de kilooctet : 1 ko = (2)10 octets = 1024 octets (et non pas 1000...) mégaoctet : 1Mo = (2)20 octets gigaoctet : 1Go = (2)30 octets
Codage de l’image numérique Codage d'une image en noir et blanc Pour ce type de codage, chaque pixel est soit noir, soit blanc. Il faut un bit pour coder un pixel (0 pour noir, 1 pour blanc). L'image de 10000 pixels codée occupe donc 10000 bits en mémoire. Ce type de codage peut convenir pour un plan ou un texte mais on voit ses limites lorsqu'il s'agit d'une photographie.
Codage de l’image numérique Codage d'une image en niveaux de gris Si on code chaque pixel sur 2 bits on aura 4 possibilités (noir, gris foncé, gris clair, blanc)L'image codée sera très peu nuancée. En général on code chaque pixel sur 8 bits 256 niveaux de gris. L'image de 10 000 pixels codée occupe 10 000 octets en mémoire. Exemple d'image en 72 pixels par pouce (environ 30 pixels par cm), codée en 256 niveaux de gris. Cette image de 303 x 303 pixels occupe 303 x 303 = 91809 octets puisque chaque pixel occupe 1 octet en mémoire.
Codage de l’image numérique Codage d'une image en couleurs 24 bits Il existe plusieurs modes de codage de la couleur. Le plus utilisé est le codage Rouge, Vert, Bleu (RVB). Chaque couleur est codée sur 1 octet = 8 bits. Chaque pixel sur 3 octets c'est à dire 24 bits : le rouge de 0 à 255 , le vert de 0 à 255, le Bleu de 0 à 255. Le principe repose sur la synthèse additive des couleurs : on peut obtenir une couleur quelconque par addition de ces 3 couleurs primaires en proportions convenables. On obtient ainsi 256 x 256 x 256 = 16777216 (plus de 16 millions de couleurs différentes).
Codage de l’image numérique Couleur 24 bits Couleur 8 bits
Codage de l’image numérique il suffit de 3 couleurs de base pour décrire la presque totalité des stimuli lumineux. mélange additif: Rouge (R), le Vert (G) et le Bleu (B), mélange soustractif : Jaune (Y), le Magenta (M) et le Cyan (C)