L’ordinateur et les langues

Slides:



Advertisements
Présentations similaires
Été INF1025 Driouch Elmahdi
Advertisements

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
TECHNOLOGIE DES ORDINATEURS
APPLICATIONS DE CREX QUELLES SONT LES PRINCIPALES CARACTERISTIQUES DU CODE? QUELS PEUVENT ÊTRE SES UTILISATIONS? EXEMPLES.
Abes agence bibliographique de l’enseignement supérieur Les scripts.
Informatique Deug2 Sciences Eco S. Maabout 2004/2005.
Niveau Intermédiaire 12/01/ Visualiser votre groupe de TD ( Visualiser mon emploi du temps) 12/01/
Chapitre 3: Système d’exploitation
Chapitre I : Culture Informatique Vous avez dit Informatique !!!
Chapitre I : Culture Informatique Vous avez dit Informatique !!!
Les ressources numériques
Samedi 6 septembre 2008matériel informatique1 Codage de linformation.
version Beta Marie Calberg Ninni Louhelainen SLFN7
Tutoriel XML – Première Partie F. Sajous & L. Tanguy ERSS – Sémantique et Corpus.
La fonction Style Permet de créer des types de texte, par exemple
INF L11 Langage et informatique 1
X-Fonter Utilitaire de gestion des fonts. Vous avez trouvé X-Fonter dans la boîte à outils ou sur le net. Il existe bon nombre de ces utilitaires plus.
Systèmes d’exploitation
2) Les types simples en Python II-Variables 1) Notion de variable
LE SYSTÈME INFORMATIQUE Présenté par : N. BENMOUSSA
Fait par votre animateur Loïc Mercier1 Pour tous renseignement écrire Tel TELECHARGER DES FICHIERS.
Environnement matériel d’un système informatique
COME Bernard Comeau Commerce électronique Les éléments retrouvés dans une page Web. COME 2001.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Représentation numérique de l’information
Administration de bases de données spatiales avec SavGIS
Unicode Facilite la partage et édition des données.
Le codage des images Une image peut-être aquise (appareil photo, scanner) ou créée avec un programme Puis elle peut être traitée : filtres, retouches...
Le codage des nombres en informatique
Algorithmique et programmation Informatique Cours 9 12/11/2001.
28 novembre 2012 Grégory Petit
Bases de données lexicales
Première partie: Optimisation et formats dimages standards pour le Web Par Thierry Goulet Web Designer, Ministère de la Sécurité publique De 9h45 à 10h45.
FICHIERS : Définition : Algorithme général:
CHAINE DE CARACTERES : Définition :
@SSR – Installation des applications eduscol.education.fr/securite - février 2007 © Ministère de l'Éducation nationale, de l'Enseignement supérieur et.
Module 1 : Généralités sur les systèmes informatiques
Pôle de compétences e-learning Développer des simulations avec Simulation Producer.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
INFORMATIQUE Plan des séances.
INFORMATIQUE INF1B Les principes de fonctionnement de l’ordinateur
Les formats Débutant – Semaine 4.
Savoir-faire "Saisie de caractères API Savoir-faire "Saisie de caractères API Univ. Paris 3, Ecole doctorale 268 Univ. Paris 3, Ecole doctorale 268 Alexis.
Informatique et Internet
L ’acquisition d ’images
Feuilles de styles CSS Syntaxe d'application d'un style à une balise HTML : Les différents types de style : Pourquoi utiliser un style ? Possibilité étendue.
Vue d'ensemble Configuration d'adresses IP
Création JJ Pellé le 11 octobre 2009
Certaines écritures et alphabets
Le langage XML.
Cliquer ici Le but de ce module est de vous donner des notions d’affichage Ces notions devraient vous aider fortement à mieux comprendre par la suite.
REPRESENTATION DE L’INFORMATION
Traitement de texte (Premiers pas)
21/10/2008 SYSTEME INFORMATIQUE.
P.D.F. Qui es-tu?.
L'unité centrale est composé en générale de :
Architecture des ordinateurs, Environnement Numérique de Travail
Les systèmes de gestion de contenu
Pierre Malenfant Technologie 9 École du Carrefour
Chapitre 4b La représentation des nombres.
1.1: notions de bases de l’informatique
Chapitre 5 La représentation des données
Informatique et sciences du numérique
Abes agence bibliographique de l’enseignement supérieur Les scripts.
Chapitre 12 Surveillance des ressources et des performances Module S41.
DUT 1ère année Génie Biologique Paul-Antoine Bisgambiglia Année
Composants Matériels de l'Ordinateur Plan du cours : Ordinateurs et applications Types d'ordinateurs Représentation binaires des données Composants et.
Les PC et leurs Applications. SYSTÈME D’EXPLOITATION Windows, MacOs… TRAITEMENT DE TEXTE Open Office, Word… NAVIGATEUR WEB Firefox, Internet Explorer,
Transcription de la présentation:

L’ordinateur et les langues Installation des langues Codage des caractères Résolution des problèmes

Localisation et utilisation des langues LOCALISATION DE L’ORDINATEUR Matériel Système

Localisation matérielle Alimentation, type de prise Clavier « japonais»

Localisation matérielle Alimentation, type de prise Clavier «arabe»

Localisation logicielle Paramétrage linguistique de l’ordinateur Menus des applications en langue du pays Plusieurs Versions de Windows (environ 35 langues plus l’adaptation aux usages locaux):

Installation des langues Paramétrage linguistique de l’ordinateur « Options Régionales et Linguistiques » « Services de texte et langue d’entrée »

Utilisation des programmes bureautique Basculement du clavier Fr   Langue Ecriture directe dans la langue souhaitée mais: Pas de correcteur orthographique Attention au problème de tri alphabétique

Utilisation des programmes localisés différemment Localisation = problème d’utilisation des logiciels étrangers!

Codage des caractères répertoire de caractères Un répertoire de caractères est un ensemble convenu, fini et non-ordonné de caractères que l’on considère comme étant complet pour une utilisation donnée

Codage des caractères jeux de caractères codés Un jeu de caractères codés est une application établissant une relation entre les éléments d’un répertoire de caractères et un ensemble d’entiers positifs : on assigne donc ainsi à chaque élément du répertoire un code numérique unique, sa position de codage (code numérique, élément de code, code, code point). Ex: a = U + 0061 LATIN SMALL LETTER A

formes d’encodage (Character Encoding Form – CEF) Codage des caractères formes d’encodage (Character Encoding Form – CEF) Représenter les caractères d’un jeu de caractères codés en transformant leur code numérique en une séquence d’octets. Dans le cas le plus simple, chaque caractère, par référence à une table de caractères, est mis en relation avec un entier compris entre 0 et 255 et cet entier est utilisé tel quel en représentation binaire sur un format d’un octet. Possible si répertoire restreint, comportant au maximum 256 éléments.

formes d’encodage pour Internet Codage des caractères formes d’encodage pour Internet Cas des navigateurs internet : choisir un jeu de caractères, un code caractères ou une forme d’encodage est présentée comme la possibilité de choisir une langue.

Codage des caractères caractères glyphes police (fonte) Le terme « caractère » désigne une notion abstraite : c’est une unité d’information qui permet d’organiser, de contrôler ou de représenter des données textuelles. Le caractère <lettre b minuscule> (pas de signification) b b b glyphes forme abstraite représentant une ou plusieurs formes (typo)graphiques    synonyme d’image (typo)graphique police (fonte) collection de glyphes utilisée pour décrire visuellement des données caractères. Elle est associée à un ensemble de paramètres : taille, position, graisse…

Police de caractères police (fonte) collection de glyphes utilisée pour décrire visuellement des données caractères. Elle est associée à un ensemble de paramètres : taille, position, graisse … Les fontes Windows sont stockées dans le répertoire Windows / Fonts

Police de caractères police (fonte) PostScript True Type Open Type Système True Type Open Type PostScript (Adobe, pour l’impression)

Codage des caractères ASCII =128 caractères 0 à 9 , latin : A –Z a-z , signes de ponctuation. ASCII étendu = 256 caractères

Codage des caractères ANSI (pour Windows occidental) 0 à 9, latin : A-Z a-z , signes de ponctuation, + caractères accentués, À Á Â Ã Å Æ Ç È É ….

Codage des caractères ANSI (pour Windows cyrillique) 0 à 9, latin : A-Z a-z , signes de ponctuation, + à la place des caractères accentués latin se trouve les caractères de la langue voulue

Codage des caractères Unicode (avec Windows 2000, Xp, Vista) codage non-ambigu sur 16 bits (v 3.2), sur 20 bits depuis la version 4, qui n’a pas besoin de séquences de contrôle. Il permet l’échange, le traitement et la visualisation des caractères utilisés par la plupart des langues vivantes: scripts latin (occidental, Europe centrale,scandinave, turc,viêtnamien), grec, cyrillique, arménien, géorgien, hébreu, arabe, devanagari, bengali, gurmukhi, gujarati, oriya, tamoul, télougou, kannada, malaysien, siamois, lao, tibétain, kana, hangul, CJK (ensemble unifié des caractères idéographiques chinois, japonais, coréens).

Codage Unicode

Problèmes liés aux codages des caractères codage codage source visualisation apparence du texte solution KOИ 7 - ASCII q GOVOR@ PO RUSSKI transcodeur DOS 866 - Win 1252 DOS 866 - Win 1251 ƒ®¢®à¨«¨, çâ® ­ ­ ¡¥ Ÿ £®¢®àî ¯®-àãá᪨ cyrillisateur DOS police 8 bits transcodeur Win 1251 - Win1252 Win 1251 - Unicode ß ãîâîðþ ïî-ðóññêè ß ãîâîðþ ïî-ðóññêè police cyrillique 8 bits transcodeurs + police 16 bits (Arial) KOI 8 - Win 1252 KOИ 8 - Win 1251 ñ ÇÏ×ÏÒÀ ÐÏ-ÒÕÓÓËÉ с ЗПЧПТА РП-ТХУУЛЙ police KOI 8 et/ou transcodeur Мас Cyrillic - Win 1251 Мас Cyrillic - Win 1252 џ говорю по-русски Ÿ ãîâîðþ ïî-ðóññêè transcodeur transcodeur+ police Chiwriter - ASCII / ANSI W sjdjh : gj-heccrb macro complexe ou police spécifique Unicode - ANSI ? ? ? ? ? ? ? ? ?- ? ? ? ? ? ? texte définitivement perdu Unicode - ANSI _ _____ __-______ système russe, sinon fichier inutilisable Unicode - ANSI Я говорю по-русски police 8 bits UNICODE - source text Я говорю по-русскРInternet explorer UNICODE - text HTML Word &#1071 ; &#1075 ;&#1086 ; &#1074 ;&#1086 ;&#1088 ;;с&#1080 ; Internet Explorer ou macro Word

Problèmes liés aux codages des caractères

Problèmes liés aux codages des caractères

Codages des caractères: écritures du monde

Ecritures du monde

Ecritures du monde

Ecritures du monde

Récapitulatif des codages des caractères