Introduction à la structuration des documents: les techniques M2: Gestion des connaissances.

Slides:



Advertisements
Présentations similaires
Bratec Martin ..
Advertisements

NOTIFICATION ÉLECTRONIQUE
Fragilité : une notion fragile ?
SEMINAIRE DU 10 AVRIL 2010 programmation du futur Hôtel de Ville
Phono-sémantique différentielle des monosyllabes italiens
MAGGIO 1967 BOLOGNA - CERVIA ANOMALIES DU SOMMEIL CHEZ L'HOMME
droit + pub = ? vincent gautrais professeur agrégé – avocat
Transcription de la présentation:

Introduction à la structuration des documents: les techniques M2: Gestion des connaissances

Plan Syntaxe et sémantique de la description La syntaxe: introduction à XML La sémantique: introduction au Dublin Core

Syntaxe et sémantique de la description Syntaxe: utilisation dun langage normalisé pour structurer le document (HTML, XML, CSS, etc.) Sémantique: standardisation des noms des « balises », « champs », etc.

Introduction à XML Langage et métalangage: présentation dXML Historique Avantages dXML Structure des documents XML

Langage et métalangage: présentation dXML XML = Extensible Markup Langage (Langage à balises extensibles) HTML= Hypertext Markup Langage –Il contient tous ses atomes (symboles et balises acceptés par la syntaxe)

Langage et métalangage: présentation dXML XML = « métalangage » XML permet de séparer la structuration du contenu de sa mise en forme (feuilles CSS, XSL, XSLT, etc.) Avantage: on peut modifier la présentation du document sans modifier le document même!

Langage et métalangage: présentation dXML CSS = Cascade StyleSheet (feuille de style en cascade) XSL = Extensible StyleSheet Langage (langage CSS développé spécialement pour XML) XSLT= Extensible StyleSheet Langage Transformation (permet notamment la transformation dun document XML en document HTML)

Historique XML reprend les caractéristiques principales de SGML (Standard Generalized Markup Langage) défini dès 1986 pour la GED. XML mieux adapté au web Mis au point dès 1996 par le XML Working Group sous légide du W3C (World Wide Web Consortium) Toutes les recommandations disponibles sur:

Structure dun document XML Un document XML doit respecter la syntaxe du langage. La syntaxe –règles générales (emboîtement des balises) –règles spécifiques définies dans une DTD (Définition de Type de Document)

Structure dun document XML Un document qui respecte la syntaxe XML est appelé document bien formé Un document XML qui possède une DTD et est conforme à celle-ci est appelé document valide.

Structure dun document XML Un document XML est structuré en trois parties: 1. Le prologue: permet dindiquer la version XML utilisée (indication obligatoire) ainsi que le jeu de caractères utilisé (attribut facultatif)

Structure dun document XML Le prologue peut contenir également des informations facultatives sur des instructions de traitement: 2. La DTD : elle peut être intégrée dans le document ou bien enregistrée dans un fichier indépendant.

Structure dun document XML 3. La dernière partie est larbre des éléments (le contenu effectif du document XML). -hiérarchie de balises comportant éventuellement des attributs. -Un attribut est une paire nom/clé-valeur. Il se définit toujours dans la balise ouvrante, par exemple: - Toute donnée est encapsulée dans une balise: Jean-Michel

Structure dun document XML 3. Enfin, notez que larbre ne peut avoir quune seule racine! La syntaxe ci-dessous nest pas correcte: Jean-Michel Anne-Sophie

Structure dun document XML La syntaxe ci-dessous est correcte: Jean-Michel Anne-Sophie

Structure dun document XML Quelques règles syntaxiques: -toute balise ouverte doit être fermée: Jean-Michel -une balise vide peut être fermée aussitôt: -Les balises peuvent être emboîtées: - - Jean-Michel -

Structure dun document XML Quelques règles syntaxiques: -Les balises ne peuvent pas se chevaucher: - -Jean-Michel - Autrement dit, les balises doivent être fermées dans lordre contraire de leur ouverture (la première balise ouverte sera fermée en dernier, etc.)

Structure dun document XML Quelques règles syntaxiques: -les noms des balises et des attributs doivent être des noms XML, càd: -Le premier caractère est en règle générale une lettre -Les caractères suivants peuvent être des lettres, des chiffres ou dautres symboles (-_.) -Les espaces ne sont pas autorisés à lintérieur du nom de basise -Il ny a pas de limitation a priori de longueur. Note: -sauf notation particulière, un nom de balise ne peut pas être formé uniquement de chiffres -choisissez des noms de balises simples et lisibles: prénom, numéro_téléphone, etc.

Structure dun document XML Quelques règles syntaxiques: -il est possible dinsérer des commentaires en utilisant la syntaxe: - Il est possible dutiliser entre les balises (et non pas à lintérieur des balises!) des éléments de mise en page, comme les: -Espaces -Tabulations -Retours à la ligne -Ces éléments permettent une meilleure visibilité des éléments du code:

Structure dun document XML Mon Nom Mon Premier Prénom Mon Deuxième Prénom Année de naissance

Rôle des DTD - Normaliser la description: utiliser les mêmes champs, dans le même ordre - Utile pour structurer plusieurs documents de la même manière

Rôle des DTD - La DTD peut être -interne -externe - Appel de la DTD interne : Lappel contient le mot-clé !DOCTYPE suivi du nom de lélément racine du document et du contenu de la DTD entre crochets!

Rôle des DTD - Appel de la DTD externe: Mot-clé !DOCTYPE suivi de lélément racine, suivi de la localisation du fichier contenant la DTD.

Rôle des DTD Enfin, il est également possible de compléter une DTD externe à lintérieur du document (solution nécessitant une maîtrise + poussée): …

Rôle des DTD La DTD permet de définir notamment: - des Eléments - Des Attributs - (Des Entités)

Rôle des DTD – définition des éléments Un Elément est défini de la manière suivante: - le mot-clé élément est une indication du type dobjet défini (élément et pas attribut, etc.) - Le « nom » correspond à celui de la balise que lon veut utiliser (par exemple: nom, prénom, etc.) - Le « Modèle » est soit un type de données prédéfini, soit une règle dutilisation de lélément.

Rôle des DTD – types prédéfinis - ANY – lélément peut contenir tout type de données - EMPTY – lélément ne contient pas de données spécifiques - #PCDATA – lélément doit contenir une chaîne de caractères

Rôle des DTD – règles Certains éléments peuvent contenir dautres éléments: Cette règle indique que lélément Etudiant doit contenir dans lordre un élément Nom et un élément Prénom et rien dautre!

Rôle des DTD – quantification Il est possible de préciser le nombre doccurrences dun sous-élément en utilisant des symboles de quantification: - ? = lélément doit apparaître 0 ou 1 fois - * = lélément doit apparaître 0, 1 ou plusieurs fois - +: 1 ou plusieurs fois

Rôle des DTD – quantification Cette définition signifie que lélément élève peut être défini: - par un ou plusieurs prénoms - Par 0 ou 1 numéros de téléphone - Nécessairement par un seul nom.

Rôle des DTD – alternative Signifie que lélément formation peut être défini par lun ou lautre des deux sous- éléments. Autrement dit, une formation donnée peut être OU initiale OU continue (mais pas les deux à la fois).

Rôle des DTD – combinaison Signifie que lélément Diplôme est défini par: - lannée dobtention et lintitulé du diplôme - Ou par la combinaison année, compétences acquises et éventuellement par linformation liée au stage

Exercice Nous voulons réaliser un annuaire simple écrit sous la forme dun document XML contenant le/s nom, prénom/s, adresse/s émail et éventuellement le/s numéro/s de téléphone de chaque étudiant M2. Ecrivez la DTD, puis complétez le document XML avec quelques exemples.