Amalia Todirascu 1.  Enseignants: Amalia Todirascu groupe  Contrôle de connaissances: examen.

Slides:



Advertisements
Présentations similaires
Données structurées et XML
Advertisements

DTD Sylvain Salvati
Vocabulaire pour la passage du modèle conceptuel des données au modèle relationnel des données. MCDMRD EntitéTable PropriétésChamps, attribut IdentifiantClé
Données structurées et XML
XHTML EXtensible HyperText Markup Language. HTML et XML HTML (HyperText Markup Language) et XML (eXtensible Markup Language) sont deux spécifications.
Domaines nominaux XSLT
Nicolas Singer Maître de conférence, université Champollion
Tutoriel XML – Première Partie F. Sajous & L. Tanguy ERSS – Sémantique et Corpus.
NSY107 - Intégration des systèmes client-serveur
Web traditionnel
XML eXtensible Markup Language
XMLXML Ing. Rodrigue Osirus UP - FACULTÉ DES SCIENCES INFORMATIQUES Ing. Rodrigue Osirus UP - FACULTÉ DES SCIENCES INFORMATIQUES Introduction à la technologie.
COME Bernard Comeau Commerce électronique Les éléments retrouvés dans une page Web. COME 2001.
Introduction à la structuration des documents: les techniques M2: Gestion des connaissances.
XML: Syntaxe XML, DTD et Schémas
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Xpath XML Path language par Yves Bekkers
Rappel (très) succint d’éléments techniques (XML, DTD, XSL, PHP)
STAF 2X XSL/FO Glaus & Ruckstuhl Mars © Glaus & Ruckstuhl TECFA Programme du 18 et 19 mars Revision XML Introduction à XSL/FO (intérêts et.
HTML-CSS-XHTML.
Les feuilles de style CSS
8 - XML Cours XML.
1 Programmation Web II 2 ème année Licence Appliquée IAG Faculté des Sciences Economiques et de Gestion de Nableul Université 7 novembre à Carthage Années.
Le langage XHTML 420-S4W-GG Programmation Web Client
Le langage du Web CSS et HTML
XML-schema. Pourquoi XML-schema Les DTD : Pas de typage, peu de contraintes sur les contenus nombre d'apparitions d'un élément à choisir entre 0 et 1.
LANGAGE HTML Le HTML (Hyper Text Markup Langage) est un langage universel utilisé sur le World Wide Web. Le HTML permet de : * Publier des documents sur.
LE HTML ISN Terminale S Un peu d’histoire …
Le langage XML.
Amalia Todirascu 1.  Enseignants: Amalia Todirascu groupe  Contrôle de connaissances: examen.
Programmation Web : Introduction à XML
Programmation Web : Schémas XSD Jérôme CUTRONA 19:27:07 Programmation Web
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Bien présenter des documents longs…
XHTML les fondamentaux M.DIENG Abdoulaye DTS 1 Réseaux & Données.
MJ. Blin et M. CsernelPoleInfo31 XML et ses environnements Documents XML bien formés Prologue Arbre d'éléments Attributs Commentaires Entités internes.
IUT SRC Année 2004/2005Antonio Capobianco 1 HTML>Formater du texte>Les titres Définir les titres HTML distingue 6 niveaux de titre : Titre N°1 Titre N°2.
Introduction à XML Yves Bekkers. Plan Introduction - structurer l’information Les langages à balises - un peu d’histoire XML - concepts de base Outils.
INTERNET Le langage HTML
Soutenance du mémoire de synthèse
Module : Langage XML (21h)
Modélisation des documents: DTD et Schéma
1. Introduction 2. DTD 3. Schémas
XSD XML Schema Definition Année universitaire UP web.
Cours : HTML 1 avril 2013.
Document Type Definition (DTD) Plan 2.1Introduction 2.2Déclaration de Document Type 2.3Déclaration d’élément Type 2.3.1Séquences, Choix, indicateurs d’Occurrence.
eXtensible Markup Language. Généralités sur le XML.
L T I Laboratoire de Téléinformatique 2 Projet de semestre Parseur XML basé sur la DTD : Buts –Utiliser la grammaire définissant un type de fichiers XML.
Conception des pages Web avec
Accessibilité web Gérer l’accessibilité lors de la création d’un site ORT Lyon - 10/02/2014.
XML : un métalangage pour la description de documents structurés XML a été défini par le consortium W3 en fonction de 2 objectifs: Compenser les limitations.
D é veloppement de sites web statiques Par DRISS AIT EL HADJ Par DRISS AIT EL HADJ Avril 2012.
Language html Hyper Text Markup Language
Dreamweaver Séance 1.
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
Bloc 1 - UE 5 - Technologies de l’information et de la communication TIC Bachelier en immobilier T. SOUMAGNE.
Présentation Dreamweaver 8 (1) Nina BOUAZIZ et Matthieu DI RUSSO SI28.
DREAMWEAVER Première séance Villaron Audrey – Shibly Tarek.
Plan de la présentation Le langage HTML Dreamweaver MX Les premiers outils pour créer une page web :  Propriétés d’une page  Création de cadres  Création.
SI28 Malépart Céline Jérémy Palmier
DREAMWEAVER SEANCE 1 Axel JACQUET GM05 – Julien VAN MOORLEGHEM GM05 A2008 Écriture interactive & multimédia Présentation Dreamweaver 8.
Introduction au HTML Qu’est ce que le HTML ?
Dreamweaver CS4 séance 1 Ahmed Aryan – Isma Teir.
Le langage XML Documents bien formés Un document XML est dit bien formé lorsque le document est correct sans toutefois posséder une DTD. Le prologue du.
XML les données réellement portables La nécessité d’un format de données universel et lisible se faisait sentir depuis longtemps, aujourd’hui avec le développement.
INF2005– Programmation web– A. Obaid Variantes de HTML.
1 er séance SI28 A2004 YIN Lei Emmanuel Eugene. Plan de l’exposé  Introduction au HTML  Le HTML dans le bloc-notes (notepad)  Présentation de Dreamweaver.
Conception de site web. Place du Web dans le monde  Entreprises  Commerce électronique  Réseaux sociaux  Les municipalités  Les partis politiques.
DTD - Y. Bekkers - IFSIC1 DTD Document Type Definition Yves Bekkers Mise à jour : 31 mai 2016.
Préparé par : Marouane FELJA
Transcription de la présentation:

Amalia Todirascu 1

 Enseignants: Amalia Todirascu groupe  Contrôle de connaissances: examen sur machine (1h) 2

 Langages à balises: HTML et XML ◦ motivation ◦ balises, attributs ◦ espace de noms  Validation à l'aide d'une DTD ◦ définition d'un élement ◦ définition d'un attribut  Validation à l'aide de schémas W3C  Standards: TEI, XCES  XPath, XQuery 3

 Besoin ◦ Structurer l'information, pour faciliter l'accessibilité ◦ Présenter l'information, pour faciliter la navigation et la consultation ◦ Intégration des divers sources d'information ◦ Reutilisation des données 4

 Un langage structuré pour annoter les documents ◦ SGML (Standard Generalized Markup Language) – pour annoter les corpus  IBM  norme ISO 8879:1986  ancêtre de  HTML : présentation structurée des documents  XML: annotation du contenu du document  HTML et XML – normes définies par le World Wide Web consortium (W3C) ◦ XHTML le langage du Web 5

 Langage interprété par les navigateurs Internet  Visualisation du contenu et la navigation ◦ Mise en forme: en gras, en couleurs etc. ◦ Structuration du texte: paragraphes, tableaux, liens vers d’autres pages… 6

 Une balise permet de distinguer un document structuré d’un fichier texte  Les balises sont insérées dans le corps du document ◦ Elles permettent de contrôler le formatage et la présentation d’un document ◦ HTML: Mise en forme des paragraphes, insertion d’images, insertion de liens hypertexte, tableaux … ◦ XML: organiser les données en format structuré et leur donner une interprétation 7

 Une balise est encadrée par et peut avoir aussi une balise de fin ◦ Dan Brown Da Vinci  Les balises peuvent être imbriquées mais elles doivent être fermées dans l’ordre inverse des balises d’ouverture ◦ Dan Brown Da Vinci 8

 Une balise peut avoir trois formes ◦  passage à la ligne ◦ …  texte à mettre en gras ◦ texte   le fond de la page sera de couleur bleu clair 9

 Où trouver la définition de chaque balise et de ses attributs? ◦ Pour HTML : ◦ Pour XML: définir ses propres balises  Validation du code html ◦ 10

 Mise en forme ◦ - gras ◦ - italique ◦ - police, taille  structuration ◦ - paragraphe ◦ - lien vers un autre document ◦, - listes ◦ - tableau 11

 L’ensemble des balises est prédéfini, mais limité à celui défini par le World Wide Web consortium ◦  Seulement la mise en forme ou la structure du texte ◦ Pas de possibilité de marquer le contenu 12

 XML – Extended Markup Language  marquage de plusieurs zones de textes pour: ◦ faciliter la recherche d'information ◦ faciliter le partage des connaissances  Même principe que le langage HTML ◦ On peut définir les balises adaptées à notre propre application  Annotation morpho-syntaxique  Annotation sémantique (les noms de personnes, d’organisations, de métiers)  Bases de données  Services Web 13

 Structurer l'information ◦ Identification du contenu des données  Accessibilité ◦ divers types de présentations de données (XSL)  interopérabilité des données ◦ re-utiliser les XML dans d'autres applications ◦ possibilité de vérifier si le document est valide: DTD, XML schémas ◦ définitions partagées 14

 Outils pour l’annotation en format XML ◦ Annotea, Gate, Oxygène, XML Starlet, Notepad++  Outils pour executer des requêtes sur les balises XML ◦ Xaira, XQuery 15

 La balise – un élément qui marque un segment de texte ◦ Transparent à l'utilisateur ◦ Traitement automatique du document (indexation, recherche optimisée d'information)  Les balises HTML – pour la présentation des documents  Les balises XML – pour l'identification des éléments pertinents pour le contenu du document 16

Lagarde, Christian Libération 1, rue des Oiseaux, Paris

 Goriot payait encore douze cents francs de pension.  Sur le tapis, sur les meubles de sa chambre d'hôtel, à Brighton, s'étalaient le Times, le Daily Telegraph, le Daily News. Dix heures sonnaient à peine, et le docteur avait eu le temps de faire le tour de la ville, de visiter un hôpital, de rentrer à son hôtel et de lire dans les principaux journaux de Londres le compte rendu in extenso d'un mémoire qu'il avait présenté l'avant- veille au grand Congrès international d'Hygiène, sur un « compte-globules du sang » dont il était l'inventeur. 18

 Syntaxe: texte - la balise vide texte  Règles de syntaxe ◦ Plusieurs balises imbriquées possibles; ◦ Toujours une balise ouverte doit être fermée; ◦ Différences entre majuscules et minuscules; ◦ Valeurs d’attributs entre “”;  Les balises XML sont définies par l'utilisateur (en fonction de l'application) 19

 Un élément XML = les balises + la séquence de texte qui a été balisée  Un élément XML peut contenir d'autres éléments XML ◦ Structure hiérarchique du XML  Une balise peut contenir des attributs avec leurs valeurs ◦ Un choix de l'utilisateur de définir des sous- éléments ou des attributs 20

 vérification des règles de syntaxe ◦ pas de chevauchement ◦ les guillemets pour les valeurs des attributs ◦ une balise ouverte est toujours fermée  vérification de la cohérence des données ◦ même interprétation pour un seul élément ◦ nécessite la définition de chaque élément: DTD  validator ◦ en ligne : p p ◦ intégrés à l'outil: Oxygene 21

- - kayak kayak de mer - 22

 Elements XML ◦,,,,  Attributs: ◦ quantite, reference pour l’élément 23

 Interprétation ◦ Le document XML est constitué par un élément ◦ Un est composé par un ou plusieurs éléments ◦ Un est composé par plusieurs éléments,,, 24

 Une première ligne sur la version du XML ◦  Une deuxième ligne avec le fichier de définitions ◦ Le fichier DTD (Document Type Definition) ou le lien vers le XML schéma (optionnel)  Un élément XML racine ◦ Un élement XML  texte 25

 Définir l’encodage   Les plus utilisés : ISO , UTF-8, UTF- 16  Plusieurs solutions: ◦ Les codes du clavier ◦ Copier-coller d’autres documents ◦ les codes des caractères (Unicode) ◦ Caractères spéciaux (entités sgml)  Concerne les autres alphabets et caractères spéciaux (, espace)

 Caractères spéciaux ◦ & & ◦ < < ◦ >> ◦ "" ◦ &apos; ‘  Utilisation des codes Unicode

دايتَل 13 أند &assoc; أهلاً 23 بكم 24 فيِ 25 عالم &text; 29 30

 des règles qui decrivent la structure du document ◦  + ◦  29

 Un fichier externe qui contient les définitions des utilisateurs (éléments et entités XML)  Référence à la DTD – dans le prolog du document XML (fichier extérieur ou inclus) ◦ 30

Document Type Definition (II)  Opérateurs ◦ Nomdebalise = un élément qui doit être utilisé une seule fois ◦ Nomdebalise* = on doit avoir une séquence de 0 ou plusieurs éléments Nomdebalise ◦ Nomdebalise+ = on doit avoir une séquence de 1 ou plusieurs éléments Nomdebalise ◦ #PCDATA = texte interprétable (avec les entités)

 contenu ◦ mixte: mélange de #PCDATA et d'autres élements  (#PCDATA|el1|el2|...eln) ◦ #PCDATA : l'élément encadre seulement du texte (analysé) ◦ (el1, el2,... eln): l'élement doit contenir les éléments el1, el2,... dans cet ordre ◦ (el1|el2|...|eln): l'élement doit contenir soit l'élément el1,... eln 32

33 base article description nom couleurprixnomdescriptionprix

 définir les élements:  ◦ le contenu = une séquence de noms d'élements, de mots réservés (EMPTY, #PCDATA) et d'opérateurs (*,?,+,,,|)  ◦ attri – le nom de l'attribut ◦ typei – CDATA ou une liste de valeurs ◦ etatn: #IMPLIED, #REQUIRED, #FIXED 34

 dans la DTD ◦  dans le document ◦ Bienvenue &nom; ◦ bla bla &entity; bla blas 35

Jean a achété une Peugeot 206 bleue pour ses 32 ans DTD définie dans car.dtd: 36

<!DOCTYPE personne [ ]> Jean a achété une Peugeot 206 bleue pour ses 32 ans 37

 Définir plutôt des éléments ◦ Quand les données sont structurées ◦ Quand le texte encadré par les balisés est long ◦ Quand les données changent souvent  Définir plutôt des attributs ◦ Texte de petite taille ◦ Liste de valeurs prédefines  Visibilité – plutôt des éléments  Container- Contenu – éléments  Définir des attributs ou des élements en fonction de l'application 38

 MEXICO - Le Mexique s'est dit sur le point de maîtriser l'épidémie de grippe porcine, détectée dans vingt et un pays, mais l'Organisation mondiale de la Santé a averti lundi que le virus pourrait prendre sa revanche à l'automne. Aux Etats-Unis aussi, les autorités se sont montrées prudemment optimistes, tout en mettant en garde contre une seconde vague du virus à l'automne sous une forme plus virulente. Malgré ces nouvelles rassurantes, l'épidémie continue de se propager, avec un nouveau cas annoncé lundi au Portugal et certains pays ont renforcé les mesures de protection. L’Express, Date: lundi 4 mai

MEXICO Le Mexique s'est dit sur le point de maîtriser l'épidémie de grippe porcine, détectée dans vingt et un pays, mais l'Organisation mondiale de la Santé a averti lundi que le virus pourrait prendre sa revanche à l'automne. Aux Etats-Unis aussi, les autorités se sont montrées prudemment optimistes, tout en mettant en garde contre une seconde vague du virus à l'automne sous une forme plus virulente. Malgré ces nouvelles rassurantes, l'épidémie continue de se propager, avec un nouveau cas annoncé lundi au Portugal et certains pays ont renforcé les mesures de protection. L’Express lundi le 4 mai

Espaces de noms Pour éviter les conflits de définitions => utiliser les espaces de noms Espace de noms = vocabulaire contrôlé Définition unique d’une balise disponible dans plusieurs fichiers de données XML Pour éviter les conflits on précise dans quel espace de noms on se situe (et le fichier de définition qui nous intéresse) Espace de nom = définie par une URI (Uniform Ressource Identifier)

Espace de noms (II) - c’est l’URI qui définit le nom unique de la ressource - éviter les conflits de définitions (une balise définie dans plusieurs DTDs) <exemple xmlns:H=" xmlns:M=" 2

Espace de noms (III) XML XLink MathML XHTML SVGhttp:// Schémas Instances de schémas instance

Espace de noms (IV) Dans le fichier xml Item 1 Item 2

Espace de noms (V) Dans le fichier DTD