La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Extensible Markup Language

Présentations similaires


Présentation au sujet: "Extensible Markup Language"— Transcription de la présentation:

1 Extensible Markup Language
XML Extensible Markup Language

2 Why do we need XML? XML Introduction to XML Skill Level: Introductory
Doug Tidwell XML Evangelist IBM 07 Aug 2002 SGML as an ISO Standard XML HTML Standard Generalized Markup Language (langage normalisé de balisage généralisé - SGML) est un langage de description à balises, de norme ISO (ISO 8879:1986). 1986 1993 1996

3 Why do we need XML? << "HTML is the most successful markup language of all time. <p> <b>Mrs. Mary McGoon</b> <br/> 1401 Main Street Anytown, NC 34829 </p> The trouble with HTML is that it was designed with humans in mind. … The tags don't tell the browser what the information is. You and I know it's an address, but a machine doesn't. ">>

4 XML voué à la simplicité des échanges est aujourd'hui une galaxie.

5 <XML> Document and Publishing Focus
Data Integration / e-Business Focus <XML>

6 <XML> XQuery SOAP XSLT SVG EXI XSL-FO RelaxNG DTDs Schemas
Document and Publishing Focus Data Integration / e-Business Focus SOAP XQuery SOA and Web Services XSLT Application Integration SVG EXI Flexible Data Interchange XSL-FO RelaxNG DTDs Schemas <XML>

7 training

8 W3C

9 XML et la diversité d'utilisation et fonctionnement
XML Tutorials XML Tutorial DTD Tutorial XML DOM Tutorial XSL Tutorial XSLT Tutorial XSL-FO Tutorial XPath Tutorial XQuery Tutorial XLink Tutorial XPointer Tutorial Schema Tutorial XForms Tutorial SOAP Tutorial WSDL Tutorial RDF Tutorial RSS Tutorial WAP Tutorial Web Services Tutorial

10 XML et la diversité d'utilisation et fonctionnement
XML voué à la simplicité des échanges est aujourd'hui une galaxie. XML Schema pour définir les structures et les types de données XSLT pour transformer des données XML SOAP XML pour échanger des données entre les applications WSDL pour décrire les services Web RDF pour décrire des ressources Web XPath et XQuery pour accéder à des données XML SMIL pour des graphiques

11 Plan XML Balise Contenu et balisage Éléments Documents

12 Plan XML Balise Contenu et balisage Éléments Documents

13 XML Permet le stockage l'organisation et la vérification de l'information. XML est un standard W3C. XML est devenu indispensable dans le système d'information.

14 Plan XML Balise Contenu et balisage Éléments Documents

15 Balisage XML est un ensemble de règles permettant la création de langages de balisage. un langage de balisage est un ensemble de symboles placés dans le corps d'un document afin d'en délimiter et d'en étiqueter les différentes parties. XML n'est pas en langage en lui-même : c'est une spécification Le balisage améliore la compréhension de l'information. HTML : <i> 183 <i> XML : <taille unite="cm"> 183 </taille>

16 Plan XML Balise Contenu et balisage Éléments Documents

17 Balisage et contenu Le contenu et le balisage sont des valeurs informatives du document. Le Contenu est ce qui compte pour le lecteur mais cela doit être présenté d'une façon signifiante. Le Balisage permet au programmes de déterminer les fonctions et les limites de ces différents contenus (voir plus loin).

18 Plan XML Balise Contenu et balisage Éléments Documents

19 Les éléments Les éléments sont des morceaux qui composent un document.
Ils s'imbriquent les uns dans les autres structurant et étiquetant le contenu d'un document.

20 Plan XML Balise Contenu et balisage Éléments Documents

21 Le document Un document est en XML l'unité fondamentale de l'information. C'est un ensemble ordonné de balises et éléments Le document peut correspondre à une BD un format d'échange de données entre application (c'est une notion plus large que le document traditionnel)

22 Modèle de document Il existe deux moyens pour créer un langage dérivé de XML XML sans modèle On parle de document bien formé, si le document satisfait aux règles minimales de XML XML modèle de document Création d'une spécification qui établit les règles propres du document. La conformité des instances de document est obtenu par comparaison avec le modèle On parle de validation de document.

23 Type de document On parle de type de document (ou application XML) qui respecte les règles de XML. Il existe de nombreuses applications XML dans de nombreux domaines. XMLNews is a specification for exchanging news and other information. XML Weather Service

24 Présentation En XML, les styles et mise en forme du document sont définis dans un document appelé feuille de style. L'idée est de séparer la forme du fond

25 Traitement Tout programme qui peut lire et traiter du XML est appelé processeur XML. On parle de traitement du XML. Validateurs Navigateurs Parseurs Le parseur transforme par exemple le flux de caractères en atomes et construit une structure d'arbre en mémoire.

26 Exemple de Transformation
Un processus qui réorganise les différentes parties d'un document est appelée transformation. Les documents sont transformés à l'aide de XSLT (Extensible Style Language for transformation) il est possible de résumer extraire calculer Limites du HTML.

27 Document Prologue Contenu textuel
Les chevrons (<>) et les noms qu'ils encadrent sont appelé des balises. Elles marquent et nomment les parties du document et ajoutent des informations qui aident à en définir la structure. Le balisage et le contenu sont complémentaires. Ils forment ensemble une entité d'information dont les données sont découpées et étiquetées.

28 <!-- Prologue -->
<?xml version="1.0" encoding="ISO "?> <!-- Élément racine --> <biblio> <!-- Premier enfant --> <livre> <!-- Élément enfant titre --> <titre>Les Misérables</titre> <auteur>Victor Hugo</auteur> <nb_tomes>3</nb_tomes> </livre> <titre>L'Assomoir</titre> <auteur>Émile Zola</auteur> <livre lang="en"> <titre>David Copperfield</titre> <auteur>Charles Dickens</auteur> </biblio>

29 Prologue Contient une déclaration XML décrivant des propriétés générales du document indiquant au processeur XML qu'il a besoin d'un parseur XML pour l'interprétation du document. Une déclaration de type on spécifie la déclaration d'entité la DTD utilisée, nom de l'élément racine.

30 Exemple : Déclaration XML
<?xml nom="val" ... ?> propriété Propriété : version encoding standalone (No : indique qu'il faut charger d'autres fichiers)

31 <!-- Prologue -->
<?xml version="1.0" encoding="ISO "?> <!-- Élément racine --> <biblio> <!-- Premier enfant --> <livre> <!-- Élément enfant titre --> <titre>Les Misérables</titre> <auteur>Victor Hugo</auteur> <nb_tomes>3</nb_tomes> </livre> <titre>L'Assomoir</titre> <auteur>Émile Zola</auteur> <livre lang="en"> <titre>David Copperfield</titre> <auteur>Charles Dickens</auteur> </biblio>

32 Déclaration de type <!DOCTYPE racine SYSTEM "URI vers la DTD">
C'est une déclaration optionnelle servant à attacher une grammaire de type Document Type Definition au document XML.

33 exemple http://www.w3schools.com/dtd/default.asp
<?xml version="1.0"?> <!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]> <note> <to>Tove</to> <from>Jani</from> <heading>Reminder</heading> <body>Don't forget me this weekend</body> </note>

34 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

35 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

36 Éléments Les éléments sont les parties d'un document
<nom attribut="val" ... > contenu </nom> Les éléments vides <nom attribut="val" ... /> Les éléments sont soumis aux règles de positionnement La balise de fin doit arriver après la balise de début Les balises début et fin doivent apparaître tous deux à l'intérieur d'un même élément parent.

37 <titre> Les Misérables </titre>
<!-- Prologue --> <?xml version="1.0" encoding="ISO "?> <!-- Élément racine --> <biblio> <!-- Premier enfant --> <livre> <!-- Élément enfant titre --> <titre> Les Misérables </titre> <auteur>Victor Hugo</auteur> <nb_tomes>3</nb_tomes> </livre> <titre>L'Assomoir</titre> <auteur>Émile Zola</auteur> <livre lang="en"> <titre>David Copperfield</titre> <auteur>Charles Dickens</auteur> </biblio> Copyright (c) Gilles Chagnon

38 Éléments Nom d'un élément : suite non vide de
caractères alphanumériques tiret-souligné (underscore) signe moins point caractère deux-points (:) ce caractère possède un sens particulier Contraintes à satisfaire le premier caractère doit être alphabétique ou un tiret-souligné les trois premiers caractères ne doivent pas former une chaîne dont la représentation en lettres minuscules est "xml".

39 Éléments Corrects _tiyi Nom_société xsl:rule X.11 Incorrects
2009-catalogue XmlSpécifification nom société

40 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

41 Attributs Un élément peut avoir un nombre quelconque d'attributs
nom="valeur" attributs réservés : xml:lang xml:space xml:link xml:attribut

42 Attributs ou éléments On peut écrire avec des attributs ce que l'on écrit avec des éléments <livre lang="en"> </livre> <livre> <lang>en </lang> L'inverse n'est pas vrai Un attribut ne peut pas être repété dans un élément (sauf au travers d'élément différents)

43 Régles Choix de l'attribut, lorsque une valeur n'est pas répétée
n'évoluera pas vers une structure complexe En cas de doute choix de l'élément

44 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

45 Espace de noms : garantir l'absence de conflits
doc 2 doc1 doc 3 nom (livre) nom (auteur) on a les packages en java.

46 Choix d'un identifiant unique
L'identifiant pourrait être n'importe quel chaîne de caractère. L'identifiant est généralement une URL L'URL ne signifie pas qu'il doit y avoir un document sur le serveur.

47 Choix d'un identifiant unique
<h:table xmlns:h=" <f:table xmlns:f="

48 exemple xmlns:xlink="http://www.w3.org/1999/xlink"
xmlns:xsl="

49 Exemple <?xml version="1.0" encoding="utf-8"?>
<library xmlns=" > <book id="b "> <title>Being a Dog Is a Full-Time Job</title> <authors> <person id="CMS"> <name>Charles M Schulz</name> </person> </authors> </book> </library>

50 remarque l'espace de nom est invisible : Mozilla

51 l'espace de nom est visible

52 Equivalence des écritures
<?xml version="1.0"?> <lib:library xmlns:lib=" <lib:book id="b "> <lib:title> Being a Dog Is a Full-Time Job </lib:title> <lib:authors> <lib:person id="CMS"> <lib:name> Charles M Schulz </lib:name> </lib:person> </lib:authors> </lib:book> </lib:library> <?xml version="1.0" encoding="utf-8"?> <library xmlns=" > <book id="b "> <title>Being a Dog Is a Full-Time Job</title> <authors> <person id="CMS"> <name>Charles M Schulz</name> </person> </authors> </book> </library>

53 Espace de noms par défaut
<library xmlns=" > <book id="b "> </book> </library> L'espace de noms est définie comme l'espace de noms par défaut. L'espace de noms s'applique à tous les éléments du document.

54 Et encore ! <?xml version="1.0"?>
<l:library xmlns:l=" <l:book id="b " xmlns:lib=" <l:title> Being a Dog Is a Full-Time Job </l:title> <lib:authors> <l:person id="CMS" xmlns=" <name> Charles M Schulz </name> </l:person> </lib:authors> </l:book> </l:library>

55 coexistence des espaces de noms
<?xml version="1.0"?> <!-- Namespace: --> <library xmlns=" xmlns:mkt=" <book id="b "> <title> Being a Dog Is a Full-Time Job </title> <authors> <person id="CMS"> <name> Charles M Schulz </name> </person> </authors> <mkt:cover> Paperback </mkt:cover> <mkt:pages> 128 </mkt:pages> </book> </library> XML sert de glue entre applications, et les espaces de noms ont été créés pour faire cohabiter différents vocabulaires. En ajoutant des nouveau espaces de noms "mkt=marketing" le reste de l'application est inchangée.

56 Balisages élément attribut espace de noms entités Entités
Entité de caractère Entités de contenu mixte Entité non parsée commentaires les instructions de traitements sections CDATA

57 Une entité Son rôle remplacement de caractère
marquage de position pour inclure un fichier joue le rôle de variable de remplacement dans le document Une entité générale est une réserve de contenu qui apparaît au niveau de la racine où à n'importe quel niveau à l'intérieur de celui-ci. Losque le parseur rencontre des appels d'entités, il recherche dans une table en mémoire le marqueur pour le remplacer dans le document.

58 Entité de caractère Pour éviter des conflits avec les délimiteurs de balisage & & apos ' gt > lt < quot "

59 Unité de caractère Numérique
Unicode caractères, symboles. Impossibilités d'utiliser le clavier, remplacé par un code de saisie numérique

60 Entités de contenu mixte
Entité interne <!ENTITY nom "<name>nom</name>"> Entité externe <!ENTITY chap1 SYSTEM "chap1.xml"> Identifiant système est une URL, qui permet d'inclure n'importe quel fichier

61 Entité non parsée L'analyse syntaxique doit restreindre son analyse à des documents comme les images, graphique. <!ENTITY img SUSTEM "Photo.gif" NDATA GIF> Exemple d'identifiant de notation

62 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

63 Commentaires <!-- texte -->

64 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

65 Instructions de traitements
joue le rôle de conteneur pour des données destinées à un processeur XML spécifique <? nom données ?>

66 Balisages élément attribut espace de noms entités commentaires
les instructions de traitements sections CDATA

67 Sections CDATA CDATA : caractères data : signifie pas de balise
Indique au parseur que les caractères de balisage doivent être traités comme des caractères normaux.

68 Documents bien formés Les documents bien formés répondent à un ensemble de règles de bases : les délimiteurs de balise doivent être corrects une balise de fin suit une balise début les éléments ne se chevauchent pas si un document répond à ces règles, il est bien formé.

69 Plan XML Balise Contenu et balisage Éléments Documents

70

71 EOF

72 Format de fichier Le standard et ses extensions proposent :
support de très nombreux encodages (Unicode, ISO Latin, etc.) international inclusion et macro (très élémentaires) contraintes de structure : Document Type Definition (DTD), Schéma méta organisation : namespace liens évolués : XPointer et Xlink stockage : bases de données XML (langage de requêtes XQuery) compression spécialisée calcul de différences (gestion de version)

73 Programmation Le standard et ses extensions proposent :
analyse syntaxique : modèle objet : Document Object Model (DOM) modèle évènementiel : Simple API for Xml (SAX) sérialisation validation (en général intégrée à l’analyseur) : DTD schéma moteur de transformation (d’un document XML en un autre) : XSLT expressions rationnelles XML : XPath Outils Open Source par le groupe apache : Xerces : analyse syntaxique et validation Xalan : transformation et expressions rationnelles (voir aussi Saxon,

74 Outils et normes utiles :
base de connaissances : Ressource Description Framework (RDF) transformation vers HTML et WML : XSLT impression de qualité : XSL :FO dessin vectoriel : Scalable Vector Graphics (SVG) animation : SMIL mathématiques : MathML RPC en XML : xmlrpc et SOAP Outils Open Source par le groupe apache : FOP : support de XSL :FO Batik : support de SVG


Télécharger ppt "Extensible Markup Language"

Présentations similaires


Annonces Google