Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parOdile Le floch Modifié depuis plus de 10 années
1
1 Cours 5 Introduction aux schémas XML Éric Laporte Institut Gaspard-Monge Université Paris-Est Marne-la-Vallée
2
2 Sommaire Grammaires pour les documents XML4 Schéma pour une collection d'entrées8 Validateurs17 Attributs18 Types simples25 Référence à un schéma41 Inclure des éléments spécifiés dans d'autres schémas45 Schémas pour documents sans espaces de noms56 Documents à structure complexe61
3
3 Des grammaires en XML Une DTD Un schéma XML DTD ou schéma XML ? Un premier schéma (1/4) Un premier schéma (2/4) Un premier schéma (3/4) Un premier schéma (4/4) Espaces de noms (1/2) Espaces de noms (2/2) Déclaration et référence Types (1/2) Types (2/2) Validateurs Déclarer un attribut (1/3) Déclarer un attribut (2/3) Déclarer un attribut (3/3) Attribut sur un type simple (1/4) Attribut sur un type simple (2/4) Attribut sur un type simple (3/4) Attribut sur un type simple (4/4) Types simples Types simples prédéfinis (1/5) Types simples prédéfinis (2/5) Types simples prédéfinis (3/5) Types simples prédéfinis (4/5) Types simples prédéfinis (5/5) Liste balisée Types simples dérivés : restriction Restriction par Restriction par énumération Restriction par Autres restrictions de types simples 37.Types simples dérivés : liste 38.Types simples dérivés : union (1/) 39.Types simples dérivés : union (2/) 40.Dérivations de types 41.Référence à un schéma XML (1/2) 42.Référence à un schéma XML (2/2) 43.Référence à plusieurs schémas XML 44.Annoter un schéma 45.Inclure des éléments spécifiés dans d'autres schémas 46.Solution avec s:import (1/2) 47.Solution avec s:import (2/2) 48.Solution avec s:any (1/2) 49.Solution avec s:any (2/2) 50.Variantes 51. 52.Schémas partiels (1/2) 53.Schémas partiels (2/2) 54.Inclure des noeuds texte (1/2) 55.Inclure des noeuds texte (2/2) 56.Schéma d'un document cible sans espace de noms (1/2) 57.Schéma d'un document cible sans espace de noms (2/2) 58.Document cible partiel (1/2) 59.Document cible partiel (2/2) 60.Schéma pour plusieurs types de documents 61.Types complexes (1/3) 62.Types complexes (2/3) 63.Types complexes (3/3) 64. 65. (1/6) 66. (2/6) 67. (3/6) 68. (4/6) 69. (5/6) 70. (6/6)
4
4 Des grammaires en XML Chaque type de document XML a sa syntaxe XHTML, XSLFO, XSLT, CML... et on peut en définir de nouveaux Grammaire Définit la syntaxe d'un type de document Exemple : DTD Grammaire en XML : schéma XML Un document est valide par rapport à une grammaire s'il respecte les contraintes en plus d'être bien formé
5
5 Une DTD <!ATTLIST resume filmref ID #REQUIRED realisateur CDATA #REQUIRED img CDATA #IMPLIED pdf CDATA #IMPLIED> (...)
6
6 Un schéma XML (...)
7
7 DTD ou schéma XML ? DTD Format très utilisé Relativement lisible Grammaire en SGML (ancien concurrent de XML) Compatible avec XML Schéma XML Grammaire en XML Permet d'engendrer du code Java Version simplifiée : Relax NG Possibilités de contrôle strict (ex. : entier entre 1 et 10)
8
8 Un premier schéma (1/4) Une collection d'entrées avec des champs simples 37 American Beauty - Theme Air american beauty soundtrack MPEG audio file 3948579 197407 2004-07-19T15:24:23Z 2004-07-20T14:09:55Z 160 44100
9
9 Un premier schéma (2/4) Schéma correspondant <s:schema xmlns:s="http://www.w3.org/2001/XMLSchema" targetNamespace="http://igm.univ-mlv.fr/~laporte/audio" xmlns:aud="http://igm.univ-mlv.fr/~laporte/audio">
10
10 Un premier schéma (3/4) (...)
11
11 Un premier schéma (4/4) (...) (...)
12
12 Espaces de noms (1/2) - du schéma XML déclaré ici avec le préfixe s - du document XML cible : c'est l'espace de noms des éléments du document cible décrits par le schéma On l'appelle l'espace de noms cible du schéma XML On le déclarer dans le schéma XML deux fois : avec targetNameSpace et avec xmlns et un préfixe <s:schema xmlns:s="http://www.w3.org/2001/XMLSchema" targetNamespace="http://igm.univ-mlv.fr/~laporte/audio" xmlns:aud="http://igm.univ-mlv.fr/~laporte/audio">
13
13 Espaces de noms (2/2) Les éléments déclarés par fils de appartiennent automatiquement à l'espace de noms cible : pas de préfixe dans la déclaration En cas de référence à une déclaration, utiliser le préfixe Il faut donc déclarer l'espace de noms cible avec un préfixe <s:schema xmlns:s="http://www.w3.org/2001/XMLSchema" targetNamespace="http://igm.univ-mlv.fr/~laporte/audio" xmlns:aud="http://igm.univ-mlv.fr/~laporte/audio">
14
14 Déclaration et référence On peut faire référence à un nom d'élément avant de le déclarer
15
15 Types (1/2) Décrivent les contenus possibles d'un élément ou d'un attribut séquence d'éléments dans un ordre fixe Par défaut, minOccurs et maxOccurs valent 1 <s:element minOccurs="0" maxOccurs="unbounded" ref="aud:Track"/>
16
16 Types (2/2) type="s:integer" un noeud texte contenant un entier type="s:string" un noeud texte quelconque type="s:dateTime" date et heure au format ISO (...) 37 American Beauty - Theme (...) 2004-07-19T15:24:23Z
17
17 Validateurs Validateur du W3C http://www.w3.org/2001/03/webdata/xsv Si l'élément racine du document cible ne correspond à aucune déclaration globale (fille de s:schema), le validateur ne vérifie pas la syntaxe et produit le message : No declaration for document root found, validation was lax Exemple : le nom de l'élément racine correspond, mais pas l'espace de noms Autres validateurs Pas toujours aussi fiables que celui du W3C Altova : message moins trompeur The element declaration was not found for root element
18
18 Déclarer un attribut (1/3) On veut que l'élément Track puisse avoir un attribut (sans espace de noms) 37 American Beauty - Theme Air american beauty soundtrack MPEG audio file 3948579 197407
19
19 Déclarer un attribut (2/3) Le nom est déclaré sans préfixe Déclaration locale Les attributs doivent être déclarés après le contenu (...)
20
20 Déclarer un attribut (3/3) type="s:boolean"true, false, 1, 0 Pour que l'attribut soit obligatoire Par défaut, use="optional" Pour imposer une valeur Si l'attribut est présent, sa valeur doit être "euro" Même possibilité pour les éléments :
21
21 Attribut sur un type simple (1/4) Bloodroot Sanguinaria canadensis 4 Mostly Shady 2.44 031599 Columbine
22
22 Attribut sur un type simple (2/4)
23
23 Attribut sur un type simple (3/4)
24
24 Attribut sur un type simple (4/4) type="s:decimal" un noeud texte contenant un nombre en notation décimale (avec point : 2.44) : décrit les valeurs du noeud texte sous l'élément PRICE
25
25 Types simples Pour les noeuds qui contiennent du texte sans balises - un noeud de type texte - une valeur d'attribut type="s:string" un noeud texte quelconque American Beauty - Theme
26
26 Types simples prédéfinis (1/5) type="s:boolean" true, false, 1, 0 type="s:integer" 0, 15, -4, +15 type="s:decimal" 2.44, 15, -2.4, +3.1416 type="s:float" 6.02214199E23 Autres types numériques : double, long, short, int, byte... type="s:dateTime" 2004-07-19T11:34:46Z type="s:date" 2004-07-19 type="s:time" 11:34:46Z type="s:gYear" 2008(dans le calendrier grégorien) type="s:gMonthDay" --09-26 (tous les 26 septembre)
27
27 Types simples prédéfinis (2/5) Normalisation Les validateurs comparent la valeur trouvée dans le document avec la valeur imposée par le schéma Les validateurs normalisent certains types avant comparaison Exemple : s:token <s:attribute name="Kind" type="s:token" fixed="MPEG audio file"/> Le document est valide
28
28 Types simples prédéfinis (3/5) Normalisation type="s:string" pas de normalisation type="s:token" normalisation : remplacer toute suite de caractères blancs par 1 espace, et supprimer les espaces au début et à la fin type="s:boolean" true = 1, false = 0 type="s:integer" 15 = +15 type="s:decimal" 2.44 = +02.40
29
29 Types simples prédéfinis (4/5) Autres types texte normalisés type="s:NMTOKEN"Lettres, chiffres, [-_.:], mais pas d'espaces blancs type="s:Name"Même chose mais commence par une lettre ou [_:] type="s:QName"Comme Name avec au plus un [:] type="s:NCName"Comme Name mais sans [:] type="s:ID"Comme NCName mais unique dans le document Le validateur supprime les espaces au début et à la fin avant de comparer
30
30 Types simples prédéfinis (5/5) Types listes prédéfinis : NMTOKENS... Les chaînes de caractères sont séparées par des espaces Eschscholzia Papaver Sanguinaria Les types listes prédéfinis font concurrence à des listes balisées
31
31 Liste balisée Eschscholzia Papaver Sanguinaria
32
32 Types simples dérivés : restriction 2.44 031599 Restriction : le type dérivé est inclus dans le type de base
33
33 Restriction par Caractères spéciaux \ |. - ^ ? * + { } ( ) [ ] Classes de caractères Unicode \p{L} lettres\P{L} tout sauf les lettres \p{Lu} lettres majuscules\P{Lu} \p{IsBasicLatin} alphabet latin de base Ces codes sont utilisables à l'intérieur des [ ] Classes de caractères Perl \s espace, tabulation, fin de ligne\S autres car. \d chiffres de tous les alphabets\D autres car.
34
34 Restriction par énumération 38 All I Need Air Moon Safari Pop (...)
35
35 Restriction par Spécifie le traitement des caractères blancs à effectuer pour normaliser avant comparaison chaque caractère blanc est remplacé par un espace pas de traitement avant validation comme la normalisation en XSLT
36
36 Autres restrictions de types simples minExclusive maxExclusive length maxLength minLength totalDigits (évalué sur la valeur logique)...
37
37 Types simples dérivés : liste Eschscholzia Papaver Sanguinaria Les chaînes de caractères sont séparées par des espaces
38
38 Types simples dérivés : union (1/) Les éléments ZONE dans le catalogue de plantes contiennent des chaînes de types divers Annual (...) 4 (...) 3 - 5
39
39 Types simples dérivés : union (2/) La seule façon d'inclure un type simple prédéfini dans une union est d'utiliser et
40
40 Dérivations de types extension (attributs) restriction, liste, union s:simpleType s:complexType s:simpleContent
41
41 Référence à un schéma XML (1/2) Les applications qui traitent le document cible doivent pouvoir le valider par rapport à un schéma Exemple : le validateur du W3C <Tracks xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://igm.univ-mlv.fr/~laporte/audio http://igm.univ-mlv.fr/~laporte/xml/schema/collectionGenres.xsd" xmlns="http://igm.univ-mlv.fr/~laporte/audio"> 37 American Beauty - Theme Air american beauty soundtrack MPEG audio file 3948579
42
42 Référence à un schéma XML (2/2) L'espace de noms xsi spécifie des attributs utilisables dans les documents cibles La référence au schéma se fait par une valeur d'attribut qui contient d'abord l'espace de noms cible, puis l'URL du schéma séparée par un espace <Tracks xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://igm.univ-mlv.fr/~laporte/audio http://igm.univ-mlv.fr/~laporte/xml/schema/collectionGenres.xsd" xmlns="http://igm.univ-mlv.fr/~laporte/audio">
43
43 Référence à plusieurs schémas XML On peut faire référence à n schémas indépendants La valeur d'attribut contient 2n chaînes séparées par des espaces Le document cible doit être valide par rapport à chaque schéma indépendamment xsi:schemaLocation="espace-de-noms-1 URL-1.xsd espace-de-noms-2 URL-2.xsd" xmlns="espace-de-noms-1" xmlns:en2="espace-de-noms-2">
44
44 Annoter un schéma Inclure un commentaire structuré <s:schema xmlns:s="http://www.w3.org/2001/XMLSchema" targetNamespace="http://igm.univ-mlv.fr/~laporte/audio" xmlns:aud="http://igm.univ-mlv.fr/~laporte/audio"> pistes.xsd Schema XML pour liste de pistes audio
45
45 Inclure des éléments spécifiés dans d'autres schémas Insérer des parties en XHTML dans le catalogue de plantes Anemone... 122698 <xh:img src="http://.../images/chargimages/121.jpg" alt="Anemone blanda"/> Bulbe rustique de la famille des renonculacées FEUILLAGE : Feuilles très lobées vert foncé semi érigées Le document a deux espaces de noms et deux schémas
46
46 Solution avec s:import (1/2) L'espace de noms principal du document est celui de l'élément racine Le schéma principal est le schéma correspondant Il importe les autres schémas <s:schema xmlns:s="http://www.w3.org/2001/XMLSchema" targetNamespace="http://igm.univ-mlv.fr/~laporte/jardinerie" xmlns:jr="http://igm.univ-mlv.fr/~laporte/jardinerie" xmlns:xh="http://www.w3.org/1999/xhtml"> <s:import namespace="http://www.w3.org/1999/xhtml" schemaLocation="http://www.w3.org/2002/08/xhtml/xhtml1-strict.xsd"/>
47
47 Solution avec s:import (2/2) (...) Déclarer des préfixes pour les espaces de noms Exception : l'espace de noms xml, inutile de le déclarer
48
48 Solution avec s:any (1/2) Le document cible fait référence aux deux schémas Celui qui correspond à l'élément racine et à son espace de noms s'applique en premier <CATALOG xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://igm.univ-mlv.fr/~laporte/jardinerie http://igm.univ-mlv.fr/~laporte/xml/schema/plusieursEN-any.xsd http://www.w3.org/1999/xhtml http://www.w3.org/2002/08/xhtml/xhtml1-strict.xsd" xmlns="http://igm.univ-mlv.fr/~laporte/jardinerie" xmlns:xh="http://www.w3.org/1999/xhtml">
49
49 Solution avec s:any (2/2) Le schéma qui s'applique en premier appelle l'autre par s:any s:any ne spécifie pas quel élément peut apparaître (...) <s:any namespace="http://www.w3.org/1999/xhtml" minOccurs="0"/>
50
50 Variantes Le validateur accepte tout espace de noms autre que l'espace de noms cible, et valide par rapport au schéma correspondant ou Le validateur accepte n'importe quel espace de noms (défaut) <s:any namespace="http://www.w3.org/1999/xhtml" process-contents="lax"/> Le validateur valide seulement si le schéma correspondant à l'espace de noms est disponible Le validateur saute cette partie
51
51 Permettre n'importe quels attributs (...)
52
52 Schémas partiels (1/2) Laisser des parties non spécifiées Anemone... 122698 <xh:img src="http://.../images/chargimages/121.jpg" alt="Anemone blanda"/> Bulbe rustique de la famille des renonculacées FEUILLAGE : Feuilles très lobées vert foncé semi érigées
53
53 Schémas partiels (2/2) Déclarer un élément sans type Le validateur saute le contenu de cet élément (...) (...)
54
54 Inclure des noeuds texte (1/2) Les plantes contiennent du texte de présentation non structuré Anemone Anemone blanda 6 Mostly Shady 8.86 122698 Bulbe rustique de la famille des renonculacées. FEUILLAGE : Feuilles très lobées vert foncé semi érigées HAUTEUR : 10 cm FLORAISON : Solitaire, dressée, en coupe aplatie au printemps SOL : Ordinaire bien drainé
55
55 Inclure des noeuds texte (2/2) Les plantes contiennent du texte de présentation non structuré (...) Inconvénients : ces noeuds texte peuvent apparaître n'importe où et on ne peut pas contrôler le contenu par des types simples
56
56 Schéma d'un document cible sans espace de noms (1/2) L'élément racine du document cible n'a pas d'espace de noms Le schéma ne peut valider que des documents sans espace de noms ("schéma caméléon") Ce n'est pas une bonne pratique
57
57 Schéma d'un document cible sans espace de noms (2/2) Le document cible peut faire référence au schéma <Tracks xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation= "http://igm.univ-mlv.fr/~laporte/xml/schema/collection-chameleon.xsd">
58
58 Document cible partiel (1/2) On peut valider un document contenant seulement un sous-arbre des documents cibles habituels Il suffit que l'élément racine ait été déclaré en global <Track xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://igm.univ-mlv.fr/~laporte/audio http://igm.univ-mlv.fr/~laporte/xml/schema/collectionGenres.xsd" xmlns="http://igm.univ-mlv.fr/~laporte/audio"> 37 American Beauty - Theme Air american beauty soundtrack
59
59 Document cible partiel (2/2) L'élément Track a été déclaré en global <s:schema xmlns:s="http://www.w3.org/2001/XMLSchema" targetNamespace="http://igm.univ-mlv.fr/~laporte/audio" xmlns:aud="http://igm.univ-mlv.fr/~laporte/audio"> (...)
60
60 Schéma pour plusieurs types de documents Un schéma unique pour plusieurs types de documents (...)
61
61 Types complexes (1/3) s:complexType et s:sequence permettent de spécifier des documents plus complexes que des collections d'entrées <iTunes xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://igm.univ-mlv.fr/~laporte/audio http://igm.univ-mlv.fr/~laporte/xml/schema/audio.xsd" xmlns="http://igm.univ-mlv.fr/~laporte/audio"> 1 4.6 file://localhost/C:/My%20Music/ B2BF2C09D305D49C 37 American Beauty - Theme
62
62 Types complexes (2/3) s:complexType et s:sequence peuvent être utilisés récursivement (...) (...)
63
63 Types complexes (3/3) s:sequence représente la concaténation dans un ordre fixe s:attribute ajoute un attribut Autres constructeurs de types complexes s:choiceun seul élément pris parmi plusieurs s:allchaque élément une seule fois, dans n'importe quel ordre
64
64
65
65 (1/6)
66
66 (2/6) Restrictions syntaxiques pas de récursivité possible ne peut contenir que des ne peut pas apparaître dans un,, Exemple : on veut que les champs ZONE et LIGHT puissent apparaître dans n'importe quel ordre
67
67 (3/6)
68
68 (4/6)
69
69 (5/6) Si on veut que ZONE, LIGHT et PRICE apparaissent dans n'importe quel ordre, ne marche pas - Choix entre 6 séquences de 3 éléments Illisible ! - Trop difficile pour le validateur Message d'erreur du validateur : non-deterministic content model Contrainte sur l'écriture des schémas XML : lors de l'analyse syntaxique d'un document cible, la correspondance avec le schéma doit pouvoir se faire de façon déterministe sans connaître les éléments qui suivent celui en train d'être analysé
70
70 (6/6) Solution : modifier la conception des documents cibles Exemple : insérer un élément conteneur Bloodroot Sanguinaria canadensis 4 Mostly Shady 2.44 031599
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.