La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Introduction à XSLT Éric Laporte Institut Gaspard-Monge Université Paris-Est Marne-la-Vallée.

Présentations similaires


Présentation au sujet: "Introduction à XSLT Éric Laporte Institut Gaspard-Monge Université Paris-Est Marne-la-Vallée."— Transcription de la présentation:

1 Introduction à XSLT Éric Laporte Institut Gaspard-Monge Université Paris-Est Marne-la-Vallée

2 XML Extensible markup language Langage de balisage extensible Exemple d'utilisation Représenter le contenu d'une base de données, mais en clair (plus encombrant) Exemple : un catalogue de plantes

3 Contenu d'une base de données Bloodroot Sanguinaria canadensis 4 Mostly Shady Columbine

4 Objectifs des cours sur XSLT Manipuler des documents XML Les programmes XSLT sont des documents XML Entrées = obligatoirement des documents XML Sorties = souvent des documents XML Apprendre le langage XSLT Langage de transformation d'arbres Apprendre le langage Xpath Langage d'expressions XML inclus dans XSLT et autres Contrôle des connaissances : TP noté

5 Logiciels Éditeurs XML, éditeurs de code source Les documents XML sont traités comme du code source Navigateurs Les documents XML sont traités comme des pages web à visualiser (prétraitement automatique) Logiciels spécialisés Pour certains types de documents XML

6 Syntaxe XML Document "bien formé" = qui respecte la syntaxe XML Plus strict que la syntaxe HTML Logiciels traitant des documents XML : navigateurs, processeurs XSLT.... Plus ou moins stricts sur la syntaxe des documents d'entrée Élément Délimité par une balise ouvrante et une balise fermante 2.44 Ou réduit à une balise "vide" (élément vide)

7 XML bien formé : éléments (1/2) Les éléments forment un arbre : disjoints, OK : imbriqués, OK : incorrect Deux éléments sont imbriqués ou disjoints La balise fermante est obligatoire En HTML on peut omettre certaines balises fermantes Document --> arbre : analyse syntaxique Arbre --> document : sérialisation

8 XML bien formé : éléments (2/2) L'arbre doit avoir un élément racine unique Unweighted Weighted TWTA USCH EUR GRD USD Ce qu'il y a avant ou après ne doit pas être des éléments

9 XML bien formé Valeurs d'attributs entre guillemets ou entre apostrophes Déspécialiser les caractères " ou ' dans les valeurs d'attributs ""quotation mark ''apostrophe : non

10 Indentation L'indentation facilite la visualisation en arbre Bloodroot Columbine Un document XML non indenté est illisible Bloodroot Columbine L'indentation est obligatoire

11 XML : autres exemples d'utilisation Équivalent d'une base de données Exemple : catalogue de plantes Document-texte structuré Texte et informations signalétiques, structurelles, liens... Exemple : XHTML Code Langages de programmation, grammaires... Exemple : XSLT Autres CML : description de molécules et de réactions chimiques

12 Les Châtiments Buonaparte Neige … Document texte structuré

13 Les Châtiments Buonaparte Neige … section livre Buonaparte chapitre Neige chapitre section Les Châtiments titre Document et arbre

14 XHTML : visualisation sur écran Comme HTML mais bien formé et balises en minuscules Penn Tagset Penn Treebank Tagset Here are the most important tags. See also: The Penn Treebank. In Computational Linguistics, volume 19, number 2, pp

15 XSLFO : visualisation sur papier (...)

16 Code : XSLT

17 Programme XSLT produisant du XSLFO (...) Mélange de balises XSLT et XSLFO

18 Document XML appelant un programme XSLT JT …

19 XSL, XSLT, XSLFO Le projet XSL Extensible stylesheet language = Langage de feuilles de style extensible Le format XSL devait être un format de feuilles de style pour visualisation de documents, comme CSS mais en XML Le projet s'est divisé en deux : XSL transformationsLangage de transformation d'arbres XSL formatting objectsLangage de visualisation de documents

20 Code : grammaires en XML Chaque type de document XML a sa syntaxe XHTML, XSLFO, XSLT, CML... et on peut en définir de nouveaux Grammaire Définit la syntaxe d'un type de document Exemple : DTD Grammaire en XML : schéma XML Un document est valide par rapport à une grammaire s'il respecte les contraintes en plus d'être bien formé

21 Une DTD (...)

22 Un schéma XML (...)

23 DTD ou schéma XML ? DTD Grammaire en SGML (ancien concurrent de XML) Une DTD n'est pas un document XML Compatible avec XML Format très utilisé Schéma XML Grammaire en XML Permet d'engendrer du code Java Jugé compliqué Version simplifiée : Relax NG

24 Premier programme XSLT (1/4) Objectif Interroger un document équivalent à une base de données et en extraire une information Exemple : quel est le prix de la plante dont le nom est Potentilla ? Entrée : un document XML bien formé Sortie : du texte ou un fichier texte

25 Premier programme XSLT (2/4) : "règle" contenant des instructions qui sont exécutées : trouver un noeud de l'arbre et le copier sous la forme d'un texte sans les balises /CATALOG/PLANT : expression Xpath absolue qui trouve tous les noeuds correspondant aux éléments PLANT

26 Arbre du document source CATALOG PLANT ZONEBOTANICAL Sanguinaria canadensis 4 PLANT... LIGHTPRICE Mostly Shady

27 Premier programme XSLT (3/4) [BOTANICAL='Potentilla'] : "prédicat" Xpath qui sélectionne certains noeuds parmi les précédents Le prédicat est attaché à l'expression PLANT BOTANICAL : expression Xpath relative (évaluée à partir du noeud contexte du prédicat)

28 Premier programme XSLT (4/4) = : opérateur Xpath qui transforme ses deux opérandes en chaînes de caractères avant de les comparer /PRICE : expression Xpath qui s'applique seulement aux PLANT filtrés (et non aux noeuds BOTANICAL) / : ici, séparateur d'étapes dans l'expression Xpath

29 Interroger un document XML Méthode générale Faire une règle qui contient une instruction avec une expression Xpath absolue Si on écrit un prédicat, on peut utiliser des expressions Xpath relatives à l'intérieur L'expression Xpath est entre guillemets car valeur d'attribut

30 Expressions XPath absolues expressionsignification /livre/chapitre/section /*l'élément racine //sectiontous les éléments section //*tous les éléments /livre/chapitre|/livre/table (pas de mise en facteur)

31 Expressions XPath relatives Si on est dans un prédicat, évaluées par rapport au "noeud contexte" expressionsignification chapitreéléments chapitre fils du noeud *éléments fils du noeud.le noeud contexte chapitre/section|chapitre/figure (pas de mise en facteur)

32 Variante 1 : extraire un sous-arbre Remplacer value-of par copy-of copie sous la forme d'un texte sans les balises copie le sous-arbre (sérialisation) Remplacer method=text par method=xml déclare que le résultat est un fichier "plat" (sans balises) déclare que le résultat est XML

33 Résultat Cinquefoil Potentilla Annual Shade Le processeur XSLT a inséré une déclaration XML Le résultat est par défaut un document XML, ou HTML dans certaines conditions

34 Variante 2 : en deux étapes (1/2) La première règle trouve le noeud PLANT qui correspond au nom "Potentilla" La deuxième règle trouve le noeud PRICE à partir du noeud PLANT

35 Variante 2 : en deux étapes (2/2) Dans la première règle, le "noeud courant" est la racine de l'arbre Dans la deuxième règle, le noeud courant est le noeud PLANT qui correspond au nom "Potentilla" Le value-of contient une expression relative évaluée à partir du noeud courant

36 Comment ça marche ? Quand on entre dans une règle, on change de noeud courant Quand on ressort de la règle, on retrouve le noeud courant précédent (pile à l'exécution) L'appel et la règle avec la même expression absolue permettent de changer de règle

37 Noeud courant et noeud contexte Noeud contexte : à l'intérieur d'une expression Xpath Change à chaque étape de l'expression Noeud courant : à l'intérieur d'une règle - Change à chaque appel de règle - La fonction Xpath current() donne le noeud courant

38 Et si l'expression Xpath trouve plusieurs noeuds ? (1/5) Les expressions Xpath ressemblent aux expressions Unix sur les arborescences de répertoires, mais il y a une différence /livre/chapitre/section Expression Unix : donne au plus 1 répertoire Expression Xpath : peut donner plusieurs noeuds

39 Et si l'expression Xpath trouve plusieurs noeuds ? (2/5) Avec : L'expression trouve les noeuds PRICE de toutes les plantes Résultat : ajoute un espace entre deux noeuds [En XSLT 1, ne copiait que le premier des noeuds trouvés, ici le prix de la première plante]

40 Et si l'expression Xpath trouve plusieurs noeuds ? (3/5) Avec : On obtient plusieurs éléments PLANT Pour avoir un document XML bien formé, il faut créer un élément racine unique

41 Et si l'expression Xpath trouve plusieurs noeuds ? (4/5) Les balises et le texte du programme XSLT sont copiés dans le document résultat, sauf certains espaces blancs Black-Eyed Susan Rudbeckia hirta Annual Sunny

42 Et si l'expression Xpath trouve plusieurs noeuds ? (5/5) Avec : Quand l'appel trouve plusieurs noeuds, la règle est exécutée une fois pour chaque noeud : "appel par noeud" Résultat : (prix des deux plantes de la zone 5, sans espace blanc)

43 Fonctions Xpath sur chaînes de caractères (1/5) Quels sont les prix des plantes dont le nom anglais contient Phlox ? contains(COMMON,'Phlox') renvoie vrai si COMMON contient 'Phlox' contains() convertit COMMON en chaîne de caractères en supprimant les balises, comme : "valeur textuelle", et non sérialisation

44 Fonctions Xpath sur chaînes de caractères (2/5) Les prix des plantes dont le prix commence par "2." (entre 2 et 3 euros) "/CATALOG/PLANT[starts-with(PRICE,'2.')]/PRICE" Les plantes dont la disponibilité finit par "98" (disponibles en 1998) "/CATALOG/PLANT[ends-with(AVAILABILITY,'98')]" "/CATALOG/PLANT[substring(AVAILABILITY,5,2)='98']" substring (string, start, length) : les indices commencent à 1

45 Fonctions Xpath sur chaînes de caractères (3/5) Les plantes dont le nom scientifique commence par le mot Trillium suivi d'un espace "/CATALOG/PLANT[substring-before(BOTANICAL,' ')='Trillium']" Les plantes dont le prix en euros est un nombre entier "/CATALOG/PLANT[substring-after(PRICE,'.')='00']" Les plantes dont le nom anglais dépasse 20 caractères "/CATALOG/PLANT[string-length(COMMON)>20]"

46 Fonctions Xpath sur chaînes de caractères (4/5) Pour que la comparaison se fasse sur les minuscules [translate(COMMON, 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz')='anemone']" Pour concaténer plusieurs chaînes normalize-space() supprime les espaces blancs au début et à la fin et remplace toute autre séquence blanche par 1 espace

47 Fonctions XPath sur chaînes de caractères (5/5) substring(string, start, length) string(obj)conversion string-length(str) concat(str1, str2,...) normalize-space(str) translate(str, entrees, sorties) contains(str, partie) starts-with(str, prefixe) substring-after(str, partie) substring-before(str, partie)

48 On récapitule définit une règle copie le texte sans les balises déclare si la sortie est XML ou plate sérialise un sous-arbre appelle des règles

49 Application Comprendre la structure d'un document XML existant Observer des exemples dans le document XML Si le document est complexe, utiliser XSLT pour l'interroger Autre méthode possible Étudier une grammaire du document XML (DTD ou schéma XML)

50 Exemple : toutes les entrées du catalogue ont-elles un prix ? (1/2) On extrait les plantes qui n'ont pas de champ PRICE [PRICE] : sélectionne les noeuds contexte pour lesquels l'expression relative PRICE n'est pas vide [not(PRICE)] : négation

51 Exemple : toutes les entrées du catalogue ont-elles un prix ? (2/2) Résultat est vide, donc toutes les plantes ont un prix Conversion d'un ensemble de noeuds en booléen Si l'ensemble est vide, faux, sinon vrai

52 Variante 1 : compter On compte les plantes qui n'ont pas de champ PRICE Résultat : un fichier qui contient le texte "0"

53 Variante 2 : envoyer un message Pour un résultat aussi court, au lieu d'écrire dans un fichier, on peut envoyer un message sur le terminal Résultat : le message "0" apparaît sur le terminal

54 Expressions booléennes Xpath Toutes les plantes du catalogue ont-elles les 6 mêmes champs que la première ? Opérateurs booléens en Xpath : and, or, not()

55 Toutes les entrées ont-elles 6 champs ? Toutes les plantes du catalogue ont-elles les 6 mêmes champs que la première ? * : expression Xpath relative qui trouve les éléments fils

56 Les champs ont-ils des éléments fils ? * : expression Xpath relative qui trouve les éléments fils Prédicat qui trouve si un noeud n'est pas une feuille de l'arbre des éléments : [*] Prédicat qui trouve si un noeud est une feuille : [not(*)]

57 Combien y a-t-il d'entrées ? Résultat : 36 Tous les noeuds PLANT sont-ils au même niveau ? Résultat : 36 aussi donc oui

58 La racine (1/3) On refait l'expérience avec une expression Xpath relative : Résultat : 0 ! En fait le noeud courant n'était pas CATALOG

59 La racine (2/3) À la racine de l'arbre il y a deux noeuds distincts - le noeud racine, qui n'est pas un élément -l'élément racine, qui est fils du noeud racine Quand on entre dans la règle, le noeud courant est le noeud racine (/) Les noeuds PLANT ne sont donc pas fils du noeud courant CATALOG PLANT...

60 La racine (3/3) Résultat : 36 CATALOG PLANT...

61 On change de document source file://localhost/C:/My%20Music/ B2BF2C09D305D49C 37 American Beauty - Theme Air american beauty soundtrack MPEG audio file

62 Tous les éléments sont-ils fils d'un élément ? local-name() et name() : fonctions Xpath qui trouvent le nom du noeud contexte ou du noeud passé en argument Réponse : 0, donc : oui, ils sont tous fils d'un Tracks La différence entre local-name() et name() concerne les espaces de noms

63 Les champs d'un ont-ils tous du texte ? text() : expression Xpath qui trouve un noeud texte fils du noeud contexte Réponse : 0, donc : oui, ils ont tous du texte Les noeuds en XML sont typés : éléments, texte, racine...

64 Par curiosité Taille moyenne d'une piste Résultat : E6 sum() transforme son argument en ensemble de nombres et calcule la somme div : division idiv : division entièremod : reste

65 Attributs (1/3) [Documentaire] A documentary about the amazing life of Leon Theremin, inventor of the theremin, the electronic musical instrument so beloved of 50s sci-fi movie music. Theremin amazed America with his instrument until his kidnapping by Soviet agents in the mid-30s. Upon his release from a labor camp, he worked on surveillance devices for the KGB. Almost 60 years later, he is brought back to America for a touching reunion with his friends and colleagues.

66 Attributs (2/3) Extraire les éléments qui ont un attribut pdf L'expression est convertie du type ensemble de noeuds au type booléen : si vide alors faux, sinon vrai Les attributs sont des noeuds de l'arbre XML L'expression Xpath trouve les éléments, et non les attributs pdf

67 Attributs (3/3) Extraire les éléments dont l'attribut auteur n'est pas Herself L'expression est convertie en chaîne de caractères Le document résultat n'est pas indenté


Télécharger ppt "Introduction à XSLT Éric Laporte Institut Gaspard-Monge Université Paris-Est Marne-la-Vallée."

Présentations similaires


Annonces Google