Antoine.Rizk: Le langage XML : fonctionnalités et standards associés Antoine Rizk EUROCLID
Antoine.Rizk: La problèmatique n Création de linformation : 20% du PNB n 90% de linformation sont des documents n Traitement de texte et PAO traditionnels -30% du temps sur le formattage -30% du temps sur la recherche dinformations n La technologie change tous les 18 mois n US : nombre de documents produits/an = 92 Mds
Antoine.Rizk: Les solutions XML HTML SGML GM Internet WWW
Antoine.Rizk: XML : Avantages n Productivité n Réutilisabilité n Perrenité n Integrité n Partage n Portabilité
Antoine.Rizk: XML demain A partir du deuxième semestre de lan 2000 : n le volume des données XML sera plus important que celui des données HTML. - Gartner Group n 47% des entreprises utiliseront XML n 47% des entreprises utiliseront Linux n 90% des entreprises utiliseront Java - Java Web Panel survey, IBM 12/98
Antoine.Rizk: Introduction à XML Premier exemple Antoine Rizk
Antoine.Rizk: Documents bien formés A chaque balise ouvrante doit correspondre une balise fermante Balisage spécifique pour les éléments vides Les balises doivent simbriquer correctement Une racine doit exister Un élément ne peut avoir des attributs vides incorrecte correcte
Antoine.Rizk: Documents valides Un document valide doit être bien formé ET se conformer à une grammaire (DTD)
Antoine.Rizk: La DTD n n Document Type Definition - -Structure générique logique - -Grammaire de la structure du document n n Etablit les règles de structure de documents n n Définit les noms d'éléments n n Définit les relations entre éléments n n Déclare les attributs ainsi que leurs types Document parser validant DTD erreurs sortie
Antoine.Rizk: Les parsers n Modèle événementiel (SAX) -Callback appelé pour chaque événement : -début balise, attribut, fin document etc.. n Peut être efficace sur les gros documents -Larbre nest jamais construit entièrement en mémoire
Antoine.Rizk: Les parsers (API DOM) n Un modèle darbre est construit en mémoire (arbres abstraits) n Lapplication accède par API à larbre pour le manipuler n API DOM est normalisée (recommandation W3C)
Antoine.Rizk: Limites dune DTD n Un langage différent de celui des instances n Limité à la structure darbre, différent du modèle R n Pas de typage de contenu n Pas dhéritage => possibilité dutiliser des schémas : XML-Schema
Antoine.Rizk: Données/documents deptposte labo compta postenom Rizk Courtaud 322 Parigot456 labo Rizk Courtaud LABO 322 RIZK,Courtaud
Antoine.Rizk: Données ou documents ? ceci est un fragment d'un livre cette note contient deux paragraphes un autre paragraphe 123 G.Dupont J.Smith
Antoine.Rizk: Traitement XML/XSL n Parsing et traitement applicatif -import dans un SGBD n Regénération : export dun SGBD n Fusion de données, génération darbre, transformation -XSL n Présentation -CSS, XSL
Antoine.Rizk: XSL XSL Transformer Sortie (x) FO Interpreter (x) FO Interpreter (y) Sortie (y) FO Interpreter (z) Sortie (z) Feuille de style XSL Source XML W3C XSL Résultat FO décembre, 1997 décembre, 1997 décembre, {\c6\f12\i décembre, 1997\par}
Antoine.Rizk: Portail/ Serveur dintermédiation Internet/Intranet Terminal XML Terminal HTML Terminal WAP XSL XML + XSL SGBDR SGBDO Fichiers XMLXML
Antoine.Rizk: XML+XSL SGBD-R labo compta SGBD-O Rizk Israel 322 Parigot456 labo Rizk Israel Données XML Plus feuilles XSL Internet/Intranet Terminal XML Terminal HTML Terminal HTML/XML
Antoine.Rizk: XML + XSL generic architecture XSL Browser HTML/XML: graphics rendering under CSS / XSL fo control Net + HTTP server(s)Middle-tier server XML OO XML Repository R-DBMS XML+HTMLXML R- DBMS GXMLGXML SQL Query handling Server-side XSL transform XQL Client-side XSL transform Client-side prog. -> DOM
Antoine.Rizk: Ex. 2 : ré-ingénierie de données R-DBMS-1DBMS-2(IR)DBMS-3 XML XML statique Processeur XSLT Feuille XSLT XML données fusionnées Script python DB-RESULTAT DB2XML Impression catalogue Transformations (scripts)
Antoine.Rizk:
Antoine.Rizk: Les limites n XML reste au niveau syntaxique n Pas de typage n Pas de sémantique n Pas de relations/rôles entre concepts n => n Les liens hypertextes : XLL (Xlink+Xpath) n Les métadonnées : RDF spec et RDF schema n Les schémas typés : XML-Schema n Les topic maps
Antoine.Rizk: Liens simples Document B Document A Link element Link resource
Antoine.Rizk: XpathXpath Document B Document A
Antoine.Rizk: Liens étendus Document B Link elements Document A
Antoine.Rizk: Liens étendus out of line Link elements Document C Document B Document A
Antoine.Rizk: Topic maps
Antoine.Rizk: Lenjeu n Définir une ontologie par domaine n Organiser les schémas de navigation n DTD + concepts + roles + sémantique = ontologie n ontologie + thesaurus = RDF schema n RDF schema => RDF specifications => métadonnées n Augmenter le taux de précision n Diminuer le taux de rappel
Antoine.Rizk: Lévolution documentaire ASCII, JPEG, MPEG... XML,XSL XQL,XLL, SMIL... Formats monomédia Structure syntaxique Structure sémantique RDF Ontologie, Thesaurus Intermédiation Production Publication
Antoine.Rizk: Létat actuel n n XML : recommandation 10 fév 1998 n n DOM : DOM1 (1er oct 1998), DOM2 (Candidate 10 mai 00), DOM3.. n n Xlink, Xpointer : WD n n SVG : WD V8 n n SMIL : WD V3 n n XSLT + Xpath : recommandation 16 nov 1999 n n XSL : WD final n n MathML : V1 (recommandation Avr 1998), V1.1 (Juil. 99), V2 (WD) n n XML Schema, XMLQuery n n RDF : Model&syntax (recommandation fév 1999),schema spec (candidate Mars 2000) n n XHTML n n Xforms : WD 1
Antoine.Rizk: Autres applications (1) n Channel Definition Format, CDF (Based on XML) n Web Collections using XML n Meta Content Framework Using XML (MCF) n XML-Data n ANZLIC - Metadata n XML Metadata Interchange Format (XMI) - OMG n Educom Instructional Management Systems Project (IMS) n Structured Graph Format (SGF) n Legal XML Working Group n Web Standards Project (WSP) n Open Software Description Format (OSD) n XLF (Extensible Log Format) Initiative n WAP Wireless Markup Language Specification n HTTP Distribution and Replication Protocol (DRP) n Chemical Markup Language n Bioinformatic Sequence Markup Language (BSML) n Virtual Hyperglossary (VHG) n Weather Observation Definition Format (OMF) n vCard Electronic Business Card n Open Financial Exchange n Open Trading Protocol (OTP) n Signed Document Markup Language (SDML) n Bank Internet Payment System (BIPS) n OpenMLS - Real Estate DTD Design n Customer Support Consortium n XML for the Automotive Industry - SAE J2008 n X-ACT - XML Active Content Technologies Council n OpenTag Markup n CDIF XML-Based Transfer Format n Precision Graphics Markup Language (PGML) n Vector Markup Language (VML) n WebBroker: Distributed Object Communication on the Web n Web Interface Definition Language (WIDL) n XML/EDI - Electronic Data Interchange n XML/EDI Repository Working Group n DISA, ANSI ASC X12/XML n Information and Content Exchange (ICE) n CommerceNet Industry Initiative
Antoine.Rizk: Autres application (2) n LACITO Projet Archivage de données linguistiques n Astronomical Markup Language n GedML: [GEDCOM] Genealogical Data in XML n Newspaper Association of America (NAA) - Classified Ads Format n Notes Flat File Format (NFF) n Java Help API n Cold Fusion Markup Language (CFML) n Document Content Description for XML (DCD) n XSchema n WEBDAV n Tutorial Markup Language (TML) n Java Speech Markup Language (JSML) n XML and VRML (Virtual Reality Modeling Language) n XML for Workflow Management [NIST] n SWAP - Simple Workflow Access Protocol n Theological Markup Language (ThML) n XML-F ('XML for FAX') n Extensible Forms Description Language (XFDL) n Broadcast Hypertext Markup Language (BHTML) n IEEE LTSC XML Ad Hoc Group n Open Settlement Protocol (OSP) - ETSI/TIPHON n WDDX - Web Distributed Data Exchange n Common Business Library (CBL) n Open Applications Group - OAGIS 6 n Schema for Object-oriented XML (SOX) n VoxML Markup Language n Telecommunications Interchange Markup (TIM, TCIF/IPI) n Encoded Archival Description (EAD) n UML eXchange Format (UXF) n Translation Memory eXchange (TMX) n Scripting News in XML n InterX.org Initiative n NuDoc Technology n Coins: Tightly Coupled JavaBeans and XML Elements n DMTF Common Information Model (CIM) n Process Interchange Format XML (PIF-XML) n Ontology and Conceptual Knowledge Markup Languages
Antoine.Rizk: Pour aller plus loin..