Télécharger la présentation
1
Introduction et Concepts : De SGML @ XML
1. Origines et Objectifs 2. SGML et HTML 3. Introduction à XML 4. XML pour quoi faire ?
2
1. Origine et objectifs Un document peut se définir par le fond et par la forme. Forme = structure + présentation Fond = structure + sémantique Multiples approches dont les plus connues sont : SGML pour la structuration HTML pour la présentation Certaines approches mélangent le fond et la forme ! Origines
3
Présentation et Structuration
Titre Auteur Section Paragraphe XML: Des BD aux Services Web Georges Gardarin 1. Introduction Ces dernières années ont vu l'ouverture des systèmes d'information à l'Internet. Alors que depuis les années 1970, ces systèmes se développaient souvent par applications plus ou moins autonomes, le choc Internet … Ainsi, on a vu apparaître une myriade de technologies nouvelles attrayantes mais peu structurantes voir perturbantes. Certaines n'ont guère survécues. D'autres ont laissé des systèmes peu fiables et peu sécurisés. … L'urbanisation passe avant tout par la standardisation des échanges : il faut s'appuyer sur des standards ouverts, solides, lisibles, sécurisés, capable d'assurer l'interopérabilité avec l'Internet et les systèmes d'information. XML, "langua franca" … 2. La société ProXML Origines
4
Vue Balisée Les tags peuvent porter plus ou moins de sémantique
<Livre> <Titre> XML : Des BD aux Services Web</Titre> <Auteur>Georges Gardarin</Auteur> <Section titre = "Introduction"> <Paragraphe>Ces dernières années ont vu l'ouverture des systèmes d'information à l'Internet. Alors que depuis les années 1970, ces systèmes se développaient souvent par applications plus ou moins autonomes, le choc Internet … </Paragraphe> <Paragraphe>Ainsi, on a vu apparaître une myriade de technologies nouvelles attrayantes mais peu structurantes voir perturbantes. Certaines n'ont guère survécues. D'autres ont laissé des systèmes peu fiables et peu sécurisés. …</Paragraphe> <Paragraphe>L'urbanisation passe avant tout par la standardisation des échanges : il faut s'appuyer sur des standards ouverts, solides, lisibles, sécurisés, capable d'assurer l'interopérabilité avec l'Internet et les systèmes d'information. XML, "langua franca" … </Paragraphe> </Section> <Section titre= "La Société ProXML"> … </Livre> Les tags peuvent porter plus ou moins de sémantique Origines
5
Tag ou Balise ou Label Marque de début et fin permettant d'identifier un élément d'un texte Les balises sont de la forme classique <balise>valeur ou bloc</balise> Les balises peuvent être imbriquées <personne> <adresse> <rue>A. Briand</rue> <ville>Paris</ville> </adresse> </personne> Les langages à balises sont idéaux pour organiser une information semi-structuré Un objet balisé s’auto-décrit Eléments de données Origines
6
World Wide Web Consortium
W3C - Fondé en 1994 Consortium industriel international accueilli par différents sites MIT/LCS aux Etats-Unis INRIA en Europe Keio University au Japon 448 membres industriels en septembre 2000 MIT Massachussetts Institute of Technology LCS Laboratory for Computer Science INRIA Institut National de la Recherche en Informatique et Automatique ensemble de sociétés et d’organisation telle que : Microsoft , IBM, Intel, Bull, Netscape et bien d’autres Origines
7
W3C : dans quel but ? Accroître le potentiel du Web
Développer des protocoles communs Assurer l’inter-opérabilité sur le Web entre les différents systèmes Stock d’informations sur les standards et les normes pour développeurs et utilisateurs Code référence pour présenter et promouvoir les différents standards Prototypes variés et exemples d’applications Origines
8
Les différents documents émis
Note: proposition par un organisme ou un groupe Working draft: Résultat du travail d ’un groupe Proposed recommendation Concensus du working group soumis pour vote Recommendation Standard accepte par un vote positif Origines
9
XML : objectifs XML= un nouveau langage d'échange basé sur le balisage
XML= plus simple que SGML XML= plus complexe et performant que HTML XML = développé par XML Working Group dirigé par le W3C (depuis 1996) XML 1.0 = recommandation officielle du W3C depuis le 10 février 1998 Origines
10
les 10 objectifs de conception:
XML doit pouvoir être utilisé sans difficulté sur Internet XML doit soutenir une grande variété d'applications XML doit être compatible avec SGMLet HTML Il doit être facile d'écrire des programmes traitant les documents XML Le nombre d'options dans XML doit être réduit au minimum, idéalement à aucune Origines
11
les 10 objectifs de conception
Les documents XML doivent être lisibles par l'homme et raisonnablement clairs La spécification de XML doit être disponible rapidement La conception de XML doit être formelle et concise Il doit être facile de créer des documents XML La concision dans le balisage de XML est peu importante Origines
12
Forces de XML Séparation de la structure et de la présentation
Moins confus que HTML Plus simple que SGML Idéal pour l'échange de données semi-structurées Utilisable entre machines Questions ? Origines
13
2. SGML et HTML 1969 C. Goldfarb, E. Mosher, R. Lorie inventent GML chez IBM GML a été créé pour éditer des documents, les mettre en page et les partager au sein de systèmes de gestion éditoriaux 1978 Goldfarb prend la tête d’un comité « Computer Language for the Processing of Text » au sein de l’American National Standards Institute (ANSI). SGML
14
Qu'est-ce que SGML ? Une norme internationale :
Standard Generalized Markup Language ISO Un métalangage de balisage de documents lisible par l’être humain et traitable par une machine permet de définir des langages de balisage Les documents sont balisés conformément à la grammaire (la DTD) instances de DTD permet un balisage sémantique du fond. Implique la notion de validité d'un document SGML
15
SGML : objectifs Séparation du fond et de la forme
possibilité de multiples présentations un seul document en SGML plusieurs formats : Postcript, HTML, etc. Support de traitements sur le contenu des documents sans prise en compte de la forme Proposition d’un cadre défini pour l’expression des modèles documentaires (validité, contrôle) Intégration d'un format de stockage et d’échange normalisé SGML
16
SGML : critiques Très lourd et complexe pour la mise en œuvre de documents respectant ce format Une grande rigueur est demandée à l'entrée des documents Standard complexe et complet pour le traitement des documents Liens hypertextes possibles mais complexes SGML
17
HTML : présentation Proposé par le W3C comme format de documents sur le Web. Langage simple avec des balises standardisées permettant la mise en forme d’un texte. Standard reconnu par tous les navigateurs. Langage très populaire sur le Web <HTML> <HEAD> <TITLE> Exemple </TITLE> </HEAD> <BODY> <H1>Contenu du document</H1> <A HREF = " /dir/test.html"> une référence externe </A> </BODY> </HTML> HTML
18
HTML : inconvénients Normalisation des différentes balises difficile :
les constructeurs ont eu tendance à définir leurs propres balises pour répondre à leurs besoins (incompatibilité) HTML 4.0 boutons, tables, applets, objects, graphiques, maths, ... styles, frames, protections, ... Mises à jour difficiles : Données utiles et mises en forme ; restructuration ou remise en forme de l’ensemble des pages du site fastidieux. Mélange le fond et la forme méta-données avec la présentation Pages conçues pour 1 type de terminal HTML
19
Feuilles de style Introduite pour diversifier les présentations
CSS (Cascading Style Sheet) mécanisme d'héritage entre nœuds une balise hérite de la parente seulement ce qu'elle spécifie est redéfini Recommandation W3C en décembre 1996 Mécanisme simple pour ajouter un style aux documents Web fonte, taille, couleur, etc. Utilisables avec XML HTML
20
Exemple de CSS <LINK REL="stylesheet" HREF="fichier.css">
[ ... ] TD, TH { font-family: "Helvetica", sans-serif line-height: 1.35 ; } H1, H2 { margin-top: 1.2em ; margin-left: -7% ; color: #900 ; clear: both ; @import "truc.css" BODY { color: #000 ; background: #FBFBFF ; margin-left: 9% ; margin-right: 6% ; font-family: "Helvetica", sans-serif ; line-height: 1.35 ; } HTML
21
SGML et HTML : Résumé SGML HTML Questions ?
langage de la GED très complexe HTML instance de SGML adapté à la présentation inadapté à l'échange entre programmes Questions ? HTML
22
3. Introduction à XML XML est un méta-langage universel pour les données sur le Web qui permet au développeur de délivrer du contenu depuis les applications à d'autres applications ou aux browsers XML promet de standardise la manière dont l'information est : Échangée (XML) Personnalisée (XSL) Retrouvée (XQuery) Sécurisée (Encryption, Signature) Liée (XLink) ... XML
23
XML : la base SGML XML HTML XHTML
Document bien formé: <Vin> <Cru>Volnay</Cru> <Region> <Nom>Bourgogne</Nom> <Capitale>Dijon</Capitale> </Region> <Millesime>1995</Millesime> <Millesime>1996</Millesime> <Prix Unite = "Euro"> 10.5 </Prix> </Vin> SGML XML HTML XHTML Les utilisateurs peuvent définir leurs propres tags Il est possible d'imposer une grammaire spécifique (DTD, Schéma) Les tags indiquent la signification des sections marquées XML
24
Concepts de base Balise (ou tag ou label) Elément de données Attribut
Marque de début et fin permettant de repérer un élément textuel Forme: <balise> de début, </balise> de fin Elément de données Texte encadré par une balise de début et une de fin Les éléments de données peuvent être imbriquées <producteur> <adresse> <rue>A. Briand</rue> <ville>Dijon</ville> </adresse> </producteur> Attribut Doublet nom="valeur" qualifiant une balise <producteur no="160017" region="Bourgogne"> XML
25
Structure hiérarchique+liens
Type Français Catégorie *** Nom Le Moulin de Mougin Restaurant Manager Dupuis No 7 Adresse Des Vignes Rue Ville Mougin XML
26
Présentation par défaut
XML
27
Présentation externe <Prix>6.05</Prix> XML
28
Espaces de noms Comment mixer des tags issus de différentes nomenclatures ? Mécanisme intéressant pour l'intégration de contenus Taxonomie = balise <t xmlns:Gui=" xmlns:Ann=" <Gui:Adresse><ville>Mougins</ville><zip>06212</zip></Gui:Adresse> <Ann:Adresse>Le Moulin 06 Mougins</Ann:Adresse> XML
29
La galaxie de standards
XSchema Schémas de documents XSL Feuilles de styles SAX API de programmation événementielle DOM API de programmation objet SOAP Protocole Web Services RDF Description de ressources Web ebXML Standards de e-Commerce Xxx Standards par métiers … ebXML DOM XSchema XML RDF SAX XSL SOAP Xxx XQuery XML
30
4. Pourquoi XML? Définir vos propres langages d’échange
Commande, facture, bordereau de livraison, etc. Modéliser des données et des messages Document Type Definitions (DTD) Types et éléments agrégés (XML Schema) Passerelle avec Unified Modelling Language (UML) Publier des informations neutre du point de vue format mise en forme avec des feuilles de style Archiver des données auto-description des archives Pourquoi XML ?
31
Lingua Franca du 21e siècle
Un standard d'échange Lisible : texte balisé avec marquage Clair : séparation du fond et de la forme Extensible : supporte les évolutions applicatives Sécurisé : pare-feu, encryption, signature Développé par le W3C Pour le Web (Internet, Intranet) S'étend à l'entreprise et ses partenaires Supporté par les grands constructeurs IBM, Microsoft .net, SUN, BEA, etc. Des outils génériques et ouverts Pourquoi XML ?
32
Pour données et documents
Approche « Donnée » Structuration forte et simple Compatibilité SGBDR existants Mise à jour en place Intégrité sémantique Indexation exacte Adapté au transactionnel et décisionnel Performances attendues « moyenne » à « forte » pour une volumétrie « moyenne » Approche « Document » Structuration faible et complexe Systèmes documentaires spécialisés Gestion de versions Recherche textuelle Indexation approchée Accès type moteur de recherche Performances attendues « moyenne » pour une volumétrie « forte » Pourquoi XML ?
33
Publication multi-supports
Middleware XMLizer XML Application de publication (XSL) Avantages: Réutilisation dans différents contextes (terminaux, doc, DAB) Mises à jour en base facilitées Base de Données TV Numérique Projet GIE Cartes Bancaires: publication des spécifications de protocoles pour réseau Carte Bancaires vers les fournisseurs et prestataires du GIE Pourquoi XML ?
34
Échange de données Mapper Extractor ETL Datawarehouse BD relationnelle
JDBC JDBC ETL Avantages : Flexibilité et réactivité en termes de mise à jour des schémas Compatibilité du datawarehouse avec les outils de datamining SQL existants BD relationnelle Datawarehouse Datamining Projet MEN : Echange de données avec les académies (remontée et descente) Pourquoi XML ?
35
Gestion documents semistructurés
Amendement Serveur d’Applications HTTP GET Requêtes Requêtes HTTP POST Mapping XML-SQL SGBDR Feuille de style XSL Processeur XSL Feuille de style XSL Feuille de style XSL HTML généré Avantages: Saisie en base normalisée Diffusion multi-supports Recherche plein texte puissante Projet AMELI : Une application de serveur XML pour la saisie et la consultation de documents semi-structurés par internet/intranet Interface avec les applications bureautiques Pourquoi XML ?
36
Échange B2B XML EDI Internet XML EDI Donneur d’ordre Fournisseur
XMLizer Utilisation de XML (en remplacement d’EDI) pour 2 raisons : Coût des RVA (Réseaux à Valeur Ajoutée type AS400) Difficultés d’évolution des formats de messages, quelque peu figé Les messages sont extraits depuis le SI du donneur d’ordre, mais aussi intégrés dans le cas de réponses. Un composant « XML EDI » pilote les échanges en les traçant dans une base XML (Repository XML). Les messages transitent sur Internet et peuvent être visualisés directement sur le site du fournisseur à l’aide d’un simple navigateur.Ils peuvent aussi être intégrés au SI du fournisseur. A partir de ce schéma simple qui permet déjà de journaliser et visualiser les messages échangés, des schémas plus complexes peuvent être élaborés. Donneur d’ordre Internet (SOAP) Fournisseur Projet EDIXML : Expérimentation de la chaîne pour un grand donneur d'ordres Pourquoi XML ?
37
Forces et faiblesses de XML
Une technologie structurante Clarifie tous les échanges Des standards internes et externes Transversale à l'entreprise Échanges de données Bureautique GED Sites Web EDI Bases de données Intégration e-business … Une syntaxe bavarde Un méta-langage, mais de nombreux langages Coûteux en CPU Parsing Coûteux en mémoire Instanciation Un choix stratégique de direction Pourquoi XML ?
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.