Isabelle Kervella - Mastère ISIC1 Méta-calendrier automatique pour portail www Projet d’ingénierie Mars 2002.

Slides:



Advertisements
Présentations similaires
Données structurées et XML
Advertisements

Automatisation des processus dans IIJCan par François HARVEY (Programmeur-analyste)
Xavier Blanc Web Services Xavier Blanc
DTD Sylvain Salvati
Conception de Site Webs Interactifs Cours 4
Première expérience d’utilisation des Web Services dans SmartTools Didier Parigot Projet OASIS INRIA Sophia www-sop.inria.fr/oasis/SmartTools Journée.
Chercher pour trouver Nous quittons l'ère où on courait après l'information pour entrer dans celle où l'information nous court après"Nous quittons l'ère.
Données structurées et XML
Les technologies XML Cours 3 : Les APIS XML Janvier Version 1.0 -
Nicolas Singer Maître de conférence, université Champollion
version Beta Marie Calberg Ninni Louhelainen SLFN7
Présentation des frameworks pour Java EE
Adamou Mahamane Sidi Maman Bachir
PROJET HANDICAPS Certificat de Qualification Professionnelle
2006/2007Denis Cabasson – Programmation Web Cours de programmation web ENSAE
Gaselys Trading Confirmation
XML-Family Web Services Description Language W.S.D.L.
UNIVERSITE CHOUAIB DOUKKALI Département des mathématiques
pour les applications Web :
Présentation Struts1-JaxB
Introduction à DOM Maroua Bouzid
Développement Rapide dApplications Web avec.NET « Mon premier site »
Interaction audio sur le site web du LIA
Web Structurel
1 Exercice : longueur d’un mot est-elle paire ?  Test fonctionnel  Quel ensemble de valeur choisir / spécification  Test structurel  Soit le code d’un.
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Intégration ActiveXML - Xyleme
Création d'un projet Web avec Netbeans
Informatique Décisionnel
Netscape Présentation par : Aleksandra Krul et Aurélia Marcus Jeudi 31/
Projet de Master première année 2007 / 2008
Vers une génération automatique du mapping de sources biomédicales
XML Plan du cours Introduction au fichier XML
Les feuilles de style CSS
TracenPoche Insérer une figure TepWeb >.  Contenu de l'archive tepweb.zip Contenu de l'archive tepweb.zip  Quelques notions de html Quelques notions.
-Présentation de l’équipe -Cadre du projet -Enjeux -Choix du sujet.
8 - XML Cours XML.
Module I-C3 : Applications Web IUT R&T 2e année
Paradigmes des Langages de Programmation
Evaluation au baccalauréat
Content Management System CMS. Pourquoi ? Obligation de ressaisir des contenus publiés à plusieurs endroits Pas d’outils de gestion de qualité de l’information.
Créer son site web Chapitre II. Les caractères spéciaux Les navigateurs ne reconnaissent pas les caractères spéciaux. Heureusement chaque caractère possède.
Contenus riches et logique d'industrialisation Contenus riches et logique d'industrialisation Modélisation, production, génération, gestion Stéphane Crozat.
LE HTML ISN Terminale S Un peu d’histoire …
Présentation du produit
Initiation à Python et à Latex
Le langage XML.
ENGIMA.
09/11/2006 CMS Content Management System Système de Gestion de Contenu.
Cours de programmation web
XML Stylesheet Language
 Objet window, la fenêtre du navigateur
Programmation Web : Introduction à XML
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
 Syntaxe du langage PHP
MJ. Blin et M. CsernelPoleInfo31 XML et ses environnements Documents XML bien formés Prologue Arbre d'éléments Attributs Commentaires Entités internes.
Campus-Booster ID : **XXXXX Copyright © SUPINFO. All rights reserved Le développement Web.
© WYNIWYG / Communication, reproduction interdite sauf autorisation.
Struts.
 Formulaires HTML : traiter les entrées utilisateur
Initiation au JavaScript
Module : Langage XML (21h)
Programmation Web : DOM en PHP Jérôme CUTRONA 11:06:45 Programmation Web
eXtensible Markup Language. Généralités sur le XML.
TER LOGO Model a copier coller a chaque nouvelle diapositive.
Système de surveillance de réseau
L T I Laboratoire de Téléinformatique 2 Projet de semestre Parseur XML basé sur la DTD : Buts –Utiliser la grammaire définissant un type de fichiers XML.
Introduction à SVG Scalable Vector Graphic. Informations ● Plus d'informations ici (draft, tutoriaux, outils... ): –
SOAP et les RPC XML SOAP WSDL RPC. Rappels sur le XML Langage avec des balises Très lisible Pour stocker des données Séparation entre contenu et présentation.
Dreamweaver CS4 séance 1 Ahmed Aryan – Isma Teir.
Transcription de la présentation:

Isabelle Kervella - Mastère ISIC1 Méta-calendrier automatique pour portail www Projet d’ingénierie Mars 2002

Isabelle Kervella - Mastère ISIC2 Plan  Situons le contexte...  Compréhension du besoin  Analyse fonctionnelle  Solutions techniques proposées

Isabelle Kervella - Mastère ISIC3 Situons le contexte...

Isabelle Kervella - Mastère ISIC4 Compréhension du besoin Ce projet couvre plusieurs aspects : 4 l’extraction des données 4 le stockage des données 4 le nettoyage des données 4 la représentation visuelle des données 4 le paramétrage de la collecte / l’administration

Isabelle Kervella - Mastère ISIC5 Analyse fonctionnelle

Isabelle Kervella - Mastère ISIC6 Solutions techniques retenues Le format HTML est adapté : à la présentation de documents à la navigation entre les pages publiées sur le web cependant… il n’offre pas : une présentation structurée des données BILAN : les informations au format HTML sont difficiles à capturer par des parsers grammaticaux ordinaires  La solution proposée : le WRAPPING

Isabelle Kervella - Mastère ISIC7 Solutions techniques retenues Choix du Wrapper : Araneus il combine les avantages : d’une approche déclarative, basée sur une grammaire, et la flexibilité d’une programmation procédurale  cette particularité lui permet de traiter efficacement les hétérogénéités et les exceptions.  Il permettra de recueillir les données dans un fichier XML.

Isabelle Kervella - Mastère ISIC8 Solutions techniques retenues Présentation de l’outil par l’exemple Format HTMLFormat XML

Isabelle Kervella - Mastère ISIC9 Solutions techniques retenues Écriture de la grammaire (fichier nf) HTML : Fest-deiz Grammaire nf : $TypeEvt { out.print(" XML : <Evenement Type="Fest-deiz" En complément, consulter le tutorial fourni avec la documentation d’Araneus !

Isabelle Kervella - Mastère ISIC10 Solutions techniques retenues Extraction des données : les principales commandes calendrier.nf java mwg trads\NFFiles\calendrier.nf calendrier.java Wrapper calendrier.java calendrier.xml java calendrier S trads\html\capture.htm > calendrier.xml Cette commande produit dans le répertoire courant un wrapper appelé calendrier.java à partir des spécifications décrites dans le fichier calendrier.nf Cette commande wrappe le document source (fichier stocké localement ou URL), extrait les données et retourne le résultat dans un fichier XML.

Isabelle Kervella - Mastère ISIC11 Solutions techniques retenues Le wrapper génère en sortie un fichier xml, structuré, qui ne mélange pas l’information et la mise en forme du document. La séparation du contenu et de la forme permet d’extraire facilement les informations du document par un simple parsing.

Isabelle Kervella - Mastère ISIC12 Solutions techniques retenues Le parsing Le parseur, utilisé pour réaliser le parsing, est un programme capable de récupérer des informations contenues dans un fichier structuré, tel que XML. Principe : –on donne l’appellation de la balise –on obtient en retour la valeur comprise entre cette balise ouvrante et sa jumelle fermante Les APIs jouent le rôle d’interface et permettent d’accéder facilement aux données contenues dans le document XML.

Isabelle Kervella - Mastère ISIC13 Solutions techniques retenues Le parsing

Isabelle Kervella - Mastère ISIC14 Solutions techniques retenues Le parsing : développement d’un parseur en Java Le parseur développé utilise les APIs JAXP et DOM. La première partie du programme utilise l’API JAXP (Java API for XML Parsing) pour construire un arbre d’objets DOM. La seconde partie du programme permet de parcourir, nœud par nœud, l’arbre d’objets, afin de parser l’ensemble du fichier XML.

Isabelle Kervella - Mastère ISIC15 Conclusion Une solution au problème d’extraction... L’emploi : d’un wrappeur pour traduire un document non structuré dans un format XML, d’un parseur pour extraire l’information, constitue une solution à ce problème.  Ce projet couvre plusieurs aspects. Seule la première partie a été abordée. La suite du travail... Concernant le stockage des données, deux solutions simples peuvent être envisagées : - la base de données XML - la base de données MySQL